在基帶處理中使用串行RapidIO協(xié)議進行DSP互連
摘 要:本文分析了傳統(tǒng)的多個DSP 的各種互聯(lián)的方法,提出將串行RapidIO 協(xié)議,這種基于開關(guān)的、點對點的互連方法作為基帶數(shù)據(jù)處理中的互連方案,可以減少成本,并且提供高帶寬下低延時的雙向通信。然后結(jié)合基站基帶處理,這種方案具有很大的靈活性,最后總結(jié)了使用這種互連方案的好處。
目前,在通信系統(tǒng)中,比如在 VoIP 網(wǎng)關(guān)和無線基站的系統(tǒng)中,語音和數(shù)據(jù)都在急劇增加,系統(tǒng)的處理能力也要極大地增加,因此單個DSP 已經(jīng)不能滿足越來越多的需求,需要把多個DSP 互聯(lián)成DSP 簇來增加對更多數(shù)據(jù)的更快處理能力。DSP 的互連有很多種,不同的應(yīng)用場合可以使用不同的DSP 互聯(lián)。比如基于總線的多DSP 結(jié)構(gòu)復(fù)雜,而且因為共享總線造成總線帶寬,降低系統(tǒng)整體的效率,總線瓶頸的限制將凸顯出來;通過HPI 接口-可以提供DSP 之間的互聯(lián),但是數(shù)據(jù)傳輸速率有限,數(shù)據(jù)傳輸有時會成為系統(tǒng)處理能力提高的瓶頸,造成系統(tǒng)整體效率的降低;多通道緩沖串口MCBSP-數(shù)據(jù)傳輸帶寬有限,他們都不適合多DSP 之間的高速數(shù)據(jù)傳輸。DSP 簇需要通過一種特殊的方式互聯(lián),以支持更高的帶寬,同時進行低延時的雙線通信??梢酝ㄟ^專用的互聯(lián)芯片來實現(xiàn)多DSP 互聯(lián)方案,這樣,連接上不會復(fù)雜,而且具有靈活性和高速傳輸?shù)奶攸c。在無線基站中,如果利用RapidIO協(xié)議進行DSP 互連則可以大大提高運算效率。而且目前芯片的廠家已經(jīng)生產(chǎn)出支持串行RapidIO 接口的芯片,使得DSP 之間高速互聯(lián)成成為可能。
1. 系統(tǒng)介紹
1.1 串行RapidIO
RapidIO 商業(yè)聯(lián)盟組織2001 年提出了針對多處理器互連的RapidIO 協(xié)議。RapidIO 協(xié)議是一個點對點的包交換協(xié)議, 有物理層、運輸層和邏輯層3 層結(jié)構(gòu)。邏輯層為RapidIO 節(jié)點的交易, 定義了所有的包格式:運輸層為RapidIO 數(shù)據(jù)包提供了路由和尋址的功能;物理層提供了設(shè)備接口的電氣特性說明此外, 協(xié)議還提供了流量控制、差錯控制等功能。對于采用較少連線的長距離傳輸以及背板傳輸,由于RapidIO 物理層采用Lvds 傳輸和高速串行收發(fā)器技術(shù),在每個方向上支持高達10-Gbps 的數(shù)據(jù)吞吐量,可用在圖像和信號處理、高帶寬存儲器接口等領(lǐng)域中。
1.2 DSP 之間通過串行RapidIO 進行互連
如果 DSP 簇的互連使用串行RapidIO 協(xié)議,可以大大提高吞吐量。如圖1 所示:
圖 1 一種初步的互連方案
可以看出,幾個DSP 通過這種方法進行互連,利用兩個DSP 分別從外部收集未處理的數(shù)據(jù)并將處理好的數(shù)據(jù)送出,在幾個DSP 內(nèi)部利用串行RapidIO 協(xié)議,數(shù)據(jù)在幾個DSP 之間高速運轉(zhuǎn),正是因為RapidIO 這種基于點到點的傳輸特性才能使得高速傳輸?shù)膶崿F(xiàn)。另外,還可以通過一個外部的主機hoST 來實現(xiàn)控制這幾個DSP 的一些功能,比如在某種場合可以只運行某個DSP 進行特殊運算,那么其他的DSP 則處于不工作的狀態(tài)。這種DSP 之間使用串行RapidIO 互連有很多優(yōu)點:
1、RapidIO 協(xié)議分為三層,所有DSP 可以集中處理碼元速率和符號速率。
2、擁有可以升級的交織查找表,可以平衡幾個 DSP 的工作量。
3、這種點到點的開關(guān)互連可以滿足更高更復(fù)雜的要求,比如多用戶檢測等等。
4、協(xié)議中四種優(yōu)先級設(shè)定,允許高優(yōu)先級的優(yōu)先通信。
5、RapidIO 中的數(shù)據(jù)流,可以選擇第六種數(shù)據(jù)類型,允許數(shù)據(jù)傳輸具有更小的包頭。
1.3 無線傳輸系統(tǒng)基帶部分
在無線傳輸中,模擬的用戶數(shù)據(jù)經(jīng)過射頻模塊進行模擬的轉(zhuǎn)換,發(fā)送到基站的基帶板接收,運行一系列的運算規(guī)則進行調(diào)制解調(diào)來分析用戶數(shù)據(jù)?;鶐ё酉到y(tǒng)完成信道解擴解調(diào)、編譯碼、擴頻調(diào)制的功能?;鶐ё酉到y(tǒng)對上行基帶數(shù)據(jù)進行解調(diào),包括相關(guān)、信道估計、頻率跟蹤和RAKE 合并等,然后經(jīng)過譯碼處理、FP 處理傳遞給傳輸子系統(tǒng)。而在下行鏈路中,基帶子系統(tǒng)接收到來自傳輸子系統(tǒng)的FP 包,根據(jù)要求完成編碼,包括TB 塊CRC 校驗和碼塊分段、信道編碼、速率匹配、交織、傳輸信道復(fù)用與物理信道映射等,將下行數(shù)據(jù)發(fā)送到中頻子系統(tǒng)。其中,互相關(guān)、信道估計和多用戶檢測等通常都是用ASIC 和FPGA 來實現(xiàn)的,Viterbi 譯碼和turbo 譯碼等通常都是用DSP 實現(xiàn)的。如圖2 所示:
圖 2 基站基帶處理板簡化框圖
傳統(tǒng)的 ASIC/FPGA 構(gòu)成的處理器,沒有對等網(wǎng)絡(luò)的要求,對語音、數(shù)據(jù)進行固定分配,處理效率比較低。因此可以考慮用DSP 來實現(xiàn),但是單個DSP 只有一個內(nèi)核,它的處理能力非常有限,處理數(shù)據(jù)的速度不及FPGA.如果多個多核協(xié)作進行并行計算,則可以成倍提高DSP 的處理能力,因此可以考慮多個DSP 互連。多個DSP 通過高速協(xié)議互連構(gòu)成的DSP簇能夠很靈活地實現(xiàn)多種功能,他們之間通過軟件編程,可以非常靈活地適應(yīng)更高復(fù)雜的要求,并且使對等網(wǎng)絡(luò)通信成為可能,具有更高的吞吐量。
由于這種模塊只有 DSP 在運算,需要進行負載均衡,對于處理鏈中的DSP 簇,需要給每個DSP 分配不同的算法模塊。因為需要更高的數(shù)據(jù)速率并且需要更復(fù)雜的多用戶運算,進行信道估計和檢測,需要用多個DSP 對這些運算進行負載均衡,從而去實現(xiàn)更大的算法模塊。比如說可以給每個DSP 相同的算法,也可以讓每個DSP 本身成為一個獨立的算法模塊,這些都是非常靈活的。
2. 系統(tǒng)的具體實現(xiàn)
DSP 之間通過RapidIO 協(xié)議進行通信的實現(xiàn)方法,目前可以通過FPGA 實現(xiàn),F(xiàn)PGA 作為DSP 節(jié)點本地互連網(wǎng)絡(luò)協(xié)處理器,采用了分層結(jié)構(gòu),包括DSP 接口層、RapidIO 的邏輯層、運輸層和物理層[4].DSP 通過外部存儲器接口( EMIF) 和FPGA 相連。但是這種方法需要在FPGA 內(nèi)部進行比較復(fù)雜的互連。目前,TUNDRA 公司推出了一款專門的串行RapidIO芯片--TSI568A.
圖 3 Tsi568a 的內(nèi)部結(jié)構(gòu)。[!--empirenews.page--]
Tsi568A 是一款業(yè)內(nèi)最先進的串行RapidIO 交換機,支持高達每秒80GB 的總帶寬。它高度的靈活性可以滿足多個I/O 設(shè)備的帶寬要求,每個端口可以配置成4x 模式或者1x 模式,這樣可以為多個DSP 連接提供接口。Tsi568A 還支持RapidFabric 擴展,包括以交互工作和封裝為目的的數(shù)據(jù)流分組交換。而且Tsi568a 支持熱插拔I/O 設(shè)備。同時,TI 公司的TMS320C6455 系列DSP 也集成了串行RapidIO 接口,這樣就可以實現(xiàn)DSP 簇之間進行無縫的串行RapidIO 通信。
圖 4 互連的實現(xiàn)。
如圖 3 所示接收端基帶處理。自相關(guān)和多徑估計由DSP1 和DSP2 中完成,信道估計和多用戶檢測由DSP3 和DSP5 完成,QPSK 和MRC 也由DSP5 處理,turbo 譯碼和viterbi 譯碼由DSP7 完成。還可以看出,給DSP4 和DSP6 并沒有使用,這時候它們可以進入Power down模式,可以根據(jù)需要來決定是否使用某個DSP.
另外,上圖只是接收端的基帶處理,給每個 DSP 分配不同或者相同的功能,使得DSP處理板還可以在系統(tǒng)的多天線接收板,多天線發(fā)送板,基帶接收處理板中使用。由于是對等的關(guān)系,采用適當(dāng)?shù)纳壙梢允拱l(fā)送和接收功能在一塊板卡中靈活實現(xiàn)。除了功能上的差別外,不同單板需要的處理能力不同,可以選用不同的DSP 來適應(yīng)。如果處理能力要求不高,可以選用工作頻率較低的6455-720 或者6455-850;如果處理能力要求比較高,則可選用工作頻率最高的6455-1000.這種模塊處理機制,每個DSP 都執(zhí)行這一系列信道處理的功能,在某些時候幾個DSP 可以進入Power down 模式,TSI568a 也能夠中斷沒有使用的端口以節(jié)省功率。而在高通信量的時候可以使能所有的DSP 工作。
借助 Tsi568A 系列交換機,可以通過多種端口帶寬和頻率選項,可以選擇靈活的端口配置各個DSP.系統(tǒng)基于串行RapidIO 規(guī)范,擁有多種功能:SerDes、錯誤恢復(fù)、給予優(yōu)先級的體系路由、高有效載荷和基于表格的體系分組路由。由于擁有廣泛緩沖和流量管理架構(gòu),可以有效防止線路中樞發(fā)生堵塞。Tsi568a 提供了芯片到芯片的互聯(lián),因此幾個DSP 的數(shù)據(jù)傳輸是點到點的。同時,Tsi568A 可以通過區(qū)分數(shù)據(jù)包的優(yōu)先級來提供流量匯總功能,通過自己的無阻塞體系來提供高性能的對等通訊。通過x4 串行RapidIO 連接,可以具有更高的信道密度,承載更高的吞吐量。
3. 結(jié)論
在基站的基帶處理結(jié)構(gòu)中靈活使用串行 rapidio 協(xié)議,能夠減少復(fù)雜度,使電路板的設(shè)計更加簡單,發(fā)送和接收功能更加靈活地在一塊板卡中實現(xiàn);并且多個DSP 同時執(zhí)行并行計算提升了基帶處理的能力;允許更靈活的現(xiàn)場切換;彌補了傳統(tǒng)互聯(lián)方案的不足,具有可升級的空間,可以通過軟件改進對算法和數(shù)據(jù)路徑進行升級。