www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > EDA > 電子設(shè)計(jì)自動(dòng)化
[導(dǎo)讀]在FPGA 上設(shè)計(jì)一個(gè)高性能、靈活的、面積小的通信體系結(jié)構(gòu)是一項(xiàng)巨大的挑戰(zhàn)。大多數(shù)基于FPGA 的片上網(wǎng)絡(luò)都是運(yùn)行在一個(gè)單一時(shí)鐘下。隨著FPGA 技術(shù)的發(fā)展,Xilinx 公司推出了Virtex-4 平臺(tái)。該平臺(tái)支持同一時(shí)間內(nèi)32 個(gè)

FPGA 上設(shè)計(jì)一個(gè)高性能、靈活的、面積小的通信體系結(jié)構(gòu)是一項(xiàng)巨大的挑戰(zhàn)。大多數(shù)基于FPGA 的片上網(wǎng)絡(luò)都是運(yùn)行在一個(gè)單一時(shí)鐘下。隨著FPGA 技術(shù)的發(fā)展,Xilinx 公司推出了Virtex-4 平臺(tái)。該平臺(tái)支持同一時(shí)間內(nèi)32 個(gè)時(shí)鐘運(yùn)行,也就是說每個(gè)片上網(wǎng)絡(luò)的內(nèi)核可以在一個(gè)獨(dú)立的時(shí)鐘下運(yùn)行, 從而使每個(gè)路由器和IP 核都運(yùn)行在最佳頻率上。因此適用于設(shè)計(jì)多時(shí)鐘片上網(wǎng)絡(luò),實(shí)現(xiàn)高性能分組交換片上網(wǎng)絡(luò)。

1 多時(shí)鐘片上網(wǎng)絡(luò)架構(gòu)的分析

片上網(wǎng)絡(luò)結(jié)構(gòu)包含了拓?fù)浣Y(jié)構(gòu)、流量控制、路由、緩沖以及仲裁。選擇合適網(wǎng)絡(luò)架構(gòu)方面的元素,將對(duì)片上網(wǎng)絡(luò)的性能產(chǎn)生重大影響。

(1)網(wǎng)絡(luò)拓?fù)洌涸谠O(shè)計(jì)中,選擇Mesh 拓?fù)浣Y(jié)構(gòu)。Mesh結(jié)構(gòu)擁有最小的面積開銷以及低功耗的特點(diǎn)。此外,Mesh 的線性區(qū)的節(jié)點(diǎn)數(shù)量規(guī)模大以及通道較寬。同時(shí),Mesh 也能很好地映射到FPGA 下的底層路由結(jié)構(gòu),降低了FPGA 邏輯擁塞和路由器的功耗。

(2)流控機(jī)制:虛擬直通和蟲洞技術(shù)(不像存儲(chǔ)轉(zhuǎn)發(fā))有數(shù)據(jù)包的延時(shí)與路徑長(zhǎng)度成正比。然而,與復(fù)雜的蟲洞路由器相比, 虛擬直通的路由器更加適合于設(shè)計(jì)的實(shí)現(xiàn)。因此,選擇虛擬直通流量控制機(jī)制作為路由器的流量控制機(jī)制。相比較蟲洞機(jī)制,它能支持更高的吞吐量,在堵塞時(shí)能更有效地釋放緩存。此外,虛擬直通流量控制低延時(shí)的高信道利用率, 與此同時(shí)并不保留物理通道。

(3)路由算法:選擇XY 算法作為設(shè)計(jì)所采用的路由算法。該算法中分組的路由只取決于源節(jié)點(diǎn)和目的節(jié)點(diǎn)的地址,而與網(wǎng)絡(luò)狀況無(wú)關(guān)。當(dāng)使用算法時(shí)首先在X 維上進(jìn)行路由,當(dāng)?shù)竭_(dá)與目的節(jié)點(diǎn)同一列時(shí),轉(zhuǎn)向在Y 維上的路由,最后到達(dá)目的節(jié)點(diǎn)。該算法對(duì)硬件要求簡(jiǎn)單和實(shí)現(xiàn)容易, 在網(wǎng)絡(luò)流量不大時(shí), 具有較小的時(shí)延,能夠有效避免死鎖和活鎖。

(4)仲裁機(jī)制:輸入端口分配是基于簡(jiǎn)單的Roundrobin[3]機(jī)制。上次接收或解決接收的端口會(huì)放在隊(duì)列的末端。切換時(shí)到下游的數(shù)據(jù)包。當(dāng)交換數(shù)據(jù)包時(shí),F(xiàn)IFO的虛擬通道也遵循這種機(jī)制。

2 路由器微節(jié)點(diǎn)結(jié)構(gòu)的設(shè)計(jì)

多時(shí)鐘片上網(wǎng)絡(luò)的路由器由5 個(gè)輸入端口、交叉點(diǎn)矩陣和中央的仲裁器三部分組成。除了頭譯碼邏輯,5 個(gè)輸入端口都是相同的。由于設(shè)計(jì)中采取了虛擬通道流控機(jī)制(VCS),因此輸入端口就必須包含仲裁邏輯。與此同時(shí), 輸入端口還應(yīng)包含輸入緩沖區(qū)來存儲(chǔ)輸入的數(shù)據(jù)包。

2.1 數(shù)據(jù)包

利用Xilinx block RAM, 設(shè)置深度為16 的FIFO(先入先出隊(duì)列),數(shù)據(jù)包的大小能在24 位與128 位之間變化,每個(gè)數(shù)據(jù)包header(包頭)占用一個(gè)flit(數(shù)據(jù)片)。flit 的大小固定在8 位。數(shù)據(jù)包頭包含路由目標(biāo)地址、flit 的類型以及部分?jǐn)?shù)據(jù)包。設(shè)計(jì)中采用的虛擬直通流量控制需要1 位去指定數(shù)據(jù)片的類型。路由器支持可變化大小的數(shù)據(jù)包, 通過編碼將數(shù)據(jù)包的大小編譯為字段,作為bRAM 所需要的部分,放在數(shù)據(jù)包頭部。每個(gè)IP 核的網(wǎng)絡(luò)接口(NI)起到存儲(chǔ)在數(shù)據(jù)包頭部的信息的作用。當(dāng)需要更高粒度數(shù)據(jù)包時(shí),部分?jǐn)?shù)據(jù)包的位數(shù)以及寬度將會(huì)相應(yīng)的增加。增加部分?jǐn)?shù)據(jù)包的位數(shù)的同時(shí)也提高了緩存的利用率。數(shù)據(jù)包首部保留的位數(shù)將用于實(shí)現(xiàn)基于優(yōu)先級(jí)的流量控制。

2.2 輸入端口

路由器有5 個(gè)輸入端口, 通過端口分別與內(nèi)核及鄰近的路由器通信, 這5 個(gè)端口按在方位可分為本地(L),北(N),東(E),南(S),西(W)。每個(gè)輸入端口可以支持虛擬通道多路復(fù)用,相關(guān)聯(lián)的仲裁器,以及頭譯碼邏輯,從而作出路由決定。如圖1,輸入端口的3 個(gè)主要組成部分分別是虛擬通道選擇器、FIFO bRAMs 以及bRAM 仲裁器。虛擬通道選擇器:決定輸入端緩存的使用空間的決定權(quán)在虛擬通道選擇器。當(dāng)數(shù)據(jù)包大小以編碼形式傳播時(shí),虛擬通道選擇器接收數(shù)據(jù)包的首部。當(dāng)虛擬通道選擇器收到來自上游路由器或者來自自身核心的數(shù)據(jù)時(shí), 虛擬通道選擇器就會(huì)拿數(shù)據(jù)包的大小跟虛擬通道目前可以容納數(shù)據(jù)包的大小進(jìn)行比較。這么做的目的是為了能夠使輸入的數(shù)據(jù)能夠符合FIFO 中write_count 的大小。如果有足夠的空間存在,則虛擬通道選擇器將同意輸入請(qǐng)求, 同時(shí)反饋信息。在此過程中,虛擬通道選擇器還設(shè)置了輸入端解復(fù)用器。解復(fù)用器的作用是使數(shù)據(jù)包從輸入通道傳輸?shù)秸_的復(fù)用器的輸入緩存中。FIFO bRAMs:在所設(shè)計(jì)的路由器中,緩沖區(qū)的深度將參數(shù)化,在試驗(yàn)時(shí)同時(shí)將其深度設(shè)置為16 。這些緩存區(qū)將被作為bRAM FIFO 的存儲(chǔ)器,同時(shí)起到以下作用:

(1)緩沖部分或者全部到來的數(shù)據(jù)包,以及當(dāng)下游開關(guān)可以用時(shí),傳送頭部及緊跟的flit。

(2)劃分路由器核心以及路由器的頻率,從而支持一個(gè)多時(shí)鐘的網(wǎng)絡(luò)設(shè)計(jì)。

(3)通過仲裁器監(jiān)察write_count 端口的信息,來實(shí)現(xiàn)支持可變化大小的數(shù)據(jù)包。在緩沖區(qū)有單獨(dú)時(shí)鐘域的情況時(shí), 就需要一種有效的方式實(shí)施完整的或者空的邏輯。通過以下方式使控制信號(hào)同步:

(1)發(fā)送數(shù)據(jù)包粒度作為一小部分FIFO 的空間。

(2) 在一個(gè)時(shí)鐘周期內(nèi), 一個(gè)連接終止之前設(shè)置flit 的尾部位。在所使用的FPGA 設(shè)計(jì)中,由于支持FIFO 的最小深度是16, 所以它適合于在虛擬直通中緩沖整個(gè)數(shù)據(jù)包。write_count 的空和滿狀態(tài)信號(hào)將集成在FIFO 中。在一個(gè)多數(shù)據(jù)包的緩沖區(qū)中加大存儲(chǔ)flit 的能力,將有助于提高FIFO 的利用率。此外,獲得網(wǎng)絡(luò)的吞吐量的增益,是由于上游連續(xù)包釋放緩沖區(qū)所促成的。


圖1 輸入端口設(shè)計(jì)圖

bRAM 仲裁器: 輸入端口還包含了控制邏輯作出的仲裁決定。當(dāng)選擇一個(gè)非空的bRAM 時(shí), 簡(jiǎn)單的Round-robin 的方式仲裁算法將會(huì)啟用。當(dāng)選擇bRAM時(shí),F(xiàn)SM 將會(huì)送出頭部flit,解碼出它的目的地址,并發(fā)送相應(yīng)的要求。在所設(shè)計(jì)的路由器中采用XY 路由算法將大大簡(jiǎn)化了解碼器的邏輯結(jié)構(gòu)。根據(jù)XY 路由算法的通行路徑許可,即將釋放的請(qǐng)求線將會(huì)減少。

頭譯碼器:在XY 路由算法中,頭數(shù)據(jù)片一開始往X 軸方向走,當(dāng)?shù)竭_(dá)X 軸所在的目標(biāo)地址時(shí),就會(huì)往Y方向走。所有緊隨著的數(shù)據(jù)片將以流水線的方式跟著頭數(shù)據(jù)片移動(dòng)。這種簡(jiǎn)便的XY 路由算法適用于減化頭解碼器、交叉點(diǎn)矩陣以及中央仲裁器的邏輯結(jié)構(gòu)。以上簡(jiǎn)化得邏輯結(jié)構(gòu)將使FPGA 的芯片數(shù)顯著減少。

2.3 交叉點(diǎn)矩陣

設(shè)計(jì)一個(gè)多路交叉點(diǎn)矩陣, 目的是為了減少面積的使用。而另一種設(shè)計(jì)是支持復(fù)分解虛擬通道的交叉點(diǎn)連接。后一種方法,產(chǎn)生高網(wǎng)絡(luò)吞吐量,但要增加一個(gè)重要的復(fù)雜性開關(guān)。交叉點(diǎn)支持并行連接,以及被用于通過中央仲裁器支持多個(gè)信號(hào)同時(shí)請(qǐng)求。并非所有的交叉點(diǎn)連接都是使用XY 路由算法。經(jīng)過邏輯優(yōu)化,如圖2 所示設(shè)計(jì)中實(shí)施簡(jiǎn)單的4 和2 輸入多路復(fù)用器開關(guān)(分別是L、N、S、E 以及W 端口)。上述優(yōu)化方案減少了交叉點(diǎn)面積,使其使用的切片只有32 片。因此,達(dá)到路由器面積顯著減小的目的。


圖2 交叉點(diǎn)矩陣

輸入端口的分配方式將采用簡(jiǎn)單的Round-robin仲裁機(jī)制。對(duì)上一次接收過的或沒有用到的端口將給予最低優(yōu)先級(jí),并排在隊(duì)列的最末端。將通過以下的方式提高路由器的性能:

(1)降低中央仲裁器的邏輯復(fù)雜度;

(2)盡量集中仲裁器,以減少req/grant 信號(hào)的數(shù)量。

在設(shè)計(jì)中減少邏輯復(fù)雜度以及布線, 從而減少數(shù)據(jù)堵塞,達(dá)到提高性能以及減低功耗的效果。

3 性能分析

利用Virtex-4 系列中XC4VLX100-11[4]設(shè)備進(jìn)行設(shè)計(jì), 利用Xilinx ISE 8.2i 進(jìn)行綜合布局布線。使用ModelSim 6.1c[5]驗(yàn)證所設(shè)計(jì)的功能。設(shè)置了單一時(shí)鐘和多時(shí)鐘進(jìn)行了模擬,分析多時(shí)鐘片上網(wǎng)絡(luò)的性能。由于路由器是直接連接到內(nèi)核, 所以沒必要考慮片與片之間的延時(shí)而去估計(jì)最高的頻率。所設(shè)計(jì)是由一個(gè)路由功能模塊(RFM)執(zhí)行[6],用以準(zhǔn)確地估計(jì)工作頻率,基本路由器的單機(jī)版工作頻率可到達(dá)357MHz。因此8bits 通道的路由器的吞吐量最高可達(dá)2.85Gbits/s。在所設(shè)計(jì)的路由器中, 頭數(shù)據(jù)片前進(jìn)到下一個(gè)節(jié)點(diǎn),而剩下的數(shù)據(jù)片以流水線方式流通。在計(jì)劃中,網(wǎng)絡(luò)延時(shí)僅僅與路徑長(zhǎng)度H(跳躍點(diǎn)數(shù)量)有關(guān)。在信道爭(zhēng)用的情況下,網(wǎng)絡(luò)延時(shí)L 可以用以下方式計(jì)算:

L = 7×H + B/w                                                               (1)

公式(1)中,B 是數(shù)據(jù)包的字節(jié)數(shù),w 是每個(gè)時(shí)鐘周期轉(zhuǎn)換的字節(jié)數(shù)。參數(shù)7 是在多時(shí)鐘片上網(wǎng)絡(luò)路由器中安裝在每個(gè)路由器跳延遲支付。這個(gè)延時(shí)是因?yàn)榛跀?shù)據(jù)包中的頭數(shù)據(jù)片的解碼和仲裁執(zhí)行所導(dǎo)致的。

為了*估所設(shè)計(jì)的多時(shí)鐘架構(gòu)的性能, 將利用所設(shè)計(jì)的路由器的VHDL 模型,模擬一個(gè)3×3Mesh 結(jié)構(gòu),在本身頻率下執(zhí)行包裝產(chǎn)生的數(shù)據(jù)包。路由器的頻率值會(huì)在拓?fù)浣Y(jié)構(gòu)合成,布局和布線階段完成之后得出。對(duì)于不同的配置(資源的可用性、跨路由器的距離、bRAM/dRAM FIFO 的版本),路由器的頻率可以降低高達(dá)18%[6]。圖3 顯示了單一時(shí)鐘與多時(shí)鐘,在延時(shí)與注射速率關(guān)系中的曲線圖。在單一時(shí)鐘時(shí),網(wǎng)絡(luò)的頻率為286MHz。而在多時(shí)鐘時(shí), 頻率的范圍是從286MHz~357MHz。圖3 中,X 軸表示的注射率是在一個(gè)周期內(nèi)每個(gè)節(jié)點(diǎn)注入flit 的數(shù)量。Y 軸曲線測(cè)量的是每個(gè)實(shí)例中數(shù)據(jù)包的平均延時(shí)??梢钥闯觯岢龅亩鄷r(shí)鐘片上網(wǎng)絡(luò)相比單一時(shí)鐘片上網(wǎng)絡(luò)的性能顯著增加。

4 結(jié)語(yǔ)

本文介紹了一個(gè)基于FPGA 的高效率多時(shí)鐘的虛擬直通路由器,通過優(yōu)化中央仲裁器和交叉點(diǎn)矩陣,以爭(zhēng)取較小面積和更高的性能。同時(shí),擴(kuò)展路由器運(yùn)作在獨(dú)立頻率的多時(shí)鐘NoC 架構(gòu)中,并在一個(gè)3×3Mesh 的架構(gòu)下實(shí)驗(yàn),分析其性能特點(diǎn),比較得出多時(shí)鐘片上網(wǎng)絡(luò)具有更高的性能。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉