www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 模擬 > 模擬
[導(dǎo)讀]1 引言  在數(shù)字化飛速發(fā)展的今天,人們對微處理器的性能要求也越來越高。作為衡量微處理器 性能的主要標(biāo)準(zhǔn),主頻和乘法器運行一次乘法的周期息息相關(guān)。因此,為了進一步提高微處 理器性能,開發(fā)高速高精度的乘法器

1 引言

  在數(shù)字化飛速發(fā)展的今天,人們對微處理器的性能要求也越來越高。作為衡量微處理器 性能的主要標(biāo)準(zhǔn),主頻和乘法器運行一次乘法的周期息息相關(guān)。因此,為了進一步提高微處 理器性能,開發(fā)高速高精度的乘法器勢在必行。同時由于基于IEEE754 標(biāo)準(zhǔn)的浮點運算具 有動態(tài)范圍大,可實現(xiàn)高精度,運算規(guī)律較定點運算更為簡捷等特點,浮點運算單元的設(shè)計 研究已獲得廣泛的重視。 本文介紹了 32 位浮點乘法器的設(shè)計,采用了基4 布思算法,改進的4:2 壓縮器及布思 編碼算法,并結(jié)合FPGA自身特點,使用流水線設(shè)計技術(shù),在實現(xiàn)高速浮點乘法的同時,也 使是系統(tǒng)具有了高穩(wěn)定性、規(guī)則的結(jié)構(gòu)、易于FPGA 實現(xiàn)及ASIC 的HardCopy 等特點。

  2 運算規(guī)則及系統(tǒng)結(jié)構(gòu)

  2.1 浮點數(shù)的表示規(guī)則

  本設(shè)計采用單精度IEEE754 格式【2】。設(shè)參與運算的兩個數(shù)A、B 均為單精度浮點數(shù), 即:

  

  2.2 浮點乘法器的硬件系統(tǒng)結(jié)構(gòu)

  本設(shè)計用于專用浮點FFT 處理器,因此對運算速度有較高要求。為了保證浮點乘法器 可以穩(wěn)定運行在80M 以下,本設(shè)計采用了流水線技術(shù)。流水線技術(shù)可提高同步電路的運行 速度,加大數(shù)據(jù)吞吐量。而FPGA 的內(nèi)部結(jié)構(gòu)特點很適合在其中采用流水線設(shè)計,并且只需 要極少或者根本不需要額外的成本。綜上所述,根據(jù)系統(tǒng)分割,本設(shè)計將采用5 級流水處理, 圖1 為浮點乘法器的硬件結(jié)構(gòu)圖。

  

  3 主要模塊設(shè)計與仿真

  3.1 指數(shù)處理模塊(E_Adder)設(shè)計

  32位浮點數(shù)格式如文獻【2】中定義。由前述可知,浮點乘法的主要過程是兩個尾數(shù)相 乘,同時并行處理指數(shù)相加及溢出檢測。對于32位的浮點乘法器而言,其指數(shù)為8位,因而 本設(shè)計采用帶進位輸出的8位超前進位加法器完成指數(shù)相加、去偏移等操作,具體過程如下。

  E_Adder 模塊負責(zé)完成浮點乘法器運算中指數(shù)域的求和運算,如下式所示:

  

  其中,E[8]為MSB 位產(chǎn)生的進位。Bias=127 是IEEE754 標(biāo)準(zhǔn)中定義的指數(shù)偏移值。 Normalization 完成規(guī)格化操作,因為指數(shù)求和結(jié)果與尾數(shù)相乘結(jié)果有關(guān)。在本次設(shè)計中,通 過選擇的方法,幾乎可以在Normalization 標(biāo)志產(chǎn)生后立刻獲得積的指數(shù)部分,使E_Adder 不處于關(guān)鍵路徑。

  本設(shè)計收集三級進位信號,配合尾數(shù)相乘單元的 Normalization 信號,對計算結(jié)果進行 規(guī)格化處理,并決定是否輸出無窮大、無窮小或正常值。

  根據(jù) E_Adder 的時序仿真視圖,可看出設(shè)計完全符合應(yīng)用需求。

  3.2 改進的Booth 編碼器設(shè)計

  由于整個乘法器的延遲主要決定于相加的部分積個數(shù),因此必須減少部分積的數(shù)目才能 進而縮短整個乘法器的運算延遲。本設(shè)計采用基4 布思編碼器,使得部分積減少到13 個, 并對傳統(tǒng)的編碼方案進行改進。編碼算法如表1 所示。

  

  由于 FPGA 具有豐富的與、或門資源,使得該方法在保證速度和準(zhǔn)確性的前提下,充分 利用了FPGA 內(nèi)部資源,節(jié)省了面積,同時符合低功耗的要求。

  3.3 部分積產(chǎn)生與壓縮結(jié)構(gòu)設(shè)計

  3.3.1 部分積產(chǎn)生結(jié)構(gòu)

  根據(jù)布思編碼器輸出結(jié)果,部分積產(chǎn)生遵循以下公式【4】:

 

  

  其中,PPi 為部分積;Ai 為被乘數(shù)。經(jīng)過隱藏位和符號位的擴展后,26 位的被乘數(shù)尾數(shù)將產(chǎn) 生13 個部分積。在浮點乘法器中,尾數(shù)運算采用的是二進制補碼運算。因此,當(dāng)NEG=1 時要在部分積的最低位加1,因為PPi 只完成了取反操作。而為了加強設(shè)計的并行性,部分 積最低位加1 操作在部分積壓縮結(jié)構(gòu)中實現(xiàn)。另外,為了完成有符號數(shù)相加,需對部分積的 符號位進行擴展,其結(jié)果如圖4 所示。13 個部分積中,除第一個部分積是29 位以外,其余 部分積擴展為32 位。其中,第一個部分積包括3 位符號擴展位“SSS”,第2 至13 個部分 積的符號擴展位為“SS”,加一操作位為“NN”,遵循如下公式:

  

  其中,i 為部分積的行數(shù),sign(i)為第i 行部分積的符號。

  3.3.2 部分積壓縮結(jié)構(gòu)

  本設(shè)計混合使用 4:2 壓縮器、3:2 壓縮器、全加器和半加器,實現(xiàn)了13 個部分積的 快速壓縮,并保證了精度。本文部分積壓縮結(jié)構(gòu)的劃分如圖2 所示。

  

  圖 2 中,虛線給出了傳統(tǒng)部分積的壓縮劃分,而實線描述的是本文采用的部分積壓縮結(jié) 構(gòu)劃分,這樣的劃分有利于簡化第二級的壓縮結(jié)構(gòu),從而在保證速度的基礎(chǔ)上,節(jié)省FPGA 內(nèi)部資源。從圖2 中可看出,有些位不必計算,因為這些位是由Booth 編碼時引入的乘數(shù)尾 數(shù)的符號位產(chǎn)生的,48 位足以表達運算結(jié)果。

  3.3.3 改進的4:2 壓縮器

  本設(shè)計采用廣泛使用的 4:2 壓縮器,并針對FPGA 內(nèi)部資源特點,對其進行了改進。 如圖3 所示。 傳統(tǒng)的 4:2 壓縮器即兩個全加器級聯(lián),共需要四個異或門和8 個與非門。而改進的4: 2 壓縮器需要四個異或門和兩個選擇器(MUX)。8 個與非門需要36 個晶體管,而兩個MUX 需要20 個晶體管。同時,F(xiàn)PGA 內(nèi)部集成了大量的異或門和選擇器資源,這種設(shè)計方法也是對FPGA 的一個充分利用。

  

  由于壓縮部分積需要大量的4:2 壓縮器,所以改進的電路能 在一定程度上減小版圖的面積,也為該乘法器的ASIC 后端設(shè)計帶來了優(yōu)勢。另外,改進的 壓縮器的4 個輸入到輸出S 的延時相同,都是3 級XOR 門延時。

  4 32 位浮點乘法器的實現(xiàn)與仿真

  圖 4 顯示了本設(shè)計的FPGA 時序仿真結(jié)果,時序仿真環(huán)境為Quartus II 7.0,目標(biāo)芯片為 Cyclone 系列的EP1C6Q240C8,功能仿真環(huán)境為Modelsim 6.0b。整個設(shè)計采用VHDL 語言進行結(jié)構(gòu)描述,綜合策略為面積優(yōu)先。由仿真視圖可看出,該浮點乘法器可穩(wěn)定運行在80M 及以下頻率,在延時5 個周期后,以后每一個周期可穩(wěn)定輸出一級乘法運算結(jié)果,實現(xiàn)了高 吞吐量。如果采用全定制進行后端版圖布局布線,乘法器的性能將更加優(yōu)越。

  

  5 結(jié)語

  本文作者創(chuàng)新點:針對FPGA 器件內(nèi)部資源特性,獨創(chuàng)地提出了一種適合FPGA 實現(xiàn) 的5 級流水高速浮點乘法器。該乘法器支持IEEE754 標(biāo)準(zhǔn)32 位單精度浮點數(shù),采用了基4 布思算法、改進的布思編碼器、部份積壓縮結(jié)構(gòu)等組件,從而在保證高速的前提下,縮小了 硬件規(guī)模,使得該乘法器的設(shè)計適合工程應(yīng)用及科學(xué)計算,并易于ASIC 的后端版圖實現(xiàn)。 該設(shè)計已使用在筆者設(shè)計的浮點FFT 處理器中,取得了良好效果。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

在數(shù)字化浪潮席卷全球的今天,F(xiàn)PGA技術(shù)正成為驅(qū)動創(chuàng)新的核心引擎。2025年8月21日,深圳將迎來一場聚焦FPGA技術(shù)與產(chǎn)業(yè)應(yīng)用的盛會——2025安路科技FPGA技術(shù)沙龍。本次沙龍以“定制未來 共建生態(tài)”為主題,匯聚行業(yè)...

關(guān)鍵字: FPGA 核心板 開發(fā)板

在現(xiàn)代電子系統(tǒng)中,現(xiàn)場可編程門陣列(FPGA)憑借其開發(fā)時間短、成本效益高以及靈活的現(xiàn)場重配置與升級等諸多優(yōu)點,被廣泛應(yīng)用于各種產(chǎn)品領(lǐng)域。從通信設(shè)備到工業(yè)控制,從汽車電子到航空航天,F(xiàn)PGA 的身影無處不在。為了充分發(fā)揮...

關(guān)鍵字: 可編程門陣列 FPGA 數(shù)字電源

上海2025年8月5日 /美通社/ -- 2025年7月30日,上海"2025思旗獎(AIflag Awards)"頒獎盛典上,F(xiàn)ESCO Adecco外企德科上海公司憑借在人力資源管理與A...

關(guān)鍵字: ECC AI AD BSP

2025年8月4日 – 提供超豐富半導(dǎo)體和電子元器件?的業(yè)界知名新品引入 (NPI) 代理商貿(mào)澤電子 (Mouser Electronics) 即日起開售Altera?的Agilex? 3 FPGA C系列開發(fā)套件。此開...

關(guān)鍵字: FPGA 邊緣計算 嵌入式應(yīng)用

內(nèi)窺鏡泛指經(jīng)自然腔道或人工孔道進入體內(nèi),并對體內(nèi)器官或結(jié)構(gòu)進行直接觀察和對疾病進行診斷的醫(yī)療設(shè)備,一般由光學(xué)鏡頭、冷光源、光導(dǎo)纖維、圖像傳感器以及機械裝置等構(gòu)成。文章介紹了一款基于兩片圖像傳感器和FPGA組成的微型3D內(nèi)...

關(guān)鍵字: 微創(chuàng) 3D內(nèi)窺鏡 OV6946 FPGA

運用單片機和FPGA芯片作為主控制器件 , 單片機接收從PC機上傳過來的顯示內(nèi)容和顯示控制命令 , 通過命令解釋和數(shù)據(jù)轉(zhuǎn)換 , 生成LED顯示屏所需要的數(shù)據(jù)信號和同步的控制信號— 數(shù)據(jù)、時鐘、行同步和面同步 。FPGA芯...

關(guān)鍵字: 單片機 FPGA LED顯示屏

在異構(gòu)計算系統(tǒng)中,ARM與FPGA的協(xié)同工作已成為高性能計算的關(guān)鍵架構(gòu)。本文基于FSPI(Fast Serial Peripheral Interface)四線模式,在150MHz時鐘頻率下實現(xiàn)10.5MB/s的可靠數(shù)據(jù)...

關(guān)鍵字: ARM FPGA FSPI

在全球FPGA市場被Xilinx(AMD)與Intel壟斷的格局下,國產(chǎn)FPGA廠商高云半導(dǎo)體通過構(gòu)建自主IP核生態(tài)與智能時序約束引擎,走出差異化高端化路徑。本文深入解析高云半導(dǎo)體FPGA工具鏈的兩大核心技術(shù)——全棧IP...

關(guān)鍵字: FPGA 高云半導(dǎo)體

2025年6月12日,由安路科技主辦的2025 FPGA技術(shù)沙龍在南京正式召開,深圳市米爾電子有限公司(簡稱:米爾電子)作為國產(chǎn)FPGA的代表企業(yè)出席此次活動。米爾電子發(fā)表演講,并展出米爾基于安路飛龍派的核心板和解決方案...

關(guān)鍵字: FPGA 核心板 開發(fā)板

高 I/O、低功耗及先進的安全功能,適用于成本敏感型邊緣應(yīng)用

關(guān)鍵字: FPGA I/O 機器視覺
關(guān)閉