www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > EDA > 電子設計自動化
[導讀]0 引 言 神經(jīng)網(wǎng)絡(Neural Networks)是人工神經(jīng)網(wǎng)絡(Ar-tificial Neural Networks)的簡稱,是當前的研究熱點之一。人腦在接受視覺感官傳來的大量圖像信息后,能迅速做出反應,并能在腦海中重現(xiàn)這些圖像信息,這


0 引 言
    神經(jīng)網(wǎng)絡(Neural Networks)是人工神經(jīng)網(wǎng)絡(Ar-tificial Neural Networks)的簡稱,是當前的研究熱點之一。人腦在接受視覺感官傳來的大量圖像信息后,能迅速做出反應,并能在腦海中重現(xiàn)這些圖像信息,這不僅與人腦的海量信息存儲能力有關,還與人腦的信息處理能力,包括數(shù)據(jù)壓縮能力有關。在各種神經(jīng)網(wǎng)絡中,多層前饋神經(jīng)網(wǎng)絡具有很強的信息處理能力,由于其采用BP算法,因此也稱為BP神經(jīng)網(wǎng)絡。采用BP神經(jīng)網(wǎng)絡模型能完成圖像數(shù)據(jù)的壓縮處理。在圖像壓縮中,神經(jīng)網(wǎng)絡的處理優(yōu)勢在于:巨量并行性;信息處理和存儲單元結(jié)合在一起;自組織自學習功能。
    與傳統(tǒng)的數(shù)字信號處理器DSP(Digital Signal Processor)相比,現(xiàn)場可編程門陣列(Field Programma-ble Gate Array,F(xiàn)PGA)在神經(jīng)網(wǎng)絡的實現(xiàn)上更具優(yōu)勢。DSP處理器在處理時采用指令順序執(zhí)行的方式,而且其數(shù)據(jù)位寬是固定的,因而資源的利用率不高,限制了處理器的數(shù)據(jù)吞吐量,還需要較大的存儲空間。FPGA處理數(shù)據(jù)的方式是基于硬件的并行處理方式,即一個時鐘周期內(nèi)可并行完成多次運算,特別適合于神經(jīng)網(wǎng)絡的并行特點,而且它還可以根據(jù)設計要求配置硬件結(jié)構(gòu),例如根據(jù)實際需要,可靈活設計數(shù)據(jù)的位寬等。隨著數(shù)字集成電路技術(shù)的飛速發(fā)展,F(xiàn)PGA芯片的處理能力得到了極大的提升,已經(jīng)完全可以承擔神經(jīng)網(wǎng)絡數(shù)據(jù)壓縮處理的運算量和數(shù)據(jù)吞吐量。圖像壓縮是信息傳輸和存儲系統(tǒng)的關鍵技術(shù),然而如何進行FPGA設計,以實現(xiàn)給定的功能已經(jīng)成為神經(jīng)網(wǎng)絡應用的關鍵。
    基于以上原因,選擇FPGA作為三層BP神經(jīng)網(wǎng)絡圖像壓縮算法的實現(xiàn)方式,提出了具體的一種實現(xiàn)方案,并對其中的重點單元進行了FPGA設計與仿真驗證。


1 BP神經(jīng)網(wǎng)絡圖像壓縮算法
    一般習慣將單隱層前饋網(wǎng)稱為三層前饋網(wǎng),它包括輸入層、隱含層和輸出層。三層BP神經(jīng)網(wǎng)絡結(jié)構(gòu)如圖1所示,原始數(shù)據(jù)節(jié)點和重建數(shù)據(jù)節(jié)點構(gòu)成節(jié)點數(shù)較大的外層(輸入層和輸出層),而中間的具有較小節(jié)點數(shù)的細腰層即構(gòu)成壓縮結(jié)果。其基本思想是強迫原始數(shù)據(jù)通過細腰型網(wǎng)絡瓶頸,并期望在網(wǎng)絡的瓶頸處能獲得較為緊湊的數(shù)據(jù)表示,以達到壓縮的目的。在網(wǎng)絡的學習過程中,通過BP訓練算法,調(diào)整網(wǎng)絡的權(quán)重,使重建圖像在均方誤差意義上盡可能近似于訓練圖像。經(jīng)過訓練的網(wǎng)絡即可用來執(zhí)行數(shù)據(jù)壓縮任務,網(wǎng)絡輸入層與隱含層之間的加權(quán)值相當于一個編碼器,隱含層與輸出層之間的加權(quán)相當于一個解碼器。從輸入端輸入的原始圖像數(shù)據(jù)經(jīng)過神經(jīng)網(wǎng)絡的處理,在隱含層得到的輸出數(shù)據(jù)就是原始圖像的壓縮編碼,而輸出層矢量即為解壓后重建的圖像數(shù)據(jù)。

    BP神經(jīng)網(wǎng)絡用于圖像編碼的壓縮比與輸入層和隱含層的節(jié)點數(shù)有關:
    壓縮比一輸入層節(jié)點數(shù)(n)/隱含層節(jié)點數(shù)(m)
    因此一般來說采用不同數(shù)目的隱含層神經(jīng)元就可實現(xiàn)同一圖像的不同壓縮比。
    三層BP前饋網(wǎng)中輸入向量X=x(x1,x2,…,xi,…,xn)T,隱含層輸出向量Y=y(y1,y2,…,yi,…,ym)T,輸出層輸出向量O=O(O1,O2,…,Ok,…,Ol)T,期望輸出向量d=d(d1,d2,…,dk,…,dl)T,輸入層到隱含層的權(quán)值向量V=v(v1,v2,…,vj,…,vm)T,其中vj為隱含層第j個神經(jīng)元對應的權(quán)值向量;隱含層到輸出層的權(quán)值向量W=W(w1,w2,…,wk,…wl)T,其中wk為輸出層第k個神經(jīng)元對應的權(quán)值向量;隱含層的閾值向量θ=(θ1,θ2,…,θi,…,θm)T;輸出層的閾值向量γ=(γ1,γ2,…,γk,…,γl)T。
    (1)用小的隨機數(shù)對每一層的權(quán)值和偏差初始化,以保證網(wǎng)絡不被大的加權(quán)輸入飽和,并進行以下參數(shù)的設定或初始化:期望誤差最小值;最大循環(huán)次數(shù);修正權(quán)值的學習速率;
    (2)將原始圖像分為4×4或8×8大小的塊,選取其中一塊的像素值作為訓練樣本接入到輸入層,計算各層輸出:


   

    其中:f(·)為BP網(wǎng)絡中各層的傳輸函數(shù)。
    (3)計算網(wǎng)絡輸出與期望輸出之間的誤差,判斷是否小于期望誤差,是則訓練結(jié)束,否則至下一步,其中反傳誤差的計算式為:
   
    (4)計算各層誤差反傳信號;
    (5)調(diào)整各層權(quán)值和閾值;
    (6)檢查是否對所有樣本完成一次訓練,是則返回步驟(2),否則至步驟(7);
    (7)檢查網(wǎng)絡是否達到最大循環(huán)次數(shù),是則訓練結(jié)束,否則返回步驟(2)。
    經(jīng)過多次訓練,最后找出最好的一組權(quán)值和閾值,組成三層前饋神經(jīng)網(wǎng)絡,用于該算法的FPGA設計。

    其中,在數(shù)據(jù)預處理部分,首先將原始圖像分成n×n的小塊,以每一小塊為單位進行歸一化。歸一化的目的,主要有以下兩點:
    (1)BP網(wǎng)絡的神經(jīng)元均采用Sigmoid轉(zhuǎn)移函數(shù),變換后可防止因凈輸入的絕對值過大而使神經(jīng)元輸出飽和,繼而使權(quán)值調(diào)整進入誤差曲面的平坦區(qū);
    (2)Sigmoid轉(zhuǎn)移函數(shù)的輸出在-1~+1之間,作為信號的輸出數(shù)據(jù)如不進行變換處理,勢必使數(shù)值大的輸出分量絕對誤差大,數(shù)值小的輸出分量絕對誤差小。網(wǎng)絡訓練時只針對輸出的總誤差調(diào)整權(quán)值,其結(jié)果是在總誤差中占份額小的輸出分量相對誤差較大,對輸出量進行尺度變化后這個問題可迎刃而解。
    歸一化后得到以每小塊的灰度值為列向量組成的待壓縮矩陣,將該矩陣存儲在RAM里,然后以每一列為單位發(fā)送給先人先出寄存器FIFO(First Input FirstOutput);由FIFO將向量x1,x2,…,xn以流水(pipe-line)方式依次傳人各乘累加器MAC(Multiply-Accu-mulate),相乘累加求和后,送入LUT(Lookup Table)得到隱層相應的節(jié)點值,這里LUT是實現(xiàn)Sigmoid函數(shù)及其導函數(shù)的映射。
    在整個電路的設計中,采用IP(Intellectual Prop-erty)核及VHDL代碼相結(jié)合的設計方法,可重載IP軟核,具有通用性好,便于移植等優(yōu)點,但很多是收費的,比如說一個高性能流水線設計的MAC軟核,所以基于成本考慮,使用VHDL語言完成MAC模塊的設計,而RAM和FIFO模塊則采用免費的可重載IP軟核,使整個系統(tǒng)的設計達到最佳性價比。在壓縮算法的實現(xiàn)中,乘累加單元是共同部分,也是編碼和譯碼器FPGA實現(xiàn)的關鍵。
2.2 乘累加器MAC的流水線設計及其仿真
    流水線設計是指將組合邏輯延時路徑系統(tǒng)地分割,并在各個部分(分級)之間插人寄存器暫存中間數(shù)據(jù)的方法。流水線縮短了在一個時鐘周期內(nèi)信號通過的組合邏輯電路延時路徑長度,從而提高時鐘頻率。對于同步電路,其速度指同步電路時鐘的頻率。同步時鐘愈快,電路處理數(shù)據(jù)的時間間隔越短,電路在單位時間內(nèi)處理的數(shù)據(jù)量就愈大,即電路的吞吐量就越大。理論而言,采用流水線技術(shù)能夠提高同步電路的運行速度。MAC電路是實現(xiàn)BP神經(jīng)網(wǎng)絡的重要組成部分,在許多數(shù)字信號處理領域也有著廣泛應用,比如數(shù)字解調(diào)器、數(shù)字濾波器和均衡器,所以如何提高MAC的效率和運算速度具有極高的使用價值。本方案采用的MAC設計以四輸入為例。
    四輸入的MAC電路必須執(zhí)行四次乘法操作和兩次加法操作,以及最后的兩次累加操作。如果按照非流水線設計,完成一次對輸入的處理,需要這三步延遲時間的總和,這會降低一個高性能系統(tǒng)的效率。而采用流水線設計,則可以避免這種延遲,將MAC的操作安排的像一條裝配線一樣,也就是說,通過這種設計它可以使系統(tǒng)執(zhí)行的時鐘周期減小到流水線中最慢步驟所需的操作時間,而不是各步驟延遲時間之和,如圖3所示。

    在第一個時鐘邊沿,第一對數(shù)據(jù)被存儲在輸入寄存器中。在第一個時鐘周期,乘法器對第一對數(shù)據(jù)進行乘法運算,同時系統(tǒng)為下一對數(shù)據(jù)的輸入作準備。在第二個時鐘邊沿,第一對數(shù)據(jù)的積存儲在第一個流水線寄存器,且第二對數(shù)據(jù)已經(jīng)進入輸入寄存器。在第二個時鐘周期,完成對第一對數(shù)據(jù)積的兩次加法操作,而乘法器完成第二對數(shù)據(jù)的積運算,同時準備接收第三隊數(shù)據(jù)。在第三個時鐘邊沿,這些數(shù)據(jù)分別存放在第二個流水線寄存器,第一個流水線寄存器,以及輸入寄存器中。在第三個時鐘周期,完成對第一對數(shù)據(jù)和之前數(shù)據(jù)的累加求和,對第二對數(shù)據(jù)的兩次加法操作,對第一對數(shù)據(jù)的乘法運算,并準備接收第四對數(shù)據(jù)。在第四個始終邊沿,累加器中的和將被更新。
    在本設計方案中,測試仿真平臺選用的FPGA芯片為ALTERA公司CycloneⅡ系列的EP2C8芯片,它采用90 nm的制造工藝,擁有8 256個邏輯單元,36個M4K隨機只讀存儲器,2個數(shù)字鎖相環(huán),以及18個硬乘法器等豐富資源。仿真工具使用業(yè)界流行的MentorGraphics公司的仿真軟件Modelsim 6.1f。對設計進行驗證時,常見的方法是在模擬時施加輸入激勵信號,然后“讀”該設計的輸出信號,它的主要缺點是隨著模擬器的不同而不同。為了克服此缺點,采用的測試方法是用VHDL編寫一個測試模型發(fā)生器,稱為Testbench,它的優(yōu)點是通用性好,靈活性強,可以隨時更改輸入激勵,已得到不同的仿真結(jié)果。在對該MAC模塊進行測試的過程中,涉及輸入數(shù)據(jù)的轉(zhuǎn)化問題,如前所述,在本神經(jīng)網(wǎng)絡中,輸入數(shù)據(jù)歸一化后,集中在-1~+1之間,所以處理時必須進行轉(zhuǎn)化,最后采用16位補碼形式的定點二進制表示法,由于在求和中可能會產(chǎn)生溢出,還必須包含一個溢l出狀態(tài)信號。輸入數(shù)據(jù)轉(zhuǎn)換16位補碼的仿真波形如圖4所示。

    16位補碼轉(zhuǎn)換原輸入實數(shù)的仿真波形如圖5所示。

    在完成了對輸入、輸出數(shù)據(jù)的轉(zhuǎn)換之后,編寫Testbench(測試臺)程序,對基于流水線設計的四輸入MAC進行行為級仿真,仿真波形如圖6所示。

    綜上所述,在基于流水線的乘法設計中,雖然每一步操作后都加入了寄存器,消耗了更多的資源,但卻可以將系統(tǒng)延時降低到最慢步驟所需要的時間,極大地提高了同步電路的運算速度。


3 結(jié) 語
    介紹了基于三層前饋BP神經(jīng)網(wǎng)絡的圖像壓縮算法,提出了基于FPGA的實現(xiàn)驗證方案,詳細討論了實現(xiàn)該壓縮網(wǎng)絡組成的重要模塊MAC電路的流水線設計。在對BP神經(jīng)網(wǎng)絡的電路設計中,對傳輸函數(shù)及其導函數(shù)的線性逼近也是近來研究的熱點之一,本文使用的壓縮查找表雖然能夠滿足設計要求,但仍然消耗了大量資源。該研究結(jié)果對整個壓縮解壓縮算法的實現(xiàn)以及多層神經(jīng)網(wǎng)絡的相關研究工作提供了參考。

本站聲明: 本文章由作者或相關機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

美國紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績報告。 IBM 董事長兼首席執(zhí)行官 Arvind Kri...

關鍵字: IBM 軟件 BSP 云平臺

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險積極籌備個人養(yǎng)老金的產(chǎn)品設計和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動商業(yè)養(yǎng)老保險、個人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險等產(chǎn)品供給。 搭養(yǎng)老政策東風 ...

關鍵字: 溫度 BSP 東風 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎單元,承載著生存與活動的最基本功能。而對于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對于空間和生活深層關系的思考,同時也塑造著人與空間的新型連接...

關鍵字: 溫度 BSP 智能化 進程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績預告。今年前三季度,公司預計實現(xiàn)營業(yè)收入7.54億元至8.33億元,同比增長60.24%至77.03%;歸母凈利潤預計為1.73億...

關鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟和信息化局發(fā)布2022年度第一批北京市市級企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠健華正式獲得"北京市企業(yè)技術(shù)中心"認定。 北京市企業(yè)技...

關鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報告》,報告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...

關鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團成立60周年的紀念日。趁著首都銀行集團成立60周年與首都銀行(中國)在華深耕經(jīng)營12年的“大日子”,圍繞作為外資金融機構(gòu)對在華戰(zhàn)略的構(gòu)想和業(yè)...

關鍵字: 數(shù)字化 BSP 供應鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團公司上海通運國際物流有限公司(Nipp...

關鍵字: 溫控 精密儀器 半導體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國進出口商品交易會("廣交會")于"云端"開幕。本屆廣交會上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過140,...

關鍵字: 中國智造 BSP 手機 CAN

要問機器人公司哪家強,波士頓動力絕對是其中的佼佼者。近來年該公司在機器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機器人組團跳男團舞的新視頻,表演的機器人包括...

關鍵字: 機器人 BSP 工業(yè)機器人 現(xiàn)代汽車

電子設計自動化

21167 篇文章

關注

發(fā)布文章

編輯精選

技術(shù)子站

關閉