www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]MPEG-4編碼器在BF561上的優(yōu)化

隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的發(fā)展。視頻通信的需求逐漸增加。同時,最新的視頻壓縮標(biāo)準(zhǔn)不斷推出。MPEG-4(Moving Pictures Expcrts Group-4)是國際運動圖像像編碼專家組(MPEG Moving Picture ExpertsGroup)在1998年11月制定的。它提供了用于甚低速率的音視頻編碼,實現(xiàn)了基于內(nèi)同的壓縮編碼,具有良好的兼容性、伸縮性和可靠性。以DSP為嵌入式圖像處理核心的系統(tǒng),具有開發(fā)周期短,編程靈活的特點,因此DSP圖像處理系統(tǒng)成為了當(dāng)前研究熱點。Blackfin系列處理器是ADI專門針對于通信和多媒體方面的應(yīng)用而開發(fā)的定點DSP,在片上集成了一套通用的數(shù)字圖像處理外圍設(shè)備,為數(shù)字圖像處理和多媒體應(yīng)用創(chuàng)建了一套完整的系統(tǒng)級片上解決方案。在此以該系列中BF56l為平臺,研究實現(xiàn)MPET-4編碼算法,并對該算法進行優(yōu)化。

1 ADSP-BF56l結(jié)構(gòu)特點
    ADSP-BF561是采用對等的雙核結(jié)構(gòu),可以很好地執(zhí)行兩種任務(wù),且開發(fā)人員可以隨意分配任務(wù)來平衡雙核之間的負(fù)載。如圖1所示,每一個Blackfin內(nèi)核包含兩個乘/累加器(MAC),兩個40位的ALU,四個視頻專用8位ALU和一個40位移位器。運算單元處理來自寄存器組的8位、16位或者32位數(shù)據(jù)。每個MAC每周期可完成一個16位乘16位的乘法運算,并把結(jié)果累加到40位的累加器中,提供8位的精度擴展。ALU單元執(zhí)行標(biāo)準(zhǔn)的算術(shù)和邏輯運算,由于兩個ALU具備對16位或32位數(shù)據(jù)操作的能力,因此運算單元具備的靈活性可以滿足各種應(yīng)用中信號處理的要求。每個32位的輸入寄存器可以作為兩個16位的寄存器,因此每個ALU可以完成非常靈活的單16位算術(shù)運算。通過把寄存器當(dāng)作兩個16位的操作數(shù)使用,雙16位或單32位操作可以在一個周期中完成。更好地利用第二個ALU,四個16位操作可以簡單地完成,加速了每個周期的吞吐量。強大的40位移位器功能豐富,可以對數(shù)據(jù)進行移位、循環(huán)移位、歸一化、提取和存儲等操作。運算單元所使用的數(shù)據(jù)來自具有16個16位操作數(shù)或8個32位操作數(shù)的寄存器組。


    同時BF561把存儲器視為一個統(tǒng)一的4 GB地址空間,使用32位地址并采用分級存儲器結(jié)構(gòu)。Level1(L1)存儲器一般以全速運行,沒有或只有很少的延遲。Level 2(L2)/Level 3(L3)分布在片內(nèi)或片外,對它的訪問會耗費多個處理器周期。在L1級,指令存儲器只存放指令,兩個數(shù)據(jù)存儲器存放數(shù)據(jù),一個專用的臨時數(shù)據(jù)存儲器存放堆棧和局部變量信息。在L2/L3級可以存放指令和數(shù)據(jù)。

2 編碼器整體結(jié)構(gòu)
    以BF561為核心構(gòu)成的MPEG-4編碼器結(jié)構(gòu)如圖2所示,其中BF561為編碼處理器,完成視頻采集控制以及基于MPEG-4的壓縮編碼等工作;與之相連的視頻解碼芯片選用ADI公司提供的ADV7183,它是10位ADC的增強型視頻解碼器,其內(nèi)含三個精確模/數(shù)轉(zhuǎn)換器(ADCs)和完整的自動增益控制(AGC)電路。BF561與ADV7183之間通過其專用視頻接口PPI接口相連,并通過I2C總線協(xié)議完成對ADV7183內(nèi)部寄存器的讀/寫操作。[!--empirenews.page--]

3 編碼器優(yōu)化方案
3.1 基于Cache和DMA的優(yōu)化

    Blackfin系列DSP多級存儲結(jié)構(gòu),其代碼從內(nèi)部L1指令存儲器運行、中間數(shù)據(jù)及常用參數(shù)從內(nèi)部L1數(shù)據(jù)存儲器讀取或存放時,才能實現(xiàn)最佳性能。但是MPEG-4算法大量的算法導(dǎo)致代碼不可能放入L1指令存儲器中,大量的中間數(shù)據(jù)和參數(shù)也不可能僅存放在L1數(shù)據(jù)存儲器中,所以要考慮如何更好地利用處理器上的L1存儲器才能讓系統(tǒng)的性能達(dá)到最佳。指令Cache,數(shù)據(jù)DMA,這是目前最流行的系統(tǒng)模型,多數(shù)的嵌入式媒體處理器都是基于這樣的想法而設(shè)計的。
    使用高速緩存機制允許編程者訪問大的、低成本的外部存儲器。它的工作方式是:在需要的時候自動將代碼讀入L1指令存儲器。這使編程者不必繁瑣地將代碼從內(nèi)部存儲器移入移出。指令高速緩存有助于以更為有效的方式從外部存儲器預(yù)取指令。
    相比于指令管理方面使用指令Cache,在數(shù)據(jù)管理上使用DMA顯得是自然而然的。但是在優(yōu)化過程中還是注意了以下幾個問題:
    (1)由于BF561的外部總線是32位寬的,所以用32位DMA能最大程度地提高數(shù)據(jù)存取的性能。
    (2)基于寄存器的DMA和基于描述符的DMA兩種DMA工作方式的選取。基于寄存器的DMA中,處理器直接對DMA控制寄存器編程來初始化一個傳送。因為寄存器不必從內(nèi)存中裝載,并且內(nèi)核不必保存描述符,因此,基于寄存器的DMA提供了最好的DMA控制器性能。相反在基于描述符的DMA操作中,可以對一個DMA通道進行編程,以便在當(dāng)前傳送隊列完成后,自動設(shè)置和重啟其他的DMA傳送過程。在管理一個系統(tǒng)的DMA過程時,基于描述符的模型可以提供最大的靈活性?;谏厦娴目紤],在視頻采集模塊中我們選了基于描述符的DMA控制方式,而在其他模塊中選取基于寄存器的DMA方式。
    (3)當(dāng)數(shù)據(jù)在內(nèi)部存儲器移動時,盡量不使用標(biāo)準(zhǔn)C語言中的memepy()函數(shù),而使用MemDMA的方式,這樣可以減少CPU等待時間。
3.2 存儲器管理策略優(yōu)化
    對于通常的嵌入式媒體處理器,片上存儲器都不夠存儲一個完整的視頻幀,因此系統(tǒng)必須依賴L3外部RAM來支持對大緩沖區(qū)進行相對較快的訪問。因此對片外存儲器的訪問必須精心設(shè)計,以保證較優(yōu)的數(shù)據(jù)吞吐。以下是筆者在優(yōu)化過程中總結(jié)的一些關(guān)鍵步驟:
    (1)分組類似傳送來減小存儲器總線出送方向切換的次數(shù)。以相同的方向訪問外存是是最有效率的(如連續(xù)的讀或者寫)。例如,當(dāng)訪問片外SDRAM時,16個讀16個寫總比單獨的16個讀/寫要快,這是由于先寫再讀而導(dǎo)致的延遲。對外存的隨機訪問會產(chǎn)生高概率的總線中轉(zhuǎn)。因此在給定的方向上充分利用控制傳輸數(shù)量的能力是重要的。
    對于MemDMA流,當(dāng)期望共享可用的DMA總線帶寬時,可編程的DMA控制器以輪流選擇每個數(shù)據(jù)流的方式進行固定數(shù)量的傳送。在每條DMA總線上,這個“方向控制”工具在DMA資源的優(yōu)化使用方面是一個重要的考慮。通過分組同方向地傳送在一起,其提供了一種方法來管理DMA總線傳送方向的頻繁變動。當(dāng)使用方向控制特性時,DMA控制器優(yōu)先級保證在DMA或存儲器總線上,與前一次傳送據(jù)具有相同讀/寫方向的數(shù)據(jù)傳輸,直到方向控制計數(shù)器溢出,或停止傳送,或傳送過程中自己改變方向。當(dāng)方向計數(shù)器歸零時,DMA控制器改變其優(yōu)先選擇方向為相反的數(shù)據(jù)流動。
    (2)保持SDRAM的行打開及實現(xiàn)多次數(shù)據(jù)傳送。每次訪問SDRAM都會花費幾個SCLK(系統(tǒng)時鐘周期),特別是如果需要的SDRAM的行還沒有被激活時。一旦一行是激活的,就能從一整行中讀取數(shù)據(jù)而不必每次訪問該行的時候再打開。或者可以這樣理解:每個SCLK周期訪問存儲器的任何位置都是可能的,只要這些位置在SDRAM的同一行中。關(guān)閉一行需要多個SDRAM時鐘周期,因此,連續(xù)的行關(guān)閉能嚴(yán)格限制SDRAM的吞吐量。
    一個SDRAM的頁錯失可花費20~50個CCLK(核時鐘周期)。Blackfin系列DSP可以最多同時打開四個SDRAM行,從而減少設(shè)置時間。應(yīng)用程序應(yīng)當(dāng)通過適當(dāng)放置數(shù)據(jù)緩沖區(qū)和管理訪問來利用打開的SDRAM塊,原則就是把可能同一時間訪問的緩沖區(qū)分配到不同的SDRAM塊中。
3.3 基于雙核結(jié)構(gòu)的優(yōu)化
    一片BF561內(nèi)包含了兩個完全相同的Blackfin內(nèi)核,這使其擁有比同系列芯片更為強勁的運算能力。因此想要充分發(fā)揮其能力就必須更具其結(jié)構(gòu)特性為編碼器設(shè)定合適的整體構(gòu)架。通常的方式有兩種,一種是非對稱的程序設(shè)計模式,另外一種為對稱的程序設(shè)計模式。顧名思義,非對稱模式就是兩個內(nèi)核完成不同的處理任務(wù),這種模式下,兩個內(nèi)核好像是兩個單獨的處理器,它們之間不共享代碼。不共享或者只共享少量的數(shù)據(jù)。而對稱的程序設(shè)計模式比較適合于處理器任務(wù)較為單一,但運算量比較大的情況,更能發(fā)揮雙核在運算能力方面的優(yōu)勢。
    基于上面的分析,選擇了對稱的程序設(shè)計模式,而且是基于運算量考慮的對稱模型,即兩個核各負(fù)責(zé)半幀圖像的壓縮,另外A核還負(fù)責(zé)系統(tǒng)初始化以及輸入/輸出中斷的響應(yīng),B核還負(fù)責(zé)時間字符的疊加以及時間計算等,這樣最大程度上平衡了兩個核的工作量。此外,在L2存儲器中定義了兩個核都需要的變量,以及控制雙核同步的信號量等。雙核協(xié)作工作的過程以及同步方式如圖3所示。



[!--empirenews.page--]4 編碼器測試
    在此分別采用foreman.yuv和Brige_close.yuv兩個標(biāo)準(zhǔn)序列對編碼其性能進行測試,圖4~圖7為效果圖。


    優(yōu)化前后的兩種序列圖像的性能對比如表1所示。


    采用實時采集的圖像進行測試時,優(yōu)化前圖像模糊、不連續(xù),說明編碼速度小于采集速度;優(yōu)化后圖像清晰連續(xù),說明編碼器的編碼速度已經(jīng)達(dá)到25 f/s以上,達(dá)到了D1格式實時采集壓縮的性能要求。
    將優(yōu)化后的編碼算法應(yīng)用到實際視頻采集系統(tǒng)中,得到優(yōu)化前后的圖像如圖8、圖9所示,實驗結(jié)果表明,本文優(yōu)化后的編碼器可以得到很好的效果。

5 結(jié)語
    在此論述一款基于BF561 DSP的MPEG-4編碼器的優(yōu)化方案,通過實驗驗證了編碼器的編碼效率達(dá)到了PAL制式25 f/s@D1的要求,可以充分滿足實時監(jiān)控、視頻圖像存儲等方面的應(yīng)用。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

美國紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績報告。 IBM 董事長兼首席執(zhí)行官 Arvind Kri...

關(guān)鍵字: IBM 軟件 BSP 云平臺

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險積極籌備個人養(yǎng)老金的產(chǎn)品設(shè)計和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動商業(yè)養(yǎng)老保險、個人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動的最基本功能。而對于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對于空間和生活深層關(guān)系的思考,同時也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績預(yù)告。今年前三季度,公司預(yù)計實現(xiàn)營業(yè)收入7.54億元至8.33億元,同比增長60.24%至77.03%;歸母凈利潤預(yù)計為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟和信息化局發(fā)布2022年度第一批北京市市級企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報告》,報告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團成立60周年的紀(jì)念日。趁著首都銀行集團成立60周年與首都銀行(中國)在華深耕經(jīng)營12年的“大日子”,圍繞作為外資金融機構(gòu)對在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團公司上海通運國際物流有限公司(Nipp...

關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國進出口商品交易會("廣交會")于"云端"開幕。本屆廣交會上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過140,...

關(guān)鍵字: 中國智造 BSP 手機 CAN

要問機器人公司哪家強,波士頓動力絕對是其中的佼佼者。近來年該公司在機器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機器人組團跳男團舞的新視頻,表演的機器人包括...

關(guān)鍵字: 機器人 BSP 工業(yè)機器人 現(xiàn)代汽車

嵌入式教程

6897 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉