www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]RAM讀寫時(shí)序限制解決方案

本文為了提高AVS解碼器的處理速度,綜合了國內(nèi)外學(xué)者的設(shè)計(jì)思想提出了一種逆掃描、反量化與反變換模塊結(jié)構(gòu),在消耗邏輯資源允許的情況下提高了處理速度,做到速度和面積的平衡。

  本文將逆掃描、反量化和反變換模塊結(jié)合在一起進(jìn)行設(shè)計(jì),在實(shí)現(xiàn)了塊內(nèi)部?jī)?yōu)化的同時(shí)采用了乒乓緩存寄存器組來實(shí)現(xiàn)塊之間流水線,提高了速度;采用寄存器組復(fù)用技術(shù)實(shí)現(xiàn)逆塊掃描中寄存器組與反變換中的轉(zhuǎn)置寄存器組的復(fù)用,節(jié)省了寄存器資源。

  1 硬件結(jié)構(gòu)
 

  根據(jù)AVS解碼標(biāo)準(zhǔn),本文提出了一種高效簡(jiǎn)潔的逆掃描、反量化與反變換系統(tǒng)結(jié)構(gòu),該結(jié)構(gòu)主要由四部分組成。反量化模塊完成量化系數(shù)向變換系數(shù)的轉(zhuǎn)變;逆掃描與寄存器組選擇模塊根據(jù)逆掃描表完成變換系數(shù)的存儲(chǔ);寄存器組用來存儲(chǔ)變換系數(shù)及反變換中的轉(zhuǎn)置數(shù)據(jù);反變換模塊將變換系數(shù)轉(zhuǎn)換成殘差樣值,為后續(xù)的重構(gòu)做好準(zhǔn)備。硬件結(jié)構(gòu)及數(shù)據(jù)流程如圖1所示。

  

 

  其中輸入為VLD模塊解析出的(run,level)對(duì)、塊結(jié)束標(biāo)志及一些模式判別的信息。反量化模塊對(duì)Level數(shù)據(jù)進(jìn)行反量化,逆掃描與寄存器組選擇模塊采用依據(jù)輪流使用的規(guī)則產(chǎn)生寄存器組選擇信號(hào),同時(shí)對(duì)Run進(jìn)行累加,并根據(jù)累加結(jié)果查表得到需要存儲(chǔ)的寄存器,等所有量化后的Level值存儲(chǔ)完畢后,由It_start信號(hào)連續(xù)讀取8次寄存器進(jìn)入反變換模塊,反變換模塊采用內(nèi)部流水線結(jié)構(gòu)經(jīng)過22個(gè)時(shí)鐘周期處理完一個(gè)塊。反變換模塊中的轉(zhuǎn)置寄存器復(fù)用了前端的寄存器組。

  本設(shè)計(jì)通過乒乓結(jié)構(gòu)實(shí)現(xiàn)了塊與塊之間的流水。圖2是本設(shè)計(jì)的總體時(shí)序安排,圖中考慮到變換編碼后一個(gè)塊內(nèi)的有效系數(shù)一般小于25。其中以一個(gè)塊數(shù)據(jù)輸入反量化模塊作為起始時(shí)刻,當(dāng)反變化模塊讀取一個(gè)寄存器組并將其作為轉(zhuǎn)置寄存器使用時(shí),另一個(gè)寄存器組用于存儲(chǔ)下一個(gè)塊的反量化結(jié)果。如圖2,寄存器組1用來存儲(chǔ)當(dāng)前塊反量化后的變換系數(shù)值,而寄存器2被用于上一個(gè)塊的反變換中。另外,讀取轉(zhuǎn)置后的數(shù)據(jù)時(shí),通過對(duì)移位最初的寄存器賦零對(duì)寄存器2清零,從而用于下一個(gè)塊的變換系數(shù)的存儲(chǔ)。

  

 

  1.1 逆掃描與寄存器組選擇模塊

  該模塊先對(duì)Run值進(jìn)行累加,并根據(jù)掃描方式查表,得到當(dāng)前Level值所對(duì)應(yīng)的寄存器號(hào),控制將反量化后的變換系數(shù)存入相應(yīng)寄存器中,重復(fù)以上工作直到讀到塊結(jié)束標(biāo)志。當(dāng)前塊不為零的所有變換系數(shù)均根據(jù)逆掃描表存儲(chǔ)在相應(yīng)的位置,因?yàn)槊看螐募拇嫫髦凶x取轉(zhuǎn)置數(shù)據(jù)時(shí)都會(huì)對(duì)寄存器清零,為下次使用做好準(zhǔn)備,所以對(duì)于變換系數(shù)為零的情況就不用單獨(dú)存儲(chǔ),從而提高了設(shè)計(jì)的處理速度。

  1.2 反變換模塊

  反變換模塊是將當(dāng)前塊的變換系數(shù)矩陣轉(zhuǎn)換為殘差樣值矩陣的一個(gè)過程,為了節(jié)約硬件成本,此設(shè)計(jì)采用一維變換和轉(zhuǎn)置矩陣實(shí)現(xiàn)二維變換,參考文獻(xiàn)[2]中提出了一種快速有效的方法,本文對(duì)其方法進(jìn)行了優(yōu)化,節(jié)約了不必要的硬件資源和時(shí)鐘。

  下面主要介紹一維變換過程。

  設(shè)AVS的一維反變換的輸入輸出變量分別為:

  X=[X0,X1,X2,X3,X4,X5,X6,X7]T

  Y=[Y0,Y1,Y2,Y3,Y4,Y5,Y6,Y7]T

  根據(jù)Y=T8×X,把8個(gè)輸出元素展開成以下組合,其中T8為8×8的反變換矩陣。

  M0=8X0+8X4;M1=8X0-8X4

  M2=4X1+4X5;M3=9X1-10X5

  M4=6X1+2X5;M5=2X1+9X5

  M6=10X2+4X6;M7=4X2-10X6

  M8=9X3+2X7;M9=2X3+6X7

  M10=10X3-9X7;M11=4X3+4X7

  其中所有的乘法均可化為移位操作,再定義8個(gè)中間變量N0~N7:

  N0=M0+M6;N1=M2+M8+M4

  N2=M1+M7;N3=M3-M9

  N4=M1-M7;N5=M4-M10

  N6=M0-M6;N7=M5-M11-M9

  重新整理后得到的輸出:

  Y0=N0+N1;Y1=N2+N3;Y2=N4+N5;Y3=N6+N7

  Y4=N6-N7;Y5=N4-N5;Y6=N2-N3;Y7=N0-N1

  由以上算法可以看出,一維反變換模塊只需要移位和加法操作,既方便硬件實(shí)現(xiàn)還節(jié)省了硬件資源。經(jīng)計(jì)算此一維反變化模塊共需要40個(gè)加法器。

  反變換模塊的時(shí)序見圖2,第1時(shí)鐘周期進(jìn)行并行讀取數(shù)據(jù),2個(gè)時(shí)鐘周期進(jìn)行一維反變換,第4個(gè)時(shí)鐘周期開始向轉(zhuǎn)置矩陣中存入一維反變換后的數(shù)據(jù),第12周期開始讀取轉(zhuǎn)置矩陣中的數(shù)據(jù),第15個(gè)時(shí)鐘周期開始輸出數(shù)據(jù),第22個(gè)時(shí)鐘周期結(jié)果輸出完畢。[!--empirenews.page--]1.3 寄存器組復(fù)用

 

  在逆塊掃描順序中,一些后續(xù)的系數(shù)可能需要在一開始時(shí)就準(zhǔn)備好,而一些在前面次序的系數(shù)則可能在后續(xù)的時(shí)間使用,所以只有一個(gè)塊的所有數(shù)據(jù)都存儲(chǔ)完成后,才能進(jìn)行后續(xù)的反變換,故至少要對(duì)一個(gè)塊的變換系數(shù)進(jìn)行存儲(chǔ)。為了提高處理速度,后續(xù)的反變換模塊中將采用并行流水線輸入,因此存儲(chǔ)模塊此時(shí)不能采用有時(shí)序限制的RAM,本文采用了寄存器組實(shí)現(xiàn)。同時(shí)為了消除塊數(shù)據(jù)的準(zhǔn)備延時(shí),還采用了乒乓結(jié)構(gòu),即在設(shè)計(jì)中用了兩個(gè)寄存器組,這樣就可在處理當(dāng)前一個(gè)塊系數(shù)的同時(shí),用另一個(gè)寄存器組來存儲(chǔ)下一個(gè)塊反量化后的數(shù)據(jù)。

  在反變換中也需要用到轉(zhuǎn)置存儲(chǔ)。為了節(jié)省資源,本設(shè)計(jì)采用了寄存器復(fù)用技術(shù),即反變換中用到的轉(zhuǎn)置矩陣與逆掃描后用于存儲(chǔ)變換系數(shù)的矩陣復(fù)用,具體復(fù)用方法如圖3所示。

  

 

  以上為一個(gè)寄存器組,包含64個(gè)13 bit的寄存器。最后一列為反變換模塊輸入,即當(dāng)一個(gè)塊變換系數(shù)根據(jù)逆掃描順序存儲(chǔ)完后,連續(xù)8個(gè)時(shí)鐘周期讀取寄存器組最后一列,在每個(gè)時(shí)鐘周期向反變換模塊并行輸入8個(gè)13 bit的數(shù)據(jù)。第一列為轉(zhuǎn)置數(shù)據(jù)輸入端。考慮到反變換流水線及復(fù)用的問題,在連續(xù)2個(gè)時(shí)鐘周期讀取寄存器組最后一列輸入到反變換模塊后,轉(zhuǎn)置數(shù)據(jù)開始從第一列輸入,這樣可以滿足反變換內(nèi)部的流水線問題,也可以達(dá)到寄存器復(fù)用的目的。第一行為轉(zhuǎn)置數(shù)據(jù)的輸出,最后一行在轉(zhuǎn)置數(shù)據(jù)輸出時(shí)賦值為零,這樣可以使轉(zhuǎn)置輸出和寄存器賦零同時(shí)進(jìn)行,從而可以減少不必要的時(shí)鐘周期和資源。

  2 仿真結(jié)果及分析

  根據(jù)上述思想,采用Verilog HDL語言對(duì)算法進(jìn)行了RTL級(jí)電路描述,并采用Altera公司的軟件Quartus II 8.0 對(duì)此算法進(jìn)行了實(shí)現(xiàn)和仿真驗(yàn)證,并將仿真結(jié)果與rm52j軟件的輸出結(jié)果進(jìn)行了比較。Quartus II仿真結(jié)果如圖4所示,波形圖給出了一個(gè)塊的反量化和反變換輸出結(jié)果。rm52j的輸出結(jié)果如圖5所示,比較可見輸出結(jié)果相同。

  

 

  

 

  本設(shè)計(jì)采用的是自頂向下和自下而上的混合設(shè)計(jì)方法,逆掃描、反量化和反變換過程是AVS系統(tǒng)中的一個(gè)模塊,局部的測(cè)試很難判斷出該模塊是否可以應(yīng)用到整個(gè)解碼系統(tǒng)中去,所以此模塊亦在自己搭建的基于SoPC的AVS驗(yàn)證平臺(tái)上進(jìn)行了驗(yàn)證。加入此模塊前,軟件處理一幀碼流時(shí)間與用此硬件模塊代替軟件模塊后的解碼時(shí)間如圖6所示,通過計(jì)算可知解碼速度提高約15%。

  

[!--empirenews.page--]變換編碼后一個(gè)塊內(nèi)的有效系數(shù)一般小于25,所以逆掃描、反量化的時(shí)鐘一般小于25個(gè)時(shí)鐘周期,而反變換的時(shí)鐘周期為22個(gè),所以處理一個(gè)塊的時(shí)鐘周期大約為25個(gè),大大提高了速度。由于寄存器的復(fù)用及設(shè)計(jì)的優(yōu)化,節(jié)省了硬件資源,本設(shè)計(jì)采用的FPGA為EP2C35F672C6,資源使用情況如圖7所示,可見使用的總的LE為3 059個(gè)。

 

  

 

  本設(shè)計(jì)為了解決RAM讀寫時(shí)序限制的影響,采用了兩組寄存器陣列代替RAM實(shí)現(xiàn)乒乓操作,同時(shí)為了減少硬件資源,采用寄存器組復(fù)用技術(shù),即反變換中的轉(zhuǎn)置矩陣與逆掃描后存儲(chǔ)寄存器組復(fù)用。最后給出了波形仿真結(jié)果,并與rm52j的輸出結(jié)果比較,驗(yàn)證了結(jié)果的正確性。通過在基于Nios II的SoPC系統(tǒng)上進(jìn)行測(cè)試,證明該設(shè)計(jì)能夠正確快速實(shí)現(xiàn)逆掃描、反量化及反變換功能。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉