www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 單片機 > 單片機
[導讀] XC166單片機的指令流水線存在著不可避免的阻塞現(xiàn)象,MAC單元指令也一樣。盡管在硬件設計時已經(jīng)采用了專用模塊來減少阻塞,但有些阻塞是不可避免的,從程序優(yōu)化的角度來說,可以充分利用指令流水線阻塞現(xiàn)象,通過重

 XC166單片機的指令流水線存在著不可避免的阻塞現(xiàn)象,MAC單元指令也一樣。盡管在硬件設計時已經(jīng)采用了專用模塊來減少阻塞,但有些阻塞是不可避免的,從程序優(yōu)化的角度來說,可以充分利用指令流水線阻塞現(xiàn)象,通過重排指令流水線上的指令,消除阻塞,以使得程序的運行時間縮短,從而達到優(yōu)化的目的。

  通常DSP優(yōu)化方法可以分為兩類:一類是與芯片相關(guān)的,另一類是與芯片無關(guān)的。與芯片無關(guān)的優(yōu)化方法獨立于單片機硬件,適用于所有單片機及DSP處理器,下面根據(jù)使用XC166單片機的經(jīng)驗總結(jié)一些優(yōu)化DSP程序的方法。

  1 通用優(yōu)化方法

  1.1 數(shù)據(jù)組處理

  數(shù)據(jù)組處理的基本思想是通過成組的處理數(shù)據(jù),以節(jié)約每次調(diào)用處理子程序所需的附加指令。數(shù)據(jù)組處理可以在C語言或匯編語言程序中實現(xiàn)。一般而言,對于開發(fā)DSP程序,最常用的程序語言為C和匯編。下面分別介紹如何在C和匯編程序中使用數(shù)據(jù)組處理優(yōu)化方法。

  (1)C程序

  在C環(huán)境中開發(fā)DSP程序,通常算法本身由匯編編寫,以便優(yōu)化實現(xiàn)。C主程序通過調(diào)用匯編實現(xiàn)的核心處理子程序來完成對數(shù)據(jù)的處理。核心處理子程序有兩種實現(xiàn)方法,一種是數(shù)組處理,另一種是單值處理,假設單值處理子程序的核心部分與數(shù)組處理子程序的核心部分所需機器周期相同,并且調(diào)用子程序的前期處理需M個機器周期,后期處理需要N個機器周期,如果子程序被調(diào)用K次,那么理想情況下,數(shù)據(jù)組處理可以節(jié)約(K-1)(M+N)個機器周期,如圖1所示。

  


 

  (2)匯編程序

  在匯編程序中實現(xiàn)數(shù)據(jù)組處理有多種方法,比如數(shù)組操作,數(shù)組讀入/寫出等。

  1、數(shù)組操作。數(shù)組操作是將多個不同的短操作數(shù)裝入一個長位數(shù)的寄存器,然后進行運算操作。比如,1個16位的寄存器可以裝入2個8位的來自A/D轉(zhuǎn)換器的數(shù)據(jù)。下面舉例說明數(shù)據(jù)組處理在匯編程序中的應用。

  

 

  2、數(shù)組讀入寫出。這種方法是將多個短操作數(shù)合并為一個長操作數(shù)后進行讀入/寫出操作,如上面例子中的輸入/輸出部分。

  1.2 數(shù)據(jù)存儲器交織

  數(shù)據(jù)存儲器交織的目的是通過重新排列數(shù)據(jù)在存儲器中的位置,以使得程序讀寫數(shù)據(jù)的時間最短,比如有2個8位的復數(shù)x和y,一般情況下,復數(shù)將按下列順序存入內(nèi)存:real(x),image(x),real(y),image(y)。但如果想使得讀取復數(shù)的實部更容易,可以把數(shù)據(jù)重新排列如下:real(x),real(y),image(x),image(y),如圖2所示。

  

 

  1.3 循環(huán)展開

  循環(huán)展開是一種非常傳統(tǒng)的程序優(yōu)化方法,可以用于所有程序優(yōu)化中,循環(huán)展開的目的是通過重復循環(huán)中的程序,減少循環(huán)次數(shù),從而減少循環(huán)判斷指令的執(zhí)行次數(shù),以此來降低程序執(zhí)行所需的機器周期,下面舉一個例子來說明循環(huán)展開在XC164CS單片機中的應用。

  


  

 

  1.4 指令流水線重排

  指令流水線重排的意思是通過軟件程序中的指令重排來改變指令流水線,以此來排除由于硬件引起的指令堵塞,從而加快程序的運行時間。這種優(yōu)化操作通常用在匯編程序中,指令流水線重排是一個一般的優(yōu)化原理,把這個原理用于不同類型的單片機可以導出不同的與單片機硬件相關(guān)的優(yōu)化方法。下面介紹的基于XC166單片機的優(yōu)化方法主要是應用這個優(yōu)化原理得到的。

  2 與芯片相關(guān)的優(yōu)化技術(shù)

  2.1 XC166指令流水線

  XC166單片機指令流水線共有7級,前兩級為取指令流水線,后5級為執(zhí)行流水線,所有指令都必須經(jīng)過5級執(zhí)行流水線的每一級。

  第1級--指令預取。這一級根據(jù)預測順序,把指令從程序管理單元(PMU)取出,取出的指令在跳轉(zhuǎn)檢測單元進行前期處理,以檢測是否有跳轉(zhuǎn),預測邏輯決定是否接收轉(zhuǎn)移。

  第2級--取指令。根據(jù)轉(zhuǎn)移預測規(guī)則計算出下一條被取指令的指針。對于零機器周期轉(zhuǎn)移,轉(zhuǎn)移合并單元先預處理,并將檢測到的轉(zhuǎn)移與正在執(zhí)行的指令結(jié)合起來。預取出的指令存在FIFO緩存器中,同時,下一條要執(zhí)行的指令輸出FIFO緩存器,進入執(zhí)行流水線。

  第3級--譯碼。指令被譯碼,如需要,在間接尋址模式中,寄存器文件將被訪問,以讀取通用寄存器GPR。

  第4級--尋址。計算所有操作數(shù)地址,對于所有隱含訪問系統(tǒng)堆棧的指令,堆棧指針遞減或增加。

  第5級--存儲。所有需要的操作數(shù)被取出。

  第6級--執(zhí)行。使用已取出的操作數(shù)進行MAC單元操作。對于非MAC單元指令,在這一級中,指令將由算術(shù)邏輯單元(ALU)執(zhí)行。條件標志被更新,執(zhí)行所有直接對CPU特殊功能寄存器CPU_SFRs進行寫操作的指令,在間接尋址時,作為地址指針的GPRs自動遞減或增加。

  第7級--寫回。所有外部操作數(shù)以及剩余的,在內(nèi)部DPRAM空間內(nèi)的操作器被寫回。定位在內(nèi)部SRAM中的操作數(shù)進入寫回緩沖區(qū)。

  下面給出一個具體例子:

  

 

  

 

  上面程序的指令流水線如表1所列,(Tn表示機器周期)

  2.2 數(shù)據(jù)相關(guān)性排除

  在XC166的CPU中,由于指令流水線的設計要求,在使用通用寄存器(GPRs)的指令之間存在一些數(shù)據(jù)相互依賴的情況,盡管XC166單片機已經(jīng)使用了專用硬件來檢測及解決數(shù)據(jù)相關(guān)性,但仍然有一些不可避免的數(shù)據(jù)相關(guān)性。在編程時,可以充分利用數(shù)據(jù)相關(guān)性來達到程序優(yōu)化的目的,比如,在用GPR作為間接尋址指針時,如果PGR中的地址值被改變,間接尋址操作必須等待2個機器指令周期后,才能使用GPR作為地址指針尋址。在這種情況下,可以在這2個等待機器周期內(nèi)插入2條其他單機器周期指令,充分利用這2個周期的等待時間以便程序更優(yōu)化。

  下面舉一個例子:

  

 

  另外一種數(shù)據(jù)相關(guān)性發(fā)生在間接尋址訪問內(nèi)存時,XC166單片機中的地址產(chǎn)生單元使用推測原理,在地址譯碼前,數(shù)據(jù)的讀取路經(jīng)將根據(jù)歷史記錄表中選出;在歷史記錄表中,每個GPR都有一個入口。這些入口記錄了用相應GPR所訪問的內(nèi)存空間情況。如果這種預測發(fā)生錯誤,讀取操作必須重新開始。

  因此,如果用GPR作為間接尋址,GPR最好能指向相同內(nèi)存空間。如果更新后的GPR指向不同內(nèi)存空間,下一個操作將出現(xiàn)訪問錯誤,讀操作必須重復,這就產(chǎn)生了指令流水線堵塞。例如:

  




  2.3 內(nèi)存帶寬沖突排除

 

如果在流水線上的指令在同一時間訪問同一內(nèi)存,就會發(fā)生內(nèi)存帶寬沖突,MAC單元的CoXXX指令是特別為實現(xiàn)DSP設計的。為了避免在DPRAM中發(fā)生帶寬沖突,CoXXX指令的其中一個操作數(shù)必須放在SRAM中,以保證在單個機器周期內(nèi)執(zhí)行MAC單元指令。例如:

  

 

  2.4 指令重排

  在用MAC單元指令編程時,經(jīng)常要改變MAC單元的特殊功能寄存器,比如IDX0,IDX1、QX0、QX1、QR0以及QR1等,在XC166單片機中,有一些指令將會阻塞在譯碼階段,如果這些指令正好在一條修改特殊功能寄存器(SFR)指令之后執(zhí)行,這種阻塞將引起3個機器周期的延時。

  這些指令包括:

  ◇使用長地址模式的指令;

  ◇使用間接尋址的指令,除JMPS和CALLI外;

  ◇所有MAC單元指令(CoXXX指令)。

  為了避免指令阻塞,在使用上述指令時,如有阻塞情況發(fā)生,應該重新重排指令,以消除延時,例如:

  

 

  3 結(jié)論

  用于英飛凌XC166單片機的DSP優(yōu)化技術(shù)分為兩類:與硬件相關(guān)的優(yōu)化技術(shù)和獨立于硬件的優(yōu)化技術(shù)。獨立于硬件的優(yōu)化技術(shù)也可以用于其他的單片機或?qū)S脭?shù)字信號處理器。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

武漢2025年9月9日 /美通社/ -- 7月24日,2025慧聰跨業(yè)品牌巡展——湖北?武漢站在武漢中南花園酒店隆重舉辦!本次巡展由慧聰安防網(wǎng)、慧聰物聯(lián)網(wǎng)、慧聰音響燈光網(wǎng)、慧聰LED屏網(wǎng)、慧聰教育網(wǎng)聯(lián)合主辦,吸引了安防、...

關(guān)鍵字: AI 希捷 BSP 平板

上海2025年9月9日 /美通社/ -- 9月8日,移遠通信宣布,其自研藍牙協(xié)議棧DynaBlue率先通過藍牙技術(shù)聯(lián)盟(SIG)BQB 6.1標準認證。作為移遠深耕短距離通信...

關(guān)鍵字: 藍牙協(xié)議棧 移遠通信 COM BSP

上海2025年9月9日 /美通社/ -- 為全面落實黨中央、國務院和上海市委、市政府關(guān)于加快發(fā)展人力資源服務業(yè)的決策部署,更好發(fā)揮人力資源服務業(yè)賦能百業(yè)作用,8月29日,以"AI智領(lǐng) HR智鏈 靜候你來&quo...

關(guān)鍵字: 智能體 AI BSP 人工智能

北京2025年9月8日 /美通社/ -- 近日,易生支付與一汽出行達成合作,為其自主研發(fā)的"旗馭車管"車輛運營管理平臺提供全流程支付通道及技術(shù)支持。此次合作不僅提升了平臺對百余家企業(yè)客戶的運營管理效率...

關(guān)鍵字: 一汽 智能化 BSP SAAS

深圳2025年9月8日 /美通社/ -- 晶泰科技(2228.HK)今日宣布,由其助力智擎生技制藥(PharmaEngine, Inc.)發(fā)現(xiàn)的新一代PRMT5抑制劑PEP0...

關(guān)鍵字: 泰科 AI MT BSP

上海2025年9月5日 /美通社/ -- 由上海市經(jīng)濟和信息化委員會、上海市發(fā)展和改革委員會、上海市商務委員會、上海市教育委員會、上海市科學技術(shù)委員會指導,東浩蘭生(集團)有限公司主辦,東浩蘭生會展集團上海工業(yè)商務展覽有...

關(guān)鍵字: 電子 BSP 芯片 自動駕駛

推進卓越制造,擴大產(chǎn)能并優(yōu)化布局 蘇州2025年9月5日 /美通社/ --?耐世特汽車系統(tǒng)與蘇州工業(yè)園區(qū)管委會正式簽署備忘錄,以設立耐世特亞太總部蘇州智能制造項目。...

關(guān)鍵字: 智能制造 BSP 汽車系統(tǒng) 線控

慕尼黑和北京2025年9月4日 /美通社/ -- 寶馬集團宣布,新世代首款量產(chǎn)車型BMW iX3將于9月5日全球首發(fā),9月8日震撼亮相慕尼黑車展。中國專屬版車型也將在年內(nèi)與大家見面,2026年在國內(nèi)投產(chǎn)。 寶馬集團董事...

關(guān)鍵字: 寶馬 慕尼黑 BSP 數(shù)字化

北京2025年9月4日 /美通社/ --?在全球新一輪科技革命與產(chǎn)業(yè)變革的澎湃浪潮中,人工智能作為引領(lǐng)創(chuàng)新的核心驅(qū)動力,正以前所未有的深度與廣度重塑各行業(yè)發(fā)展格局。體育領(lǐng)域深度融入科技變革浪潮,駛?cè)霐?shù)字化、智能化轉(zhuǎn)型快車...

關(guān)鍵字: 人工智能 智能體 AI BSP

上海2025年9月2日 /美通社/ -- 近日,由 ABB、Moxa(摩莎科技)等八家企業(yè)在上海聯(lián)合發(fā)起并成功舉辦"2025 Ethernet-APL 技術(shù)應用發(fā)展大會"。會議以"破界?融合...

關(guān)鍵字: ETHERNET 智能未來 BSP 工業(yè)通信
關(guān)閉