當前位置：首頁 > 嵌入式 > 嵌入式教程

基于ARM的高效C語言編程

時間：2010-09-27 04:26:46

關(guān)鍵字： ARM C語言編程 AD 函數(shù)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]基于ARM的高效C語言編程

引言

　　ARM處理器以其高性能、低功耗、低成本等優(yōu)勢被廣泛應(yīng)用于各種成功的32位嵌入式系統(tǒng)中。提高執(zhí)行速度和減小代碼尺寸是嵌入式軟件設(shè)計的關(guān)鍵需求。盡管大多數(shù)的ARM編譯器和調(diào)試器都帶有性能優(yōu)化工具，但是為了保證其正確性，編譯器必須是穩(wěn)妥和安全的，而且它還受到處理器自身結(jié)構(gòu)的限制。因此，編程人員必須在理解編譯器工作特點的基礎(chǔ)上來實現(xiàn)代碼優(yōu)化。代碼的優(yōu)化方法較多，本文針對函數(shù)優(yōu)化方法進行闡述。

　　1 函數(shù)局部變量的數(shù)據(jù)類型

　　局部變量包括函數(shù)內(nèi)局部變量、函數(shù)參數(shù)、函數(shù)返回值。由于ARM數(shù)據(jù)操作都是32位，即使數(shù)據(jù)本身只需要8位或16位，對于這三類局部變量也應(yīng)盡可能使用32位的數(shù)據(jù)類型int或lONg，以提高代碼執(zhí)行效率。下面以簡單求和函數(shù)為例進行分析。

　　函數(shù)add1計算包含10個字的數(shù)組array的累加和，add2與add1功能相同，只是將函數(shù)add1的參數(shù)array類型改為16位的short，函數(shù)內(nèi)局部變量i類型改為8位的char，sum改為16位的short。add1、add2的C源代碼如下：

　　int add1(int *array){

　　unsigned int i;

　　int sum=0;

　　for(i=0;i<10;i++)

　　sum=sum+array[i];

　　return sum;

　　}

　　short add2(short *array){

　　char i;

　　short sum=0;

　　for(i=0;i<10;i++)

　　sum= sum+array[i];

　　return sum;

　　}

　　add1經(jīng)編譯產(chǎn)生的匯編代碼：

　　add1

　　mov r2,r0

　　mov r0,#0

　　mov r1,#0

　　add1_loop

　　ldr r3,[r2,r1,lsl #2]

　　add r1,r1,#1

　　cmp r1,#0x0a

　　add r0,r3,r0

　　bcc add1_loop

　　mov pc,r14

　　add2經(jīng)編譯產(chǎn)生的匯編代碼：

　　add2

　　mov r2,r0

　　mov r0,#0

　　mov r1,#0

　　add2_loop[!--empirenews.page--]

　　add r3,[r2,r1,lsl #1];增加語句①

　　ldrh r3,[r3,#0]

　　add r1,r1,#1

　　and r1,r1,0xff;增加語句②

　　cmp r1,#0x0a

　　add r0,r3,r0

　　bcc add2_loop

　　mov r0,r0,lsl #16;增加語句③

　　mov r0,r0,asr #16;增加語句④

　　mov pc,r14

　　比較add1和add2兩個函數(shù)的匯編代碼，可以發(fā)現(xiàn)add2_loop循環(huán)比add1_loop循環(huán)增加了4條語句。

　　語句①：函數(shù)add2中變量sum為16位short類型，ARM指令中l(wèi)drh指令不支持移位地址偏移，因此增加add指令計算數(shù)組下標地址。

　　語句②：由于函數(shù)add2中循環(huán)變量i為8位的char類型，而ARM處理器的寄存器為32位，此語句用于處理循環(huán)變量累加過程中引起的溢出問題。即：當i累加到255時，再加1應(yīng)該為0,而不是256。

　　語句③、④：函數(shù)add2中返回結(jié)果sum為short類型，在返回前需將32位寄存器的前16位用符號位填充，即轉(zhuǎn)換為16位short類型。

　　2 函數(shù)局部變量的個數(shù)

　　為了加快程序的執(zhí)行速度，函數(shù)編譯時應(yīng)盡可能將局部變量都分配在寄存器中。*部變量多于可用的寄存器時，編譯器會將多余的變量壓入堆棧(即存入存儲器中)，因此必須控制局部變量的個數(shù)。

　　ARM處理器采用RISC結(jié)構(gòu)，帶有豐富的內(nèi)部寄存器。在編譯器使用apcs開關(guān)選項，即支持ATPCS(ARMThumb Procedure Call STandard)標準時，理論上有14個寄存器(R0～R12，R14)可以用來存放局部變量。但是實際上有些寄存器有自身特殊的用途，例如R9在與讀寫位置無關(guān)（RWPI）的編譯情況下作為靜態(tài)基址寄存器使用，R12作為子程序內(nèi)部調(diào)用的臨時過渡寄存器使用。ATPCS規(guī)則中的寄存器名稱及說明如表1所列。

表1 ATPCS規(guī)則中寄存器說明

　　因此，應(yīng)盡量限制局部變量的數(shù)目：①對于函數(shù)的參數(shù)個數(shù)應(yīng)控制在4個以內(nèi)，只有R0～R3可用來保存參數(shù)，當參數(shù)多于4個時將被壓入堆棧。如果由于實際應(yīng)用的需要，參數(shù)多于4個，也可以采用結(jié)構(gòu)體來組織參數(shù)，傳遞結(jié)構(gòu)體指針來實現(xiàn)。②函數(shù)內(nèi)部局部變量的個數(shù)應(yīng)控制在12個以內(nèi)（R0～R11），R12～R15都有特定用途。

　　3 函數(shù)內(nèi)代碼的編寫

　　3.1 循環(huán)代碼的編寫

　　循環(huán)的控制條件設(shè)為遞減到零的形式，可以減少指令條數(shù)。以求10個數(shù)的累加和為例進行分析。

　　代碼1：

　　int sum=0;

　　for(int i=0;i<10;i++)

　　sum=sum+i;

　　代碼2：

　　int sum=0;

　　for(int i=10;i!=0;i--)

　　sum=sum+i;[!--empirenews.page--]

　　匯編代碼1：

　　mov r0,#0

　　mov r1,#0

　　add1

　　add r1,r1,#1

　　cmp r1,#0x0a

　　add r0,r1,r0

　　bcc add1

　　匯編代碼2：

　　mov r0,#0

　　mov r1,#0x0a

　　add2

　　subs r1,r1,#1

　　add r0,r1,r0

　　bne add2

　　比較代碼1和代碼2，兩者的功能是相同的，但是代碼2在循環(huán)中少了1條指令。該循環(huán)的執(zhí)行次數(shù)為10次，即在執(zhí)行時共減少了10條指令。

　　3.2 內(nèi)聯(lián)函數(shù)的使用

　　當函數(shù)體代碼較少（通常只有一兩條語句），且又被經(jīng)常調(diào)用時，可將它設(shè)為內(nèi)聯(lián)函數(shù)（inline）。對內(nèi)聯(lián)函數(shù)的調(diào)用類似于宏定義的展開，因此沒有函數(shù)調(diào)用的開銷（即參數(shù)的傳遞和函數(shù)值的返回），只是增加了被調(diào)用函數(shù)的代碼量。

　　例如在嵌入式系統(tǒng)中，經(jīng)常訪問的外設(shè)端口的讀寫代碼就可以設(shè)成內(nèi)聯(lián)函數(shù)，以提高執(zhí)行效率。外設(shè)寄存器的讀寫函數(shù)如下：

　　inline unsigned short reg_read(unsigned short reg){

　　return (unsigned short)*(volatile unsigned short *)( reg);//外設(shè)寄存器的讀函數(shù)

　　}

　　inline void reg_write(unsigned short reg, unsigned short val){

　　*(volatile unsigned short *)(reg)=val;//外設(shè)寄存器的寫函數(shù)

　　}

　　這兩個函數(shù)的共同特點是：函數(shù)體的代碼很少，只有1個語句；使用的局部變量很少，只有1～2個參數(shù)。由于定義為內(nèi)聯(lián)函數(shù)，程序的可讀性較好；在執(zhí)行時由于沒有調(diào)用開銷，執(zhí)行效率較高；函數(shù)體很小，在被展開時空間開銷不大。

　　結(jié)語

　　由于嵌入式系統(tǒng)對存儲空間的限制和實時性的需求，在編寫代碼時必須采用相應(yīng)的方法和原則以減少代碼的空間開銷和時間開銷。代碼優(yōu)化需要花費時間，并且代碼優(yōu)化后將降低源代碼的可讀性。因此，只有對經(jīng)常被調(diào)用且對性能影響較大的函數(shù)進行優(yōu)化，才能最有效地優(yōu)化系統(tǒng)。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

3D封裝模型在PCB設(shè)計中有什么作用跟好處？

幾乎一直到DXP甚至后來的AD時代，3D封裝模型技術(shù)才開始慢慢日趨成熟，自此3D封裝的發(fā)展完美的解決了這個問題，3D封裝能夠讓我們在設(shè)計之前就能夠看到真實的3D模型，很多器件空間比如長寬高，甚至在一些中空的地方下面擺一些...

關(guān)鍵字： DXP AD 3D封裝

[產(chǎn)業(yè)新聞]

浪潮ARM架構(gòu)服務(wù)器NF5280R6：聚焦云游戲、大數(shù)據(jù)應(yīng)用場景優(yōu)化

北京2022年10月19日 /美通社/ -- 隨著云計算、大數(shù)據(jù)的普及發(fā)展，過去的"云"是服務(wù)于大企業(yè)的計算模型，而十多年過去了，越來越多的應(yīng)用及業(yè)務(wù)走上"云端"，對計算核心數(shù)需求...

關(guān)鍵字： ARM 大數(shù)據(jù) 云游戲 CPU

[Microchip]

Microchip推出基于Arm?的新型PIC?單片機系列產(chǎn)品，以更簡便方式添加Bluetooth?低功耗連接功能

無線連接已成為許多產(chǎn)品的必備功能，但往往會增加系統(tǒng)設(shè)計的成本和復(fù)雜性，因為它通常必須作為更大應(yīng)用的附加功能。Microchip Technology Inc.（美國微芯科技公司）今日推出首款基于Arm Cortex?-M...

關(guān)鍵字： Microchip ARM PIC

[Arm]

Arm生態(tài)系統(tǒng)為物聯(lián)網(wǎng)奠定信任根基

物聯(lián)網(wǎng)正在擴大規(guī)模并加速發(fā)展，進而驅(qū)動著全新的經(jīng)濟。而Arm生態(tài)系統(tǒng)正是這一巨大機遇背后的推動力。

關(guān)鍵字： ARM 物聯(lián)網(wǎng)

[消費電子]

據(jù)《金融時報》報道，低功耗芯片設(shè)計公司ARM已經(jīng)將其英國員工人數(shù)減少了20%

ARM公司是一家知識產(chǎn)權(quán)(IP)供應(yīng)商，它與一般的半導(dǎo)體公司最大的不同就是不制造芯片且不向終端用戶出售芯片，而是通過轉(zhuǎn)讓設(shè)計方案，由合作伙伴生產(chǎn)出各具特色的芯片。

關(guān)鍵字： ARM

[芯榜]

ARM年度宮斗大戲的背后 --- 美國CEO和中國的30億市場

2018年10月26日，深圳星河麗思卡爾頓酒店，ARM中國CEO吳雄昂在ARM年度技術(shù)論壇上對記者如是說，彼時的吳堅定，溫雅，意氣風(fēng)發(fā)。時隔兩年，ARM中國CEO吳雄昂再次回到媒體視線，這一次，ARM中國與來自投資方和劍...

關(guān)鍵字： ARM 芯片集成電路

[消費電子]

谷歌云發(fā)布ARM主機的消息傳來，推出采用Ampere處理器的Tau T2A實例

喜歡折騰主機的小伙伴一定都知道X86和ARM架構(gòu)的區(qū)別，前者在PC領(lǐng)域已經(jīng)統(tǒng)治了幾十年;后者則主要應(yīng)用于移動領(lǐng)域，尤其是近幾年，ARM的產(chǎn)品在終端應(yīng)用特別是手持終端應(yīng)用飛速發(fā)展。

關(guān)鍵字：國產(chǎn) ARM 主機

[openIC]

英偉達收購ARM遇阻，遭高通、谷歌、微軟高通聯(lián)合抵制

科技公司們認為，收購將使英偉達控制一個重要的供應(yīng)商，該供應(yīng)商向蘋果、英特爾、三星電子、亞馬遜和華為等公司授權(quán)基本的芯片技術(shù)，同時也向不計其數(shù)的中小技術(shù)企業(yè)提供授權(quán)。總部位于英國的ARM公司將芯片設(shè)計和相關(guān)軟件代碼授權(quán)給所...

關(guān)鍵字：英偉達 ARM 半導(dǎo)體公司

[openIC]