www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式教程
[導(dǎo)讀]函數(shù)設(shè)計(jì)的基本原則是使其函數(shù)體盡量的小。這樣編譯器可以對(duì)函數(shù)做更多的優(yōu)化。

14.9函數(shù)調(diào)用

函數(shù)設(shè)計(jì)的基本原則是使其函數(shù)體盡量的小。這樣編譯器可以對(duì)函數(shù)做更多的優(yōu)化。

14.9.1減少函數(shù)調(diào)用開銷

ARM上的函數(shù)調(diào)用開銷比非RISC體系結(jié)構(gòu)上的調(diào)用開銷小:

·調(diào)用返回指令“BL”或“MOVpc,lr”一般只需要6個(gè)指令周期(ARM7上)。

·在函數(shù)的入口和出口使用多寄存器加載/存儲(chǔ)指令LDM和STM(Thumb指令使用PUSH和POP)提高函數(shù)體的執(zhí)行效率。

ARM體系結(jié)構(gòu)過(guò)程調(diào)用標(biāo)準(zhǔn)AAPCS定義了如何通過(guò)寄存器傳遞參數(shù)和返回值。函數(shù)中的前4個(gè)整型參數(shù)是通過(guò)ARM的前4個(gè)寄存器r0、r1、r2和r3來(lái)傳遞的。傳遞參數(shù)可以是與整型兼容的數(shù)據(jù)類型,如字符類型char、半字類型short等。

注意

如果是雙字類型,如longlong型,只能通過(guò)寄存器傳遞兩個(gè)參數(shù)。

不能通過(guò)寄存器傳遞的參數(shù),通過(guò)函數(shù)堆棧來(lái)傳遞。這樣不論是函數(shù)的調(diào)用者還是被調(diào)用者都必須通過(guò)訪問(wèn)堆棧來(lái)訪問(wèn)參數(shù),使程序的執(zhí)行效率下降。

下面的例子顯示了函數(shù)調(diào)用是傳遞4個(gè)參數(shù)和多于4個(gè)參數(shù)的區(qū)別。

傳遞4個(gè)參數(shù)的函數(shù)調(diào)用源文件如下。

intfunc1(inta,intb,intc,intd)

{

returna+b+c+d;

}

intcaller1(void)

{

returnfunc1(1,2,3,4);

}

編譯的結(jié)果如下。

func1

ADDr0,r0,r1

ADDr0,r0,r2

ADDr0,r0,r3

MOVpc,lr

caller1

MOVr3,#4

MOVr2,#3

MOVr1,#2

MOVr0,#1

Bfunc1

如果程序需要傳遞6個(gè)參數(shù),變?yōu)槿缦滦问健?/p>

intfunc2(inta,intb,intc,intd,inte,intf)

{

returna+b+c+d+e+f;

}

intcaller2(void)

{

returnfunc1(1,2,3,4,5,6);

}

則編譯后的匯編文件如下。

func2

STRlr,[sp,#-4]!

ADDr0,r0,r1

ADDr0,r0,r2

ADDr0,r0,r3

LDMIBsp,{r12,r14}

ADDr0,r0,r12

ADDr0,r0,r14

LDRpc,{sp},#4

caller2

STMFDsp!,{r2,r3,lr}

MOVr3,#6

MOVr2,#5

STMIAsp,{r2,r3}

MOVr3,#4

MOVr2,#3

MOVr1,#2

MOVr0,#1

BLfunc2

LDMFDsp!,{r2,r3,pc}

綜上所述,為了在程序中高效的調(diào)用函數(shù),最好遵循以下規(guī)則。

·盡量限制函數(shù)的參數(shù),不要超過(guò)4個(gè),這樣函數(shù)調(diào)用的效率會(huì)更高。

·當(dāng)傳遞的參數(shù)超過(guò)4個(gè)時(shí),要將多個(gè)相關(guān)參數(shù)組織在一個(gè)結(jié)構(gòu)體中,用傳遞結(jié)構(gòu)體指針來(lái)代替多個(gè)參數(shù)。

·避免將傳遞的參數(shù)定義為longlong型,因?yàn)閭鬟f一個(gè)longlong型的數(shù)據(jù)將會(huì)占用兩個(gè)32位寄存器。

·函數(shù)中存在浮點(diǎn)運(yùn)算時(shí),避免使用double型參數(shù)。

14.9.2使用__value_in_regs返回結(jié)構(gòu)體

編譯選項(xiàng)__value_in_regs指示編譯器在整數(shù)寄存器中返回4個(gè)整數(shù)字的結(jié)構(gòu)或者在浮點(diǎn)寄存器中返回4個(gè)浮點(diǎn)型或雙精度型值,而不使用存儲(chǔ)器。

下面的例子顯示了__value_in_regs選項(xiàng)的用法。

typedefstruct{inthi;uintlo;}int64;//注意該結(jié)構(gòu)中,高位為有符號(hào)整數(shù),低位為無(wú)符號(hào)整數(shù)

__value_in_regsint64add64(int64x,int64y)

{int64res;

res.lo=x.lo+y.lo;

res.hi=x.hi+y.hi;

if(res.lo<y.lo)res.hi++;//carryfromlowword

returnres;

}

voidtest(void)

{int64a,b,c,sum;

a.hi=0x00000000;a.lo=0xF0000000;

b.hi=0x00000001;b.lo=0x10000001;

sum=add64(a,b);

c.hi=0x00000002;c.lo=0xFFFFFFFF;

sum=add64(sum,c);

}

編譯后的結(jié)果如下所示。

add64

ADDSa2,a2,a4

ADCa1,a3,a1

MOVpc,lr

test

STMDBsp!,{lr}

MOVa1,#0

MOVa2,#&f0000000

MOVa3,#1

MOVa4,#&10000001

BLadd64

MOVa3,#2

MVNa4,#0

LDMIAsp!,{lr}

Badd64

當(dāng)使用__value_in_regs定義結(jié)構(gòu)體時(shí),編譯的代碼大小為52字節(jié),如果不使用__value_in_regs選項(xiàng),則編譯出的結(jié)果為160字節(jié)(本書中沒(méi)有列出未使用__value_in_regs時(shí)的編譯結(jié)果,讀者有興趣可以自己上機(jī)試驗(yàn))。

14.9.3葉子函數(shù)

所謂葉子函數(shù)(leaffunction)就是在其函數(shù)體內(nèi)不存在對(duì)其他函數(shù)調(diào)用,它也常被稱為終級(jí)函數(shù)。因?yàn)槿~子函數(shù)不需要調(diào)用其他函數(shù),所有沒(méi)有保存/恢復(fù)寄存器的操作,因此執(zhí)行效率比一般函數(shù)要高。

當(dāng)函數(shù)中必須對(duì)一些寄存器進(jìn)行保存時(shí),可以使用高效率的多寄存器存儲(chǔ)指令STM,對(duì)需要保存的寄存器內(nèi)存一次性存儲(chǔ)。

正是由于葉子函數(shù)執(zhí)行的高效性,所以在編程時(shí),盡量將子程序編寫為葉子函數(shù),這樣即使程序中多次調(diào)用也不會(huì)影響代碼性能。

為了高效的調(diào)用函數(shù),可以遵循下面函數(shù)調(diào)用原則。

·避免在被頻繁調(diào)用的函數(shù)中調(diào)用其他函數(shù),以保證被頻繁調(diào)用的函數(shù)被編譯器編譯為葉子函數(shù)。

·把比較小的被調(diào)用函數(shù)和調(diào)用函數(shù)放在同一個(gè)源文件中,并且要先定義后調(diào)用,編譯器就可以優(yōu)化函數(shù)調(diào)用或內(nèi)聯(lián)較小的函數(shù)。

·對(duì)性能影響較大的重要函數(shù)可使用關(guān)鍵字_inline進(jìn)行內(nèi)聯(lián)。

14.9.4嵌套優(yōu)化

注意

嵌套優(yōu)化(Tail-Calloptimization)只適用于armcc。編譯時(shí)如果使用-g或-debug選項(xiàng),編譯器自動(dòng)關(guān)閉該功能。

一個(gè)函數(shù)如果在其結(jié)束時(shí)調(diào)用了另一個(gè)函數(shù),則編譯器使用B指令調(diào)轉(zhuǎn)到被調(diào)用函數(shù),而非BL指令。這樣就避免了一級(jí)不必要的函數(shù)返回。圖14.3顯示了嵌套優(yōu)化的調(diào)用過(guò)程。

圖14.3嵌套優(yōu)化函數(shù)調(diào)用過(guò)程

當(dāng)編譯時(shí)使用-O1或-O2選項(xiàng)時(shí),編譯器都執(zhí)行這種嵌套優(yōu)化。需要注意的是,當(dāng)函數(shù)中引用了局部變量地址,由于指針別名問(wèn)題的影響,即使函數(shù)在返回時(shí)調(diào)用了其他函數(shù),編譯器也不會(huì)使用嵌套優(yōu)化。

下面通過(guò)一個(gè)例子來(lái)分析嵌套優(yōu)化是如何提高代碼執(zhí)行效率的。

externintfunc2(int);

intfunc1(inta,intb)

{if(a>b)

return(func2(a-b));

else

return(func2(b-a));

}

編譯后的代碼如下所示。

func1

CMPa1,a2

SUBLEa1,a2,a1

SUBGTa1,a1,a2

Bfunc2

首先,func1中使用B指令代替BL指令,不用擔(dān)心lr寄存器被破壞,減少了對(duì)寄存器壓棧保護(hù)操作。另外,程序直接從func2返回到調(diào)用func1的函數(shù),減少一次函數(shù)返回。如果說(shuō)正常的指令調(diào)用過(guò)程為:

BL+BL+MOVpc,lr+MOVpc,lr

那么經(jīng)過(guò)嵌套優(yōu)化的函數(shù)調(diào)用過(guò)程就可以表示為:

BL+BL+MOVpc,lr

這樣,總的開銷將減少25%。

14.9.5單純子函數(shù)

所謂單純子函數(shù)(PureFunctions)是指那些函數(shù)返回值只和調(diào)用參數(shù)有關(guān)。換句話說(shuō),就是如果調(diào)用函數(shù)的參數(shù)相同,那么函數(shù)的返回結(jié)果也相同。如果程序中存在這樣的函數(shù),可以在函數(shù)定義時(shí)使用_pure進(jìn)行聲明,這樣在程序編譯時(shí)編譯器會(huì)根據(jù)函數(shù)的調(diào)用情況對(duì)其進(jìn)行優(yōu)化。

下面的例子顯示了當(dāng)函數(shù)用_pure聲明時(shí),編譯器對(duì)其所做的優(yōu)化。

程序源碼文件如下。

intsquare(intx)

{

returnx*x;

}

intf(intn)

{

returnsquare(n)+square(n)

}

編譯后的結(jié)果如下。

square

MOVa2,a1

MULa1,a2,a2

MOVpc,lr

f

STMDBsp!,{lr}

MOVa3,a1

BLsquare

MOVa4,a1

MOVa1,a3

BLsquare

ADDa1,a4,a1

LDMIAsp!,{pc}

上面的程序中,square函數(shù)為“單純子函數(shù)”,當(dāng)使用_pure聲明該函數(shù)時(shí)編譯器在調(diào)用該函數(shù)時(shí),將對(duì)程序進(jìn)行優(yōu)化。

聲明的方法和編譯后的結(jié)果如下所示。

__pureintsquare(intx)

{

returnx*x;

}

f

STMDBsp!,{lr}

BLsquare

MOVa1,a1,LSL#1

LDMIAsp!,{pc}

從編譯后的代碼中可以看到,用_pure聲明的函數(shù)在f函數(shù)中只調(diào)用了一次。

雖然“單純子函數(shù)”可以提高代碼執(zhí)行效率,但同時(shí)也會(huì)帶來(lái)一些負(fù)面影響。比如,在“單純子函數(shù)”中,不能直接或間接訪問(wèn)內(nèi)存地址。所以在程序中使用“單純子函數(shù)”時(shí)要特別小心。

另外,還可以使用#pragma聲明“單純子函數(shù)”,下面的代碼顯示了它的聲明過(guò)程。

#pragmano_side_effects

/*functiondefinition*/

#pragmaside_effects

14.9.6內(nèi)嵌函數(shù)

ARM編譯器支持函數(shù)內(nèi)嵌功能。使用關(guān)鍵字“_inline”聲明函數(shù),可以使函數(shù)內(nèi)嵌。下面的例子顯示了如何使用函數(shù)內(nèi)嵌功能。

程序源文件如下。

__inlineintsquare(intx)

{

returnx*x;

}

#include<math.h>

doublelength(intx,inty)

{

returnsqrt(square(x)+square(y));

}

編譯結(jié)果如下所示。

length

STMDBsp!,{lr}

MULa3,a1,a1

MLAa1,a2,a2,a3

BL_dflt

LDMIAsp!,{lr}

Bsqrt

使用函數(shù)內(nèi)嵌有以下好處:

·減少了函數(shù)調(diào)用開銷(如寄存器的壓棧保護(hù));

·減少了參數(shù)傳遞開銷;

·進(jìn)一步提高了編譯器對(duì)代碼優(yōu)化的可能性(如編譯器可將ADD和MUL指令合并為一條MLA指令)。

但使用函數(shù)內(nèi)嵌將增加代碼尺寸。也正是處于這種原因,armcc和tcc都沒(méi)有提供函數(shù)自動(dòng)內(nèi)嵌的編譯選項(xiàng)。

一般來(lái)說(shuō),只有對(duì)性能影響較大的重要函數(shù)才使用關(guān)鍵字_inline進(jìn)行內(nèi)嵌。

14.9.7函數(shù)定義

使用函數(shù)時(shí)要先定義后調(diào)用是ARM編程的基本規(guī)則之一。在函數(shù)調(diào)用之前定義函數(shù),編譯器可以檢查被調(diào)用函數(shù)的寄存器使用情況,從而對(duì)其進(jìn)行進(jìn)一步的優(yōu)化。

首先來(lái)看下面的例子。

intsquare(intx);

intsumsquares1(intx,inty)

{

returnsquare(x)+square(y);

}

/*square函數(shù)可以在本文件中定義,也可以在其他源文件中定義*/

intsquare(intx)

{

returnx*x;

}

intsumsquares2(intx,inty)

{

returnsquare(x)+square(y);

}

編譯的結(jié)果如下所示。

sumsquares1

STMDBsp!,{v1,v2,lr}

MOVv1,a2

BLsquare

MOVv2,a1

MOVa1,v1

BLsquare

ADDa1,v2,a1

LDMIAsp!,{v1,v2,pc}

square

MOVa2,a1

MULa1,a2,a2

MOVpc,lr

sumsquares2

STMDBsp!,{lr}

MOVa3,a2

BLsquare

MOVa4,a1

MOVa1,a3

BLsquare

ADDa1,a4,a1

LDMIAsp!,{pc}

從編譯的結(jié)果可以看出,將square函數(shù)定義放在sumsquares函數(shù)前,編譯器可以判斷寄存器a3和a4并未使用,所有在調(diào)用函數(shù)入口處并未將其壓棧。這樣,減少了內(nèi)存訪問(wèn),提高了代碼執(zhí)行效率。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問(wèn)題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問(wèn)題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問(wèn)題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來(lái)解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉