圖解Linux是如何進(jìn)行函數(shù)調(diào)用的?
先拋出幾個(gè)問(wèn)題:
進(jìn)程虛擬地址空間是如何分布的?
函數(shù)調(diào)用的棧幀結(jié)構(gòu)是什么樣子?
函數(shù)調(diào)用涉及到的寄存器都起了什么作用?
函數(shù)參數(shù)是如何傳遞的?傳遞順序如何?
函數(shù)的返回值是如何傳遞的?
如果您對(duì)上述問(wèn)題有些困惑,請(qǐng)繼續(xù)往下看吧!
進(jìn)程的內(nèi)存布局
如圖:
高地址的一部分空間會(huì)分配給內(nèi)核,稱為內(nèi)核空間,剩下的內(nèi)存空間給用戶使用,稱為用戶空間。
用戶空間中有幾個(gè)主要的內(nèi)存區(qū)域:
棧:用于維護(hù)函數(shù)調(diào)用的上下文,離開(kāi)了棧,函數(shù)調(diào)用就沒(méi)法實(shí)現(xiàn),棧通常在用戶空間的最高地址處分配,通常有數(shù)兆字節(jié)的大小。
堆:堆用來(lái)容納程序動(dòng)態(tài)分配的內(nèi)存區(qū)域,程序中malloc或new分配的內(nèi)存就來(lái)自堆里。堆通常存在于棧的下方(低地址方向),在某些時(shí)候,堆也可能沒(méi)有固定統(tǒng)一的存儲(chǔ)區(qū)域,堆一般比棧大很多,可以有百兆甚至幾G的大小。
動(dòng)態(tài)鏈接庫(kù)映射區(qū):這個(gè)區(qū)域用于映射裝載的動(dòng)態(tài)鏈接庫(kù),Linux下如果可執(zhí)行文件依賴其它共享庫(kù),那系統(tǒng)就會(huì)在這個(gè)區(qū)域分配相應(yīng)空間,并將共享庫(kù)裝入該空間。
可執(zhí)行文件映像:存儲(chǔ)著可執(zhí)行文件在內(nèi)存里的映像,由裝載器在裝載時(shí)將可執(zhí)行文件的內(nèi)存讀取或映射到這里。
保留區(qū):保留區(qū)并不是一個(gè)單一的內(nèi)存區(qū)域,而是堆內(nèi)存中受到保護(hù)而禁止訪問(wèn)的內(nèi)存區(qū)域的總稱,例如在大多數(shù)操作系統(tǒng)里,極小的地址通常都是不允許訪問(wèn)的,如NULL,通常C語(yǔ)言將無(wú)效地址賦值為0也是出于這個(gè)考慮,因?yàn)?地址正常情況下不可能有有效的可訪問(wèn)數(shù)據(jù)。
函數(shù)調(diào)用的棧幀結(jié)構(gòu)
我們都知道函數(shù)調(diào)用都是以棧幀為單位,機(jī)器通常用棧來(lái)傳遞函數(shù)參數(shù)、保存返回地址、保存寄存器(即函數(shù)調(diào)用的上下文)及存儲(chǔ)本地局部變量等。
一個(gè)單獨(dú)的棧幀結(jié)構(gòu)如圖所示:
為單個(gè)函數(shù)調(diào)用分配的那部分棧稱為棧幀,棧幀的邊界由兩個(gè)指針界定:寄存器%ebp為幀指針,指向當(dāng)前棧幀的起始處,通常較為固定;寄存器%esp為棧指針,指向當(dāng)前棧幀的棧頂位置,當(dāng)程序執(zhí)行時(shí),棧指針可以移動(dòng),因此大多數(shù)數(shù)據(jù)的訪問(wèn)都是相對(duì)于幀指針的。
一次函數(shù)調(diào)用的棧幀圖如下:
寄存器使用約定
直接看圖:
圖片來(lái)源于網(wǎng)絡(luò),侵權(quán)刪
上圖表達(dá)的應(yīng)該已經(jīng)很清楚啦,簡(jiǎn)單示例解釋一下,函數(shù)調(diào)用需要傳遞參數(shù)時(shí),第一個(gè)參數(shù)存到%edi里,第二個(gè)參數(shù)會(huì)存到%esi里,如果有返回值會(huì)存到%eax里,這里如果是64位的返回值,會(huì)使用%rax。
函數(shù)的調(diào)用約定
這里主要涉及三種約定:
函數(shù)參數(shù)的傳遞順序和方式:這里可以有很多參數(shù)傳遞方式,棧傳遞和寄存器傳遞,函數(shù)的調(diào)用方將參數(shù)壓入棧中,函數(shù)自己再?gòu)臈V袑?shù)取出,需要規(guī)定壓棧的順序,是從左到右,還是從右到左,有的也使用寄存器傳遞,這都需要約定好。
棧的維護(hù)方式:在函數(shù)將參數(shù)壓棧后,函數(shù)體會(huì)被調(diào)用,此后需要將被壓入棧中的參數(shù)全部彈出,以使得棧在函數(shù)調(diào)用前后保持一致,這個(gè)彈出的工作可以是由函數(shù)的調(diào)用方完成還是函數(shù)本身來(lái)完成需要約定好。
名字修飾策略:為了鏈接的時(shí)候?qū)φ{(diào)用約定進(jìn)行區(qū)分,需要對(duì)函數(shù)本身的名字進(jìn)行修飾,不同的調(diào)用約定有不同的名字修飾策略。一般都是前面加個(gè)下劃線。
C語(yǔ)言默認(rèn)的調(diào)用約定是cdecl方式,可以通過(guò)__attribute__((cdecl))標(biāo)明使用cdecl約定,其實(shí)還有其它一些調(diào)用約定,如圖:
函數(shù)的返回值傳遞
這里有幾種情況:
4字節(jié):當(dāng)函數(shù)返回值是4個(gè)字節(jié)會(huì)通過(guò)%eax寄存器作為通道,函數(shù)將返回值存儲(chǔ)在%eax中,返回后函數(shù)的調(diào)用方再讀取%eax。
5-8個(gè)字節(jié):通過(guò)rax寄存器作為通道。
大于8個(gè)字節(jié):以如下代碼舉例:
struct A {
// ...大于8字節(jié)
};
A func() {
A b;
return b;
}
A x = func();
返回值傳遞方式如圖:
調(diào)用函數(shù)首先在棧上額外開(kāi)辟一片空間,作為臨時(shí)對(duì)象(temp)
temp作為隱藏參數(shù)傳遞給被調(diào)用函數(shù)
函數(shù)將數(shù)據(jù)拷貝給temp,同時(shí)%eax為指向temp的指針
返回返回后將%eax指向的temp拷貝回被賦予的對(duì)象
返回值類(lèi)型的尺寸太大導(dǎo)致函數(shù)返回時(shí),會(huì)開(kāi)辟一段區(qū)域作為中介,返回值對(duì)象會(huì)被拷貝兩次,而C++在有些情況下會(huì)做返回值優(yōu)化,減少拷貝的次數(shù),具體可以看我之前的文章:左值引用、右值引用、移動(dòng)語(yǔ)義、完美轉(zhuǎn)發(fā),你知道的不知道的都在這里
參考資料
https://blog.csdn.net/slvher/article/details/8831885
https://blog.csdn.net/slvher/article/details/8831983
https://www.cnblogs.com/alantu2018/p/8465904.html
https://mp.weixin.qq.com/s/fpf4qRRLN3wVDUrWka3HfQ
https://mp.weixin.qq.com/s/j7SKtrMCmYs6g8yH75OH4A
https://www.sec4.fun/2018/05/29/stack/
https://murphypei.github.io/blog/2019/01/linux-heap
https://cloud.tencent.com/developer/article/1515763
《程序員的自我修養(yǎng):鏈接裝載與庫(kù)》
-END-
推薦閱讀
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!