面試官:動(dòng)態(tài)內(nèi)存分配時(shí)需要注意哪些坑?我懵懵懵了
C 庫(kù)函數(shù) - malloc()
函數(shù)簡(jiǎn)介
malloc的全稱是memory allocation,中文叫動(dòng)態(tài)內(nèi)存分配,用于申請(qǐng)一塊連續(xù)的指定大小的內(nèi)存塊區(qū)域以void* 類型返回分配的內(nèi)存區(qū)域地址。
當(dāng)無(wú)法知道內(nèi)存具體位置的時(shí)候,想要綁定真正的內(nèi)存空間,就需要用到動(dòng)態(tài)的分配內(nèi)存,且分配的大小就是程序要求的大小。
函數(shù)的聲明
用來(lái)分配所需的內(nèi)存空間,并返回一個(gè)指向它的指針。
//參數(shù)??:size --?內(nèi)存塊的大小,以字節(jié)為單位
//返回值:指針?--?指向已分配大小的內(nèi)存
//???????NULL?--?如果請(qǐng)求失敗
void?*malloc(size_t?size)
介紹一下用法
#include?
#include?
#include?
int?main()
{
???char?*str;
?
???str?=?(char?*)?malloc(15);
???strcpy(str,?"hello?world");
???printf("String?=?%s,??Address?=?%u\n",?str,?str);
???free(str);
???return(0);
}
編譯結(jié)果如下,大家自行體會(huì)malloc的用法。
malloc的實(shí)現(xiàn)機(jī)制
當(dāng)我們了解了malloc的作用應(yīng)用范圍以及用法之后,我們先看看它是怎么實(shí)現(xiàn)內(nèi)存分配的,在此我們需要先了解幾個(gè)概念。
虛擬內(nèi)存地址與物理內(nèi)存地址
為了簡(jiǎn)單便捷,現(xiàn)代操作系統(tǒng)在匯編程序(或機(jī)器語(yǔ)言)層面,處理內(nèi)存地址時(shí),都是使用虛擬內(nèi)存地址。這樣每個(gè)進(jìn)程可以自己獨(dú)享一片2N字節(jié)的內(nèi)存,其中N是機(jī)器位數(shù)。例如在64位CPU和64位OS下,每個(gè)進(jìn)程的虛擬地址空間為2*64 Byte
。
虛擬地址的作用主要是簡(jiǎn)化程序的編寫及方便操作系統(tǒng)對(duì)進(jìn)程間內(nèi)存的隔離管理,由于在機(jī)器語(yǔ)言層面都是采用虛擬地址,操作系統(tǒng)會(huì)將虛擬內(nèi)存和實(shí)際的物理內(nèi)存進(jìn)行映射,CPU芯片上叫做存儲(chǔ)器管理單元(Memory Management Unit,MMU)的專用硬件,利用存放在主存中的查詢表來(lái)動(dòng)態(tài)翻譯虛擬地址,才能實(shí)現(xiàn)對(duì)真實(shí)內(nèi)存數(shù)據(jù)的操作。
頁(yè)與地址構(gòu)成
在現(xiàn)代操作系統(tǒng)是以頁(yè)(Page)為單位。一個(gè)內(nèi)存頁(yè)是一段固定大小的連續(xù)內(nèi)存地址的總稱。
內(nèi)存地址可以分為頁(yè)號(hào)和頁(yè)內(nèi)偏移量。下面以64位機(jī)器,4G物理內(nèi)存,4K頁(yè)大小為例,虛擬內(nèi)存地址和物理內(nèi)存地址的組成如下:
內(nèi)存地址構(gòu)成
上面是虛擬內(nèi)存地址,下面是物理內(nèi)存地址。由于頁(yè)大小都是4K,所以頁(yè)內(nèi)都是用低12位表示,而剩下的高地址表示頁(yè)號(hào)。
MMU映射單位并不是字節(jié),而是頁(yè),這個(gè)映射通過(guò)查一個(gè)常駐內(nèi)存的數(shù)據(jù)結(jié)構(gòu)頁(yè)表來(lái)實(shí)現(xiàn)。現(xiàn)在計(jì)算機(jī)具體的內(nèi)存地址映射比較復(fù)雜,為了加快速度會(huì)引入一系列緩存和優(yōu)化。下面給出一個(gè)經(jīng)過(guò)簡(jiǎn)化的內(nèi)存地址翻譯示意圖。
運(yùn)行時(shí)堆
在已經(jīng)映射的內(nèi)存空間結(jié)尾有一個(gè)break指針,這個(gè)指針下面是映射好的內(nèi)存,可以訪問(wèn),上面則是未映射的訪問(wèn),不能訪問(wèn)??梢酝ㄟ^(guò)系統(tǒng)調(diào)用sbrk(位移量)確定brk指針的位置,同時(shí)返回brk指針的位置,達(dá)到申請(qǐng)內(nèi)存的目。brk(void *addr)
系統(tǒng)調(diào)用可以直接將brk設(shè)置為某個(gè)地址,成功返回0,不成功返回-1。而rlimit則是限制進(jìn)程堆內(nèi)存容量的指針。
malloc內(nèi)存分配原理
malloc采用推進(jìn)brk指針來(lái)增加堆的有效區(qū)域來(lái)申請(qǐng)內(nèi)存空間分配內(nèi)存,維護(hù)一個(gè)內(nèi)存空閑鏈表,當(dāng)申請(qǐng)內(nèi)存空間時(shí),搜索內(nèi)存空閑鏈表,找到適配的空閑內(nèi)存空間,然后將空間分割成兩個(gè)內(nèi)存塊,一個(gè)變成分配塊,一個(gè)變成新的空閑塊。如果沒(méi)有搜索到,那么就會(huì)用sbrk()才推進(jìn)brk指針來(lái)申請(qǐng)內(nèi)存空間。
為什么避免使用
這其實(shí)要從malloc和free的設(shè)計(jì)上考慮,通常,它們是基于列表分配器算法將內(nèi)存池組織到單個(gè)鏈表中的連續(xù)位置,使用分配器來(lái)管理該鏈表,實(shí)際上就是尋找空閑位置。
但是在極端的safety-critical
系統(tǒng)中,malloc常常極其不可預(yù)測(cè),在多核系統(tǒng)上進(jìn)行多線程開(kāi)發(fā)時(shí)是個(gè)難題,具體有以下幾點(diǎn)。
內(nèi)存有限,多次申請(qǐng)不易管理
嵌入式的內(nèi)存就只有幾十K到幾百K,程序在運(yùn)行時(shí)向系統(tǒng)申請(qǐng)內(nèi)存使用,在使用完畢后,需要顯式的釋放,不然后果很嚴(yán)重,在多次申請(qǐng)復(fù)雜的邏輯開(kāi)發(fā)時(shí),這就要求程序員對(duì)動(dòng)態(tài)分配的內(nèi)存很了解
碎片
在c語(yǔ)言中的malloc進(jìn)行的動(dòng)態(tài)內(nèi)存分配和嵌入式系統(tǒng)中使用到堆區(qū)的內(nèi)存分配會(huì)產(chǎn)生內(nèi)存碎片,例如
char??*p;
if(p=char*?malloc(0)==NULL){
??printf("NULL\n");
}
else{
??printf("NOT??NULL");
}
實(shí)際上最終出現(xiàn)的并不是NULL
,而是NOT?NULL
這就說(shuō)明了進(jìn)行動(dòng)態(tài)內(nèi)存分配的時(shí)候產(chǎn)生了內(nèi)存碎片
-
內(nèi)部碎片的產(chǎn)生
所有的內(nèi)存分配必須起始于可被 4、或8 或16 整除的地址,或者因?yàn)镸MU的分頁(yè)機(jī)制的限制,決定內(nèi)存分配算法僅能把預(yù)定大小的內(nèi)存塊分配給客戶。
假設(shè)在請(qǐng)求一個(gè)17字節(jié)的內(nèi)存塊時(shí),它可能會(huì)獲得20字節(jié)、24字節(jié)等稍大一點(diǎn)的字節(jié),因此由所需的大小需要四舍五入,而產(chǎn)生的多余空間就叫內(nèi)部碎片。
-
外部碎片的產(chǎn)生
頻繁的分配與回收物理頁(yè)面會(huì)導(dǎo)致大量的、連續(xù)且小的頁(yè)面塊夾雜在已分配的頁(yè)面中間,就會(huì)產(chǎn)生外部碎片。
內(nèi)存泄漏
分配出去的內(nèi)存在使用之后沒(méi)有釋放掉,沒(méi)有回收,長(zhǎng)此以往,會(huì)造成沒(méi)有足夠的內(nèi)存可以分配。一般表現(xiàn)為運(yùn)行時(shí)間越長(zhǎng),占用的內(nèi)存越多,最終導(dǎo)致系統(tǒng)奔潰。
所以在進(jìn)行硬件內(nèi)存比較小的外圍開(kāi)發(fā)的時(shí)候,一定要避免內(nèi)存泄漏,合理的使用內(nèi)存空間,才能更好的發(fā)揮硬件的作用。
怎么解決
在繼續(xù)使用malloc和free的情況下
正確使用malloc函數(shù)分配內(nèi)存
在實(shí)際應(yīng)用中,我們可以試著把連續(xù)的大塊內(nèi)存按分區(qū)來(lái)管理。每個(gè)分區(qū)中包含整數(shù)個(gè)大小相同的內(nèi)存塊。如圖所示:
利用這種機(jī)制,就可以得到和釋放固定大小的內(nèi)存塊。這樣內(nèi)存的申請(qǐng)和釋放函數(shù)的執(zhí)行時(shí)間就是確定的了,但是特定的內(nèi)存塊在釋放時(shí),必須重新回到它原本屬于的內(nèi)存分區(qū)。
正確使用free函數(shù)釋放內(nèi)存
free函數(shù)其實(shí)就做了一件事:斬?cái)嘀羔樧兞亢瓦@塊內(nèi)存的對(duì)應(yīng)關(guān)系,在使用free(p)
函數(shù)內(nèi)存釋放后,指針變量p本身保存的地址并沒(méi)有改變,那我們必須需重新把p的值變?yōu)镹ULL:即p = NULL
自定義一套內(nèi)存分配器
盡量避免使用malloc時(shí),我們可以自定義一套本地線程內(nèi)存分配器,基于棧的分配器,以及基于本地線程的分配器,通過(guò)為每個(gè)線程分配特定的內(nèi)存池來(lái)避免沖突
最后
在嵌入式系統(tǒng)中,并不是說(shuō)不使用malloc()和free()管理內(nèi)存,而是說(shuō)在使用時(shí)需要讓我們的代碼更具預(yù)測(cè)性,避免不必要的未知bug產(chǎn)生。
往期推薦
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!