www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 單片機(jī) > CPP開發(fā)者
[導(dǎo)讀]Linux的內(nèi)存管理可謂是學(xué)好Linux的必經(jīng)之路,也是Linux的關(guān)鍵知識點(diǎn),有人說打通了內(nèi)存管理的知識,也就打通了Linux的任督二脈,這一點(diǎn)不夸張。有人問網(wǎng)上有很多Linux內(nèi)存管理的內(nèi)容,為什么還要看你這一篇,這正是我寫此文的原因,網(wǎng)上碎片化的相關(guān)知識點(diǎn)大都是東拼西湊,先...


Linux的內(nèi)存管理可謂是學(xué)好Linux的必經(jīng)之路,也是Linux的關(guān)鍵知識點(diǎn),有人說打通了內(nèi)存管理的知識,也就打通了Linux的任督二脈,這一點(diǎn)不夸張。有人問網(wǎng)上有很多Linux內(nèi)存管理的內(nèi)容,為什么還要看你這一篇,這正是我寫此文的原因,網(wǎng)上碎片化的相關(guān)知識點(diǎn)大都是東拼西湊,先不說正確性與否,就連基本的邏輯都沒有搞清楚,我可以負(fù)責(zé)任的說Linux內(nèi)存管理只需要看此文一篇就可以讓你入Linux內(nèi)核的大門,省去你東找西找的時(shí)間,讓你形成內(nèi)存管理知識的閉環(huán)。

文章比較長,做好準(zhǔn)備,深呼吸,讓我們一起打開Linux內(nèi)核的大門!

Linux內(nèi)存管理之CPU訪問內(nèi)存的過程

我喜歡用圖的方式來說明問題,簡單直接:

藍(lán)色部分是cpu,灰色部分是內(nèi)存,白色部分就是cpu訪問內(nèi)存的過程,也是地址轉(zhuǎn)換的過程。在解釋地址轉(zhuǎn)換的本質(zhì)前我們先理解下幾個(gè)概念:

  1. TLB:MMU工作的過程就是查詢頁表的過程。如果把頁表放在內(nèi)存中查詢的時(shí)候開銷太大,因此為了提高查找效率,專門用一小片訪問更快的區(qū)域存放地址轉(zhuǎn)換條目。(當(dāng)頁表內(nèi)容有變化的時(shí)候,需要清除TLB,以防止地址映射出錯。)
  2. Caches:cpu和內(nèi)存之間的緩存機(jī)制,用于提高訪問速率,armv8架構(gòu)的話上圖的caches其實(shí)是L2 Cache,這里就不做進(jìn)一步解釋了。

虛擬地址轉(zhuǎn)換為物理地址的本質(zhì)

我們知道內(nèi)核中的尋址空間大小是由CONFIG_ARM64_VA_BITS控制的,這里以48位為例,ARMv8中,Kernel Space的頁表基地址存放在TTBR1_EL1寄存器中,User Space頁表基地址存放在TTBR0_EL0寄存器中,其中內(nèi)核地址空間的高位為全1,(0xFFFF0000_00000000 ~ 0xFFFFFFFF_FFFFFFFF),用戶地址空間的高位為全0,(0x00000000_00000000 ~ 0x0000FFFF_FFFFFFFF)

有了宏觀概念,下面我們以內(nèi)核態(tài)尋址過程為例看下是如何把虛擬地址轉(zhuǎn)換為物理地址的。

我們知道linux采用了分頁機(jī)制,通常采用四級頁表,頁全局目錄(PGD),頁上級目錄(PUD),頁中間目錄(PMD),頁表(PTE)。如下:

  1. 從CR3寄存器中讀取頁目錄所在物理頁面的基址(即所謂的頁目錄基址),從線性地址的第一部分獲取頁目錄項(xiàng)的索引,兩者相加得到頁目錄項(xiàng)的物理地址。
  2. 第一次讀取內(nèi)存得到pgd_t結(jié)構(gòu)的目錄項(xiàng),從中取出物理頁基址取出,即頁上級頁目錄的物理基地址。
  3. 從線性地址的第二部分中取出頁上級目錄項(xiàng)的索引,與頁上級目錄基地址相加得到頁上級目錄項(xiàng)的物理地址。
  4. 第二次讀取內(nèi)存得到pud_t結(jié)構(gòu)的目錄項(xiàng),從中取出頁中間目錄的物理基地址。
  5. 從線性地址的第三部分中取出頁中間目錄項(xiàng)的索引,與頁中間目錄基址相加得到頁中間目錄項(xiàng)的物理地址。
  6. 第三次讀取內(nèi)存得到pmd_t結(jié)構(gòu)的目錄項(xiàng),從中取出頁表的物理基地址。
  7. 從線性地址的第四部分中取出頁表項(xiàng)的索引,與頁表基址相加得到頁表項(xiàng)的物理地址。
  8. 第四次讀取內(nèi)存得到pte_t結(jié)構(gòu)的目錄項(xiàng),從中取出物理頁的基地址。
  9. 從線性地址的第五部分中取出物理頁內(nèi)偏移量,與物理頁基址相加得到最終的物理地址。
  10. 第五次讀取內(nèi)存得到最終要訪問的數(shù)據(jù)。
整個(gè)過程是比較機(jī)械的,每次轉(zhuǎn)換先獲取物理頁基地址,再從線性地址中獲取索引,合成物理地址后再訪問內(nèi)存。不管是頁表還是要訪問的數(shù)據(jù)都是以頁為單位存放在主存中的,因此每次訪問內(nèi)存時(shí)都要先獲得基址,再通過索引(或偏移)在頁內(nèi)訪問數(shù)據(jù),因此可以將線性地址看作是若干個(gè)索引的集合。

Linux內(nèi)存初始化

有了armv8架構(gòu)訪問內(nèi)存的理解,我們來看下linux在內(nèi)存這塊的初始化就更容易理解了。

創(chuàng)建啟動頁表:

在匯編代碼階段的head.S文件中,負(fù)責(zé)創(chuàng)建映射關(guān)系的函數(shù)是create_page_tables。create_page_tables函數(shù)負(fù)責(zé)identity mapping和kernel image mapping。

  • identity map:是指把idmap_text區(qū)域的物理地址映射到相等的虛擬地址上,這種映射完成后,其虛擬地址等于物理地址。idmap_text區(qū)域都是一些打開MMU相關(guān)的代碼。
  • kernel image map:將kernel運(yùn)行需要的地址(kernel txt、rodata、data、bss等等)進(jìn)行映射。
arch/arm64/kernel/head.S:
ENTRY(stext)
????????bl??????preserve_boot_args
????????bl??????el2_setup???????????????????????//?Drop?to?EL1,?w0=cpu_boot_mode
????????adrp????x23,?__PHYS_OFFSET
????????and?????x23,?x23,?MIN_KIMG_ALIGN?-?1????//?KASLR?offset,?defaults?to?0
????????bl??????set_cpu_boot_mode_flag
????????bl??????__create_page_tables
????????/*
?????????*?The?following?calls?CPU?setup?code,?see?arch/arm64/mm/proc.S?for
?????????*?details.
?????????*?On?return,?the?CPU?will?be?ready?for?the?MMU?to?be?turned?on?and
?????????*?the?TCR?will?have?been?set.
?????????*/
????????bl??????__cpu_setup?????????????????????//?initialise?processor
????????b???????__primary_switch
ENDPROC(stext)
__create_page_tables主要執(zhí)行的就是identity map和kernel image map:

?__create_page_tables:
......
????????create_pgd_entry?x0,?x3,?x5,?x6
????????mov?????x5,?x3??????????????????????????//?__pa(__idmap_text_start)
????????adr_l???x6,?__idmap_text_end????????????//?__pa(__idmap_text_end)
????????create_block_map?x0,?x7,?x3,?x5,?x6

????????/*
?????????*?Map?the?kernel?image?(starting?with?PHYS_OFFSET).
?????????*/
????????adrp????x0,?swapper_pg_dir
????????mov_q???x5,?KIMAGE_VADDR? ?TEXT_OFFSET??//?compile?time?__va(_text)
????????add?????x5,?x5,?x23?????????????????????//?add?KASLR?displacement
????????create_pgd_entry?x0,?x5,?x3,?x6
????????adrp????x6,?_end????????????????????????//?runtime?__pa(_end)
????????adrp????x3,?_text???????????????????????//?runtime?__pa(_text)
????????sub?????x6,?x6,?x3??????????????????????//?_end?-?_text
????????add?????x6,?x6,?x5??????????????????????//?runtime?__va(_end)
????????create_block_map?x0,?x7,?x3,?x5,?x6
?......
其中調(diào)用create_pgd_entry進(jìn)行PGD及所有中間level(PUD, PMD)頁表的創(chuàng)建,調(diào)用create_block_map進(jìn)行PTE頁表的映射。關(guān)于四級頁表的關(guān)系如下圖所示,這里就不進(jìn)一步解釋了。

匯編結(jié)束后的內(nèi)存映射關(guān)系如下圖所示:

等內(nèi)存初始化后就可以進(jìn)入真正的內(nèi)存管理了,初始化我總結(jié)了一下,大體分為四步:

  1. 物理內(nèi)存進(jìn)系統(tǒng)前
  2. 用memblock模塊來對內(nèi)存進(jìn)行管理
  3. 頁表映射
  4. zone初始化

Linux是如何組織物理內(nèi)存的?

  • node目前計(jì)算機(jī)系統(tǒng)有兩種體系結(jié)構(gòu):
  1. 非一致性內(nèi)存訪問 NUMA(Non-Uniform Memory Access)意思是內(nèi)存被劃分為各個(gè)node,訪問一個(gè)node花費(fèi)的時(shí)間取決于CPU離這個(gè)node的距離。每一個(gè)cpu內(nèi)部有一個(gè)本地的node,訪問本地node時(shí)間比訪問其他node的速度快
  2. 一致性內(nèi)存訪問 UMA(Uniform Memory Access)也可以稱為SMP(Symmetric Multi-Process)對稱多處理器。意思是所有的處理器訪問內(nèi)存花費(fèi)的時(shí)間是一樣的。也可以理解整個(gè)內(nèi)存只有一個(gè)node。
  • zone
ZONE的意思是把整個(gè)物理內(nèi)存劃分為幾個(gè)區(qū)域,每個(gè)區(qū)域有特殊的含義

  • page
代表一個(gè)物理頁,在內(nèi)核中一個(gè)物理頁用一個(gè)struct page表示。

  • page frame
為了描述一個(gè)物理page,內(nèi)核使用struct page結(jié)構(gòu)來表示一個(gè)物理頁。假設(shè)一個(gè)page的大小是4K的,內(nèi)核會將整個(gè)物理內(nèi)存分割成一個(gè)一個(gè)4K大小的物理頁,而4K大小物理頁的區(qū)域我們稱為page frame

  • page frame num(pfn)
pfn是對每個(gè)page frame的編號。故物理地址和pfn的關(guān)系是:

物理地址>>PAGE_SHIFT = pfn

  • pfn和page的關(guān)系
內(nèi)核中支持了好幾個(gè)內(nèi)存模型:CONFIG_FLATMEM(平坦內(nèi)存模型)CONFIG_DISCONTIGMEM(不連續(xù)內(nèi)存模型)CONFIG_SPARSEMEM_VMEMMAP(稀疏的內(nèi)存模型)目前ARM64使用的稀疏的類型模式。

系統(tǒng)啟動的時(shí)候,內(nèi)核會將整個(gè)struct page映射到內(nèi)核虛擬地址空間vmemmap的區(qū)域,所以我們可以簡單的認(rèn)為struct page的基地址是vmemmap,則:

vmemmap pfn的地址就是此struct page對應(yīng)的地址。

Linux分區(qū)頁框分配器

頁框分配在內(nèi)核里的機(jī)制我們叫做分區(qū)頁框分配器(zoned page frame allocator),在linux系統(tǒng)中,分區(qū)頁框分配器管理著所有物理內(nèi)存,無論你是內(nèi)核還是進(jìn)程,都需要請求分區(qū)頁框分配器,這時(shí)才會分配給你應(yīng)該獲得的物理內(nèi)存頁框。當(dāng)你所擁有的頁框不再使用時(shí),你必須釋放這些頁框,讓這些頁框回到管理區(qū)頁框分配器當(dāng)中。

有時(shí)候目標(biāo)管理區(qū)不一定有足夠的頁框去滿足分配,這時(shí)候系統(tǒng)會從另外兩個(gè)管理區(qū)中獲取要求的頁框,但這是按照一定規(guī)則去執(zhí)行的,如下:

  • 如果要求從DMA區(qū)中獲取,就只能從ZONE_DMA區(qū)中獲取。
  • 如果沒有規(guī)定從哪個(gè)區(qū)獲取,就按照順序從 ZONE_NORMAL -> ZONE_DMA 獲取。
  • 如果規(guī)定從HIGHMEM區(qū)獲取,就按照順序從 ZONE_HIGHMEM -> ZONE_NORMAL -> ZONE_DMA 獲取。
內(nèi)核中根據(jù)不同的分配需求有6個(gè)函數(shù)接口來請求頁框,最終都會調(diào)用到__alloc_pages_nodemask。

struct?page?*
__alloc_pages_nodemask(gfp_t?gfp_mask,?unsigned?int?order,?int?preferred_nid,
???????nodemask_t?*nodemask)
{

??page?=?get_page_from_freelist(alloc_mask,?order,?alloc_flags,?
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計(jì)工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉