www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 公眾號(hào)精選 > strongerHuang
[導(dǎo)讀]這篇文章主要討論的是操作系統(tǒng)層面上對(duì)于進(jìn)程、線程的創(chuàng)建初始化等行為,而像Python、Java等基于解釋器、虛擬機(jī)的語言,如何進(jìn)入到main函數(shù)執(zhí)行,這背后的路徑則更長(zhǎng)(包含了解釋器和虛擬機(jī)內(nèi)部的執(zhí)行流程),以后有機(jī)會(huì)再討論。所以這里就重點(diǎn)關(guān)注C/C++這類native語言的main函數(shù)是如何進(jìn)入的。

關(guān)注+星標(biāo)公眾號(hào),不錯(cuò)過精彩內(nèi)容

作者 | 軒轅之風(fēng)
轉(zhuǎn)自 | 編程技術(shù)宇宙

首先先劃定一下這個(gè)問題的討論范圍:C/C++語言

這篇文章主要討論的是操作系統(tǒng)層面上對(duì)于進(jìn)程、線程的創(chuàng)建初始化等行為,而像Python、Java等基于解釋器、虛擬機(jī)的語言,如何進(jìn)入到main函數(shù)執(zhí)行,這背后的路徑則更長(zhǎng)(包含了解釋器和虛擬機(jī)內(nèi)部的執(zhí)行流程),以后有機(jī)會(huì)再討論。所以這里就重點(diǎn)關(guān)注C/C++這類native語言的main函數(shù)是如何進(jìn)入的。

本文會(huì)兼顧敘述LinuxWindows兩個(gè)主要平臺(tái)上的詳細(xì)流程。

創(chuàng)建進(jìn)程

第一步,創(chuàng)建進(jìn)程。

在Linux上,我們要啟動(dòng)一個(gè)新的進(jìn)程,一般通過fork + exec系列函數(shù)來實(shí)現(xiàn),前者將當(dāng)前進(jìn)程“分叉”出一個(gè)孿生子進(jìn)程,后者負(fù)責(zé)替換這個(gè)子進(jìn)程的執(zhí)行文件,來執(zhí)行子進(jìn)程的新程序文件。

這里的fork、exec系列函數(shù),是操作系統(tǒng)提供給應(yīng)用程序的API函數(shù),在其內(nèi)部最終都會(huì)通過系統(tǒng)調(diào)用,進(jìn)入操作系統(tǒng)內(nèi)核,通過內(nèi)核中的進(jìn)程管理機(jī)制,來完成一個(gè)進(jìn)程的創(chuàng)建。

操作系統(tǒng)內(nèi)核將負(fù)責(zé)進(jìn)程的創(chuàng)建,主要有下面幾個(gè)工作要做:

  • 創(chuàng)建內(nèi)核中用于描述進(jìn)程的數(shù)據(jù)結(jié)構(gòu),在Linux上是 task_struct
  • 創(chuàng)建新進(jìn)程的頁目錄、頁表,用于構(gòu)建新進(jìn)程的內(nèi)存地址空間

在Linux內(nèi)核中,由于歷史原因,Linux內(nèi)核早期并沒有線程的概念,而是用任務(wù):task_struct來描述一個(gè)程序的執(zhí)行實(shí)例:進(jìn)程

在內(nèi)核中,一個(gè)任務(wù)對(duì)應(yīng)就是一個(gè)task_struct,也就是一個(gè)進(jìn)程,內(nèi)核的調(diào)度單元也是一個(gè)個(gè)的個(gè)task_struct

后來,多線程的概念興起,Linux內(nèi)核為了支持多線程技術(shù),task_struct實(shí)際上表示的變成了一個(gè)線程,通過將多個(gè)task_struct合并為一組(通過該結(jié)構(gòu)內(nèi)部的組id字段)再來描述一個(gè)進(jìn)程。因此,Linux上的線程,也稱為輕量級(jí)進(jìn)程

系統(tǒng)調(diào)用fork的一個(gè)重要使命就是要去創(chuàng)建新進(jìn)程的task_struct結(jié)構(gòu),創(chuàng)建完成后,進(jìn)程就擁有了調(diào)度單元。隨后將開始可以參與調(diào)度并有機(jī)會(huì)獲得執(zhí)行。

加載可執(zhí)行文件

通過fork成功創(chuàng)建進(jìn)程后,此時(shí)的子進(jìn)程和父進(jìn)程相當(dāng)于一個(gè)細(xì)胞進(jìn)行了有絲分裂,兩個(gè)進(jìn)程“幾乎”是一模一樣的。

而要想子進(jìn)程執(zhí)行新的程序,在子進(jìn)程中還需要用到exec系列函數(shù)來實(shí)現(xiàn)對(duì)進(jìn)程可執(zhí)行程序的替換。

exec系列函數(shù)同樣是系統(tǒng)調(diào)用的封裝,通過調(diào)用它們,將進(jìn)入內(nèi)核sys_execve來執(zhí)行真正的工作。

這個(gè)工作細(xì)節(jié)比較多,其中有一個(gè)重要的工作就是加載可執(zhí)行文件到進(jìn)程空間并對(duì)其進(jìn)行分析,提取出可執(zhí)行文件的入口地址。

我們使用C、C++等高級(jí)語言編寫的代碼,最終通過編譯器會(huì)編譯生成可執(zhí)行文件,在Linux上,是ELF格式,在Windows上,稱之為PE文件。

無論是ELF文件還是PE文件,在各自的文件頭中,都記錄了這個(gè)可執(zhí)行文件的指令入口地址,它指示了程序該從哪里開始執(zhí)行。

這個(gè)入口指向哪里,是我們的main函數(shù)嗎?這里賣一個(gè)關(guān)子,先來解決在這之前的一個(gè)問題:進(jìn)程創(chuàng)建后,是如何來到這個(gè)入口地址的?

不管在Windows還是Linux上,應(yīng)用線程都會(huì)經(jīng)常在用戶空間和內(nèi)核空間來回穿梭,這可能出現(xiàn)在以下幾種情況發(fā)生時(shí):

  • 系統(tǒng)調(diào)用
  • 中斷
  • 異常

從內(nèi)核返回時(shí),線程是如何知道自己從哪里進(jìn)來的,該回到應(yīng)用空間的哪里去繼續(xù)執(zhí)行呢?

答案是,在進(jìn)入內(nèi)核空間時(shí),線程將自動(dòng)保存上下文(其實(shí)就是一些寄存器的內(nèi)容,比如指令寄存器EIP)到線程的堆棧上,記錄自己從哪里來的,等到從內(nèi)核返回時(shí),再從堆棧上加載這些信息,回到原來的地方繼續(xù)執(zhí)行。

前面提到,子進(jìn)程是通過sys_execve系統(tǒng)調(diào)用進(jìn)入到內(nèi)核中的,在后面完成可執(zhí)行文件的分析后,拿到了ELF文件的入口地址,將會(huì)去修改原來保存在堆棧上的上下文信息,將EIP指向ELF文件的入口地址。這樣等sys_execve系統(tǒng)調(diào)用結(jié)束時(shí),返回到用戶空間后,就能夠直接轉(zhuǎn)到新的程序入口開始執(zhí)行代碼。

所以,一個(gè)非常重要的特點(diǎn)是:exec系列函數(shù)正常情況下是不會(huì)返回的,一旦進(jìn)入,完成使命后,執(zhí)行流程就會(huì)轉(zhuǎn)向新的可執(zhí)行文件入口

另外需要提一下的是,在Linux上,除了ELF文件,還支持一些其他格式的可執(zhí)行文件,如MS-DOS、COFF

除了二進(jìn)制的可執(zhí)行文件,還支持shell腳本,這個(gè)情況下將會(huì)將腳本解釋器程序作為入口來啟動(dòng)

從ELF入口到main函數(shù)

上面交代了,一個(gè)新的進(jìn)程,是如何執(zhí)行到可執(zhí)行文件的入口地址的。

同時(shí)也留了一個(gè)問題,這個(gè)入口地址是什么?是我們的main函數(shù)嗎?

這里有一個(gè)簡(jiǎn)單的C程序,運(yùn)行起來后輸出經(jīng)典的hello world:

#include?
int?main()?{
????printf("hello,?world!\n");
????return?0;
}

通過gcc編譯后,生成了一個(gè)ELF可執(zhí)行文件,通過readelf指令,可以實(shí)現(xiàn)對(duì)ELF文件的分析,這里可以看到ELF文件的入口地址是0x400430:

隨后,我們通過反匯編神器,IDA打開分析這個(gè)文件,看一下位于0x400430入口的地方是什么函數(shù)?

可以看到,入口地方是一個(gè)叫做 _start 的函數(shù),并不是我們的main函數(shù)。

在_start的結(jié)尾,調(diào)用了 __libc_start_main 函數(shù),而這個(gè)函數(shù),位于libc.so中。

你可能疑惑,這個(gè)函數(shù)是哪里冒出來的,我們的代碼中并沒有用到它呢?

其實(shí),在進(jìn)入main函數(shù)之前,還有一個(gè)重要的工作要做,這就是:C/C++運(yùn)行時(shí)庫的初始化。上面的 __libc_start_main 就是在完成這一工作。

在通過GCC進(jìn)行編譯時(shí),編譯器將自動(dòng)完成運(yùn)行時(shí)庫的鏈接,將我們的main函數(shù)封裝起來,由它來調(diào)用。

glibc是開源的,我們可以在GitHub上找到這個(gè)項(xiàng)目的libc-start.c文件,一窺 __libc_start_main 的真面目,我們的main函數(shù)正是被它在調(diào)用。

完整流程

到這里,我們梳理了,從進(jìn)程創(chuàng)建fork,到通過exec系列函數(shù)完成可執(zhí)行文件的替換,再到執(zhí)行流程進(jìn)入到ELF文件的入口,再到我們的main函數(shù)的完整流程。

Windows上的一些區(qū)別

下面簡(jiǎn)單介紹下Windows上這一流程的一些差異。

首先是創(chuàng)建進(jìn)程的環(huán)節(jié),Windows系統(tǒng)將fork+exec兩步合并了一步,通過CreateProcess系列函數(shù)一步到位,在其參數(shù)中指定子進(jìn)程的可執(zhí)行文件路徑。

不同于Linux上進(jìn)程和線程的邊界模糊,在Windows操作系統(tǒng)上,內(nèi)核是有明確的進(jìn)程和線程概念定義,進(jìn)程用EPROCESS結(jié)構(gòu)表示,線程用ETHREAD結(jié)構(gòu)表示。

所以在Windows上,進(jìn)程相關(guān)的工作準(zhǔn)備就緒后,還需要單獨(dú)創(chuàng)建一個(gè)參與內(nèi)核調(diào)度的執(zhí)行單元,也就是進(jìn)程中的第一個(gè)線程:主線程。當(dāng)然,這個(gè)工作也封裝在了CreateProcess系列函數(shù)中了。

新進(jìn)程的主線程創(chuàng)建完成后,便開始參與系統(tǒng)調(diào)度了。主線程從哪里開始執(zhí)行呢??jī)?nèi)核在創(chuàng)建時(shí)就明確進(jìn)行了指定:nt!KiThreadStartup,這是一個(gè)內(nèi)核函數(shù),線程啟動(dòng)后就從這里開始執(zhí)行。

線程從這里啟動(dòng)后,再通過Windows的異步過程調(diào)用APC機(jī)制執(zhí)行提前插入的APC,進(jìn)而將執(zhí)行流程引入應(yīng)用層,去執(zhí)行Windows進(jìn)程應(yīng)用程序的初始化工作,比如一些核心DLL文件的加載(Kernel32.dll、ntdll.dll)等等。

隨后,再次通過APC機(jī)制,再轉(zhuǎn)向去執(zhí)行可執(zhí)行文件的入口點(diǎn)。

這后面和Linux上的機(jī)制類似,同樣沒有直接到main函數(shù),而是需要先進(jìn)行C/C++運(yùn)行時(shí)庫的初始化,這之后經(jīng)過運(yùn)行時(shí)函數(shù)的包裝,才最終來到我們的main函數(shù)。

下面是Windows上,從創(chuàng)建進(jìn)程到我們的main函數(shù)的完整流程(高清大圖:https://bbs.pediy.com/upload/attach/201604/501306_qz5f5hi1n3107kt.png):

現(xiàn)在你清楚,從進(jìn)程啟動(dòng)是怎么一步步到你的main函數(shù)的了嗎?

------------?END?------------

推薦閱讀:

SEGGER的三款RTOS有什么特點(diǎn)?

Keil MDK如何將變量存儲(chǔ)在指定內(nèi)存地址

幾款優(yōu)秀的支持C、C++等多種語言的在線編譯器


關(guān)注 微信公眾號(hào)『strongerHuang』,后臺(tái)回復(fù)“1024”查看更多內(nèi)容,回復(fù)“加群”按規(guī)則加入技術(shù)交流群。


長(zhǎng)按前往圖中包含的公眾號(hào)關(guān)注


點(diǎn)擊“ 閱讀原文 ”查看更多分享,歡迎點(diǎn)分享、收藏、點(diǎn)贊、在看。

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉