作者:李智敏,華清遠(yuǎn)見嵌入式學(xué)院上海分中心講師。
在 Linux 內(nèi)核內(nèi),進(jìn)程是由相當(dāng)大的一個稱為 task_STruct 的結(jié)構(gòu)表示的。此結(jié)構(gòu)包含所有表示此進(jìn)程所必需的數(shù)據(jù),此外,還包含了大量的其他數(shù)據(jù)用來統(tǒng)計(accounTIng)和維護(hù)與其他進(jìn)程的關(guān)系(父和子)。下面給出了 task_struct 的一小部分。task_struct 位于 ./linux/include/linux/sched.h。
struct task_struct {
volatile lONg state;
void *stack;
unsigned int flags;
int prio, static_prio;
struct list_head tasks;
struct mm_struct *mm, *active_mm;
pid_t pid;
pid_t tgid;
struct task_struct *real_parent;
char comm[TASK_COMM_LEN];
struct thread_struct thread;
struct files_struct *files;
...
};
在task_struct中,可以看到幾個預(yù)料之中的項(xiàng),比如執(zhí)行的狀態(tài)、堆棧、一組標(biāo)志、父進(jìn)程、執(zhí)行的線程(可以有很多)以及開放文件。對其做簡單聲明如下
<1> state 變量是一些表明任務(wù)狀態(tài)的比特位。最常見的狀態(tài)有:
1.TASK_RUNNING 表示進(jìn)程正在運(yùn)行,或是排在運(yùn)行隊(duì)列中正要運(yùn)行
2.TASK_INTERRUPTIBLE 表示進(jìn)程正在休眠
3.TASK_UNINTERRUPTIBLE 表示進(jìn)程正在休眠但不能叫醒
4.TASK_STOPPED 表示進(jìn)程停止
注:這些標(biāo)志的完整列表可以在 ./linux/include/linux/sched.h 內(nèi)找到。
<2> flags 定義了很多指示符,表明進(jìn)程是否正在被創(chuàng)建(PF_STARTING)或退出(PF_EXITING),或是進(jìn)程當(dāng)前是否在分配內(nèi)存(PF_MEMALLOC)。
<3> 每個進(jìn)程都會被賦予優(yōu)先級(稱為 static_prio),但進(jìn)程的實(shí)際優(yōu)先級是基于加載以及其他幾個因素動態(tài)決定的。優(yōu)先級值越低,實(shí)際的優(yōu)先級越高。
<4> tasks 字段提供了鏈接列表的能力。它包含一個 prev 指針(指向前一個任務(wù))和一個 next 指針(指向下一個任務(wù))。
<5> 進(jìn)程的地址空間由 mm 和 active_mm 字段表示。mm 代表的是進(jìn)程的內(nèi)存描述符,而 active_mm 則是前一個進(jìn)程的內(nèi)存描述符(為改進(jìn)上下文切換時間的一種優(yōu)化)。
<6> 可執(zhí)行程序的名稱(不包含路徑)占用 comm(命令)字段。
<7> thread_struct 則用來標(biāo)識進(jìn)程的存儲狀態(tài)。此元素依賴于 Linux 在其上運(yùn)行的特定架構(gòu),在 ./linux/include/asm-i386/processor.h 內(nèi)有這樣的一個例子。在此結(jié)構(gòu)內(nèi),可以找到該進(jìn)程自執(zhí)行上下文切換后的存儲(硬件注冊表、程序計數(shù)器等)。
在很多情況下,進(jìn)程都是動態(tài)創(chuàng)建并由一個動態(tài)分配的 task_struct 表示。當(dāng)然 init 進(jìn)程例外,它總是存在并由一個靜態(tài)分配的 task_struct 表示。
Linux 內(nèi)所有進(jìn)程的分配有兩種方式。第一種方式是通過一個哈希表,由 PID 值進(jìn)行哈希計算得到;第二種方式是通過雙鏈循環(huán)表。循環(huán)表非常適合于對任務(wù)列表進(jìn)行迭代。由于列表是循環(huán)的,沒有頭或尾;但是由于 init_task 總是存在,所以可以將其用作繼續(xù)向前迭代的一個錨點(diǎn)。
任務(wù)列表無法從用戶空間訪問,但該問題很容易解決,方法是以模塊形式向內(nèi)核內(nèi)插入代碼。例如通過如下代碼,它會迭代任務(wù)列表并會提供有關(guān)每個任務(wù)的少量信息(name、pid 和 parent 名)。
struct task_struct *task = &init_task;
/* Walk through the task list, until we hit the init_task again */
do {
printk( KERN_INFO "*** %s [%d] parent %s\n",
task->comm, task->pid, task->parent->comm );
} while ( (task = next_task(task)) != &init_task );
注意,還可以標(biāo)識當(dāng)前正在運(yùn)行的任務(wù)。Linux 維護(hù)一個稱為 current 的符號,代表的是當(dāng)前運(yùn)行的進(jìn)程(類型是 task_struct)。為此可使用如下代碼:
printk( KERN_INFO, "Current task is %s [%d]”, current->comm, current->pid );
Linux創(chuàng)建用戶空間進(jìn)程的情況與內(nèi)核空間進(jìn)程類似。二者底層機(jī)制是一致的,因?yàn)樽罱K都會依賴于一個名為 do_fork 的函數(shù)來創(chuàng)建新進(jìn)程。
在創(chuàng)建內(nèi)核線程時,內(nèi)核會調(diào)用一個名為 kernel_thread 的函數(shù)(參見 ./linux/arch/i386/kernel/process.c),此函數(shù)執(zhí)行某些初始化后會調(diào)用 do_fork。
在用戶空間,一個程序會調(diào)用 fork,這會導(dǎo)致對名為 sys_fork 的內(nèi)核函數(shù)的系統(tǒng)調(diào)用(參見 ./linux/arch/i386/kernel/process.c)。
do_fork 是進(jìn)程創(chuàng)建的基礎(chǔ)??梢栽?./linux/kernel/fork.c 內(nèi)找到 do_fork 函數(shù)(以及相關(guān)函數(shù) copy_process)。
do_fork 函數(shù)首先調(diào)用 alloc_pidmap,該調(diào)用會分配一個新的 PID。接下來,do_fork 檢查調(diào)試器是否在跟蹤父進(jìn)程。如果是,在 clone_flags 內(nèi)設(shè)置 CLONE_PTRACE 標(biāo)志以做好執(zhí)行 fork 操作的準(zhǔn)備。之后 do_fork 函數(shù)還會調(diào)用 copy_process,向其傳遞這些標(biāo)志、堆棧、注冊表、父進(jìn)程以及最新分配的 PID。
新的進(jìn)程在 copy_process 函數(shù)內(nèi)作為父進(jìn)程的一個副本創(chuàng)建。此函數(shù)能執(zhí)行除啟動進(jìn)程之外的所有操作,啟動進(jìn)程在之后進(jìn)行處理。copy_process 內(nèi)的第一步是驗(yàn)證 CLONE 標(biāo)志以確保這些標(biāo)志是一致的。如果不一致,就會返回 EINVAL 錯誤。接下來,詢問 Linux Security Module (LSM) 看當(dāng)前任務(wù)是否可以創(chuàng)建一個新任務(wù)。
接下來,調(diào)用 dup_task_struct 函數(shù)(./linux/kernel/fork.c ),這會分配一個新 task_struct 并將當(dāng)前進(jìn)程的描述符復(fù)制到其內(nèi)。在新的線程堆棧設(shè)置好后,一些狀態(tài)信息也會被初始化,并且會將控制返回給 copy_process。控制回到 copy_process 后,除了其他幾個限制和安全檢查之外,還會執(zhí)行一些常規(guī)管理,包括在新 task_struct 上的各種初始化。之后,會調(diào)用一系列復(fù)制函數(shù)來復(fù)制此進(jìn)程的各個方面,比如復(fù)制開放文件描述符(copy_files)、復(fù)制符號信息(copy_sighand 和 copy_signal)、復(fù)制進(jìn)程內(nèi)存(copy_mm)以及最終復(fù)制線程(copy_thread)。
之后,這個新任務(wù)會被指定給一個處理程序,同時對允許執(zhí)行進(jìn)程的處理程序進(jìn)行額外的檢查(cpus_allowed)。新進(jìn)程的優(yōu)先級從父進(jìn)程的優(yōu)先級繼承后,執(zhí)行一小部分額外的常規(guī)管理,而且控制也會被返回給 do_fork。在此時,新進(jìn)程存在但尚未運(yùn)行。do_fork 函數(shù)通過調(diào)用 wake_up_new_task 來修復(fù)此問題。此函數(shù)(./linux/kernel/sched.c )初始化某些調(diào)度程序的常規(guī)管理信息,將新進(jìn)程放置在運(yùn)行隊(duì)列之內(nèi),然后將其喚醒以便執(zhí)行。最后,一旦返回至 do_fork,此 PID 值即被返回給調(diào)用程序,進(jìn)程完成。
“本文由華清遠(yuǎn)見http://www.embedu.org/index.htm提供”
華清遠(yuǎn)見