一個(gè)fork的面試題
前兩天有人問了個(gè)關(guān)于Unix的fork()系統(tǒng)調(diào)用的面試題,這個(gè)題正好是我大約十年前找工作時(shí)某公司問我的一個(gè)題,我覺得比較有趣,寫篇文章與大家分享一下。這個(gè)題是這樣的:
題目:請(qǐng)問下面的程序一共輸出多少個(gè)“-”?
1
2
3
4
5
6
7
8
9
10
11
12
13
14#include
#include
#include
?int
main(
void
)
{
???
int
i;
???
for
(i=0; i<2; i++){
??????
fork();
??????
printf
(
"-"
);
???
}
????
return
0;
}
如果你對(duì)fork()的機(jī)制比較熟悉的話,這個(gè)題并不難,輸出應(yīng)該是6個(gè)“-”,但是,實(shí)際上這個(gè)程序會(huì)很tricky地輸出8個(gè)“-”。
要講清這個(gè)題,我們首先需要知道fork()系統(tǒng)調(diào)用的特性,
fork()系統(tǒng)調(diào)用是Unix下以自身進(jìn)程創(chuàng)建子進(jìn)程的系統(tǒng)調(diào)用,一次調(diào)用,兩次返回,如果返回是0,則是子進(jìn)程,如果返回值>0,則是父進(jìn)程(返回值是子進(jìn)程的pid),這是眾為周知的。還有一個(gè)很重要的東西是,在fork()的調(diào)用處,整個(gè)父進(jìn)程空間會(huì)原模原樣地復(fù)制到子進(jìn)程中,包括指令,變量值,程序調(diào)用棧,環(huán)境變量,緩沖區(qū),等等。
所以,上面的那個(gè)程序?yàn)槭裁磿?huì)輸入8個(gè)“-”,這是因?yàn)閜rintf(“-”);語句有buffer,所以,對(duì)于上述程序,printf(“-”);把“-”放到了緩存中,并沒有真正的輸出(參看《C語言的迷題》中的第一題),在fork的時(shí)候,緩存被復(fù)制到了子進(jìn)程空間,所以,就多了兩個(gè),就成了8個(gè),而不是6個(gè)。
另外,多說一下,我們知道,Unix下的設(shè)備有“塊設(shè)備”和“字符設(shè)備”的概念,所謂塊設(shè)備,就是以一塊一塊的數(shù)據(jù)存取的設(shè)備,字符設(shè)備是一次存取一個(gè)字符的設(shè)備。磁盤、內(nèi)存都是塊設(shè)備,字符設(shè)備如鍵盤和串口。塊設(shè)備一般都有緩存,而字符設(shè)備一般都沒有緩存。
對(duì)于上面的問題,我們?nèi)绻薷囊幌律厦娴膒rintf的那條語句為:
1printf
(
"-n"
);
或是
1
2printf
(
"-"
);
fflush
(stdout);
就沒有問題了(就是6個(gè)“-”了),因?yàn)槌绦蛴龅健皀”,或是EOF,或是緩中區(qū)滿,或是文件描述符關(guān)閉,或是主動(dòng)flush,或是程序退出,就會(huì)把數(shù)據(jù)刷出緩沖區(qū)。需要注意的是,標(biāo)準(zhǔn)輸出是行緩沖,所以遇到“n”的時(shí)候會(huì)刷出緩沖區(qū),但對(duì)于磁盤這個(gè)塊設(shè)備來說,“n”并不會(huì)引起緩沖區(qū)刷出的動(dòng)作,那是全緩沖,你可以使用setvbuf來設(shè)置緩沖區(qū)大小,或是用fflush刷緩存。
我估計(jì)有些朋友可能對(duì)于fork()還不是很了解,那么我們把上面的程序改成下面這樣:
1
2
3
4
5
6
7
8
9
10
11
12
13
14#include
#include
#include
int
main(
void
)
{
???
int
i;
???
for
(i=0; i<2; i++){
??????
fork();
??????
//注意:下面的printf有“n”
??????
printf
(
"ppid=%d, pid=%d, i=%d n"
, getppid(), getpid(),
i);
???
}
???
sleep(10);
//讓進(jìn)程停留十秒,這樣我們可以用pstree查看一下進(jìn)程樹
???
return
0;
}
于是,上面這段程序會(huì)輸出下面的結(jié)果,(注:編譯出的可執(zhí)行的程序名為fork)
1
2
3
4
5
6
7
8
9
10ppid=8858, pid=8518, i=0
ppid=8858, pid=8518, i=1
ppid=8518, pid=8519, i=0
ppid=8518, pid=8519, i=1
ppid=8518, pid=8520, i=1
ppid=8519, pid=8521, i=1
?$ pstree -p |
grep
fork
|-
bash
(8858)-+-fork(8518)-+-fork(8519)---fork(8521)
|??????????? |??????????? `-fork(8520)
面對(duì)這樣的圖你可能還是看不懂,沒事,我好事做到底,畫個(gè)圖給你看看:
注意:上圖中的我用了幾個(gè)色彩,相同顏色的是同一個(gè)進(jìn)程。于是,我們的pstree的圖示就可以成為下面這個(gè)樣子:(下圖中的顏色與上圖對(duì)應(yīng))
這樣,對(duì)于printf(“-”);這個(gè)語句,我們就可以很清楚的知道,哪個(gè)子進(jìn)程復(fù)制了父進(jìn)程標(biāo)準(zhǔn)輸出緩中區(qū)里的的內(nèi)容,而導(dǎo)致了多次輸出了。(如下圖所示,就是我陰影并雙邊框了那兩個(gè)子進(jìn)程)
現(xiàn)在你明白了吧。(另,對(duì)于圖中的我本人拙劣的配色,請(qǐng)見諒!)
(全文完)