聊聊這道【快手】面試題
0x00 前言
前幾天大白參加了快手的視頻面試,第一次使用??途W(wǎng)的在線面試系統(tǒng),10點(diǎn)開始12點(diǎn)才結(jié)束,一面竟然持續(xù)了兩個(gè)小時(shí),期間最開始用手機(jī)面試,20分鐘簡單聊完項(xiàng)目之后開始編碼,于是切換到PC上。
奈何??途W(wǎng)的在線面試系統(tǒng)在 Chrome 上不好用,一度以為我電腦的攝像頭壞掉了,查了一下說可能是瀏覽器問題,果然快速換到火狐之后就 OK 了,期間我調(diào)試環(huán)境花了大約10分鐘,之后便開始了重頭戲-寫代碼。
快手這個(gè)崗位的題目均不是 Leetcode 的題目,都是比較偏實(shí)際的問題,期間要進(jìn)行 debug 所以時(shí)間會(huì)長一些。
其中有一道題看著挺簡單,但是后面仔細(xì)想了想,還算是個(gè)知識的模糊點(diǎn),所以決定寫出來和大家分享一下。
0x01 題目描述
題目是口述并簡單寫了一下,基本上達(dá)意了,一起看下:
簡述在 Linux 環(huán)境中使用 C++ 編寫的代碼輸出結(jié)果 以及原因。給定兩個(gè)函數(shù) func1 和 func2,包含的代碼如下:
int *glob_ptr = NULL;
void func1(){
int a = 10;
int *b = &a;
glob_ptr = b;
while(true){
//do sth
}
}
void func2(){
int *c = NULL;
c = glob_ptr;
printf("%d\n",*c)
}
thread1調(diào)用func1
thread2調(diào)用func2
可確保thread1調(diào)用的func1先跑
程序的執(zhí)行結(jié)果將是什么?
是否會(huì)coredump?
如果沒有coredump將輸出什么?
并對你的答案做出解釋。
簡單說這是道多線程的問題,兩個(gè)線程函數(shù)運(yùn)行之后,查看輸出結(jié)果是什么并給出解釋。
0x02 題目解析
題目中給出了全局指針變量 glob_ptr ,該變量是在進(jìn)程的堆上存儲(chǔ)的。
在 func1 中定義了局部變量a和局部指針變量b,隨后將全局變量glob_ptr 的值賦給局部變量b,之后是一個(gè) while 的死循環(huán),來保證 func1 一直活著,從而局部變量a和b都是有效的,進(jìn)而全局變量glob_ptr 也是指向一個(gè)有效的地址。
在 func2 中同樣定義了局部指針變量c,并將全局指針變量glob_ptr 賦值給了局部指針變量c,之后將其結(jié)果進(jìn)行輸出。
2.1 一些必備知識
進(jìn)程是線程的載體,也可以認(rèn)為是容器,進(jìn)程與進(jìn)程之間是有地址隔離的,Linux 是虛地址模式,每個(gè)進(jìn)程都認(rèn)為自己持有了全部的內(nèi)存空間,沒錯(cuò)是 OS 騙了它。
本質(zhì)上各個(gè)進(jìn)程的內(nèi)存訪問都涉及到虛擬地址和物理地址轉(zhuǎn)換,在系統(tǒng)層面避免了多進(jìn)程之間的直接訪問,所以進(jìn)程之間的通信需要借助于共享內(nèi)存、消息隊(duì)列等機(jī)制,從而也更加安全。
虛地址模式要比實(shí)地址模式更加安全,這個(gè)是由OS來保證的,對于一些單任務(wù)的操作系統(tǒng)比如 vxwork 很多都是實(shí)地址模式,題目中的Linux 便是典型的虛地址模式。
進(jìn)程內(nèi)的多個(gè)線程共享進(jìn)程的資源并且也擁有自己的獨(dú)立資源,這樣線程間的通信就方便很多了。
進(jìn)程與進(jìn)程就像獨(dú)立的家庭,每個(gè)家庭是有自己的領(lǐng)地的,如果要進(jìn)行交流需要通過其他手段。
線程與線程之間就像一個(gè)家庭中的成員,每個(gè)人都生活在相同的家庭空間,但是每個(gè)人也都有自己的私有空間,所以每個(gè)線程之間的通信要方便的多,只要喊一嗓子就可以聽到了。
2.2 大白的答案
經(jīng)過前簡單分析,題目確保了局部變量地址的有效性,不同的地方在于一般的多線程同步都是使用鎖、條件變量等手段借助于全局變量來進(jìn)行多線程的數(shù)據(jù)通信和同步。
題目中借助于局部變量的實(shí)現(xiàn)確實(shí)是沒有見過,這也是大白要寫這道題的初衷。
很多時(shí)候我們對于常見的東西的正確性沒有疑問,比如借助于鎖的線程同步,但是有時(shí)候沒見過的形式也不一定就是錯(cuò)誤的,只能說可能是可行但不完善,其實(shí)本題就是后者情況。
經(jīng)過幾分鐘的思考,大白給出了答案:
可能結(jié)果1:coredump掉,因?yàn)樵谖铱磥鞮inux是比較安全的,進(jìn)程內(nèi)的多個(gè)線程的局部變量存儲(chǔ)在私有空間棧上,從安全角度來說應(yīng)該是不可以相互訪問私有??臻g的,所以coredump。
可能結(jié)果2:沒有coredump,因?yàn)榭赡躄inux并沒有那么做,為進(jìn)程內(nèi)的線程間也做了屏障,多個(gè)線程的私有??臻g是可以相互訪問的。
所以兩個(gè)答案的區(qū)別根源就在于Linux本身是否允許多線程內(nèi)私有空間的訪問,來看一張進(jìn)程內(nèi)多線程的內(nèi)存空間分布圖吧:
經(jīng)過一番思考(其實(shí)算是直覺吧),大白覺得是結(jié)果2,因?yàn)長inux本身并沒有必要來實(shí)現(xiàn)線程內(nèi)私有棧的隔離,而且Linux的地址空間的隔離應(yīng)該是進(jìn)程粒度的,線程還是可以相互訪問的,所以我選擇了不會(huì)coredump并且輸出10。
但是我并不確定,因?yàn)閮煞N結(jié)果都說得通,不確定的根源在于自己知識的盲點(diǎn):多線程私有空間的訪問權(quán)限問題。
0x03 代碼實(shí)踐
面試結(jié)束之后,晚上大白實(shí)踐了一下,發(fā)現(xiàn)確實(shí)是結(jié)果2。簡單寫的糙代碼如下:
為了避免程序的偶然性結(jié)果,大白在func2中間隔1s打印了10次,簡單編譯執(zhí)行結(jié)果確實(shí)是沒有coredump,間隔1s輸出10。
這個(gè)問題算是被驗(yàn)證了,不過總覺得不能這樣結(jié)束,于是在網(wǎng)上搜索了一些東西。
0x04 繼續(xù)思考
在知乎上看到一個(gè)很相似的問題:
https://www.zhihu.com/question/265224833
有意思了!和我剛才驗(yàn)證的問題是矛盾的,不過知乎上總是會(huì)出現(xiàn)一些并不成立的問題,所以還是先說是什么再說為什么吧!
簡單看了幾個(gè)高票答案,也證明了這個(gè)提問者問題本身的不成立,在一個(gè)騰訊員工的回答中看到一個(gè)華麗麗的代碼:
大神這個(gè)代碼是C++14的一些高級特性,并且沒有借助于全局指針變量,直接使用局部變量來相互訪問的,看下編譯執(zhí)行結(jié)果:
其中一個(gè)回答的圖也比較好,貼一下:
0x05.筆者小結(jié)
快手的這道題目并不復(fù)雜,但是對一些不常見的形式探究的比較深入,對此大白覺得用幾句話概況吧:
正確的并不一定是好用的,不常見的也并非是錯(cuò)誤的,正確且常見的形式往往是取舍驗(yàn)證之后的優(yōu)解,但是并不是唯一解,掌握根源我們才能靈活應(yīng)對各種奇怪的形式,并作出分析。
就這么多吧!本期完,祝各位周末愉快,疫情之下 注意防護(hù)。
春風(fēng)在不久之后將吹開緊閉的家門,我們紛紛摘下口罩,洋溢著久違的笑容,自由呼吸、快樂奔跑!
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場,如有問題,請聯(lián)系我們,謝謝!