被鵝廠搞懵逼了(更正)
時間:2021-09-06 15:22:34
手機看文章
掃描二維碼
隨時隨地手機看文章
[導讀]??大家好,我是小林。上周發(fā)了一篇讀者面試鵝廠遇到的網絡問題:又被鵝廠搞懵了!當時我的關注點放在了「TIME_WAIT狀態(tài)下,接收到了數(shù)據(jù)包會怎么處理?」然后那篇文章留言區(qū)有人說這題的重點并不是想問「在TIME_WAIT狀態(tài)下對數(shù)據(jù)包的如何處理」。而是「在FIN_WAIT_2狀態(tài)...
??大家好,我是小林。上周發(fā)了一篇讀者面試鵝廠遇到的網絡問題:又被鵝廠搞懵了!當時我的關注點放在了「TIME_WAIT 狀態(tài)下,接收到了數(shù)據(jù)包會怎么處理?」然后那篇文章留言區(qū)有人說這題的重點并不是想問「在 TIME_WAIT 狀態(tài)下對數(shù)據(jù)包的如何處理」。而是 「在 FIN_WAIT_2 狀態(tài)下如何處理亂序的 FIN 報文」。隨后,我自己去看了 Linux 的源碼,驗證了這位讀者的思路是沒問題的。果然一個人思考容易形成思維定勢,和別人交流可能才能發(fā)現(xiàn)自己沒有注意到的點。這道鵝廠的網絡題可能是提問的讀者表述有問題,因為如果 FIN 報文比數(shù)據(jù)包先抵達客戶端,此時 FIN 報文其實是一個亂序的報文,此時客戶端的 TCP 連接并不會從 FIN_WAIT_2 狀態(tài)轉換到 TIME_WAIT 狀態(tài)。因此,我們要關注到點是看「在 FIN_WAIT_2 狀態(tài)下,是如何處理收到的亂序到 FIN 報文,然后 TCP 連接又是什么時候才進入到 TIME_WAIT 狀態(tài)?」。
我這里先直接說結論:在 FIN_WAIT_2 狀態(tài)時,如果收到亂序的 FIN 報文,那么就被會加入到「亂序隊列」,并不會進入到 TIME_WAIT 狀態(tài)。等再次收到前面被網絡延遲的數(shù)據(jù)包時,會判斷亂序隊列有沒有數(shù)據(jù),然后會檢測亂序隊列中是否有可用的數(shù)據(jù),如果能在亂序隊列中找到與當前報文的序列號保持的順序的報文,就會看該報文是否有 FIN 標志,如果發(fā)現(xiàn)有 FIN 標志,這時才會進入 TIME_WAIT 狀態(tài)。我也畫了一張圖,大家可以結合著圖來理解。TCP 源碼分析
接下來,我?guī)Т蠹铱纯丛创a,聽到要源碼分析,可能有的同學就慫了。其實要分析我們今天這個問題,只要懂 if else 就行了,我也會用中文來表述代碼的邏輯,所以單純看我的文字也是可以的。這次我們重點分析的是,在 FIN_WAIT_2 狀態(tài)下,收到 FIN 報文是如何處理的。在 Linux 內核里,當 IP 層處理完消息后,會通過回調? ??
我這里先直接說結論:在 FIN_WAIT_2 狀態(tài)時,如果收到亂序的 FIN 報文,那么就被會加入到「亂序隊列」,并不會進入到 TIME_WAIT 狀態(tài)。等再次收到前面被網絡延遲的數(shù)據(jù)包時,會判斷亂序隊列有沒有數(shù)據(jù),然后會檢測亂序隊列中是否有可用的數(shù)據(jù),如果能在亂序隊列中找到與當前報文的序列號保持的順序的報文,就會看該報文是否有 FIN 標志,如果發(fā)現(xiàn)有 FIN 標志,這時才會進入 TIME_WAIT 狀態(tài)。我也畫了一張圖,大家可以結合著圖來理解。
TCP 源碼分析
接下來,我?guī)Т蠹铱纯丛创a,聽到要源碼分析,可能有的同學就慫了。其實要分析我們今天這個問題,只要懂 if else 就行了,我也會用中文來表述代碼的邏輯,所以單純看我的文字也是可以的。這次我們重點分析的是,在 FIN_WAIT_2 狀態(tài)下,收到 FIN 報文是如何處理的。在 Linux 內核里,當 IP 層處理完消息后,會通過回調?tcp_v4_rcv
?函數(shù)將消息轉給 TCP 層,所以這個函數(shù)就是 TCP 層收到消息的入口。處于 FIN_WAIT_2 狀態(tài)下的客戶端,在收到服務端的報文后,最終會調用 tcp_v4_do_rcv 函數(shù)。接下來,tcp_v4_do_rcv 方法會調用 tcp_rcv_state_process,在這里會根據(jù) TCP 狀態(tài)做對應的處理,這里我們只關注 FIN_WAIT_2 狀態(tài)。在上面這個代碼里,可以看到如果 shutdown 關閉了讀方向,那么在收到對方發(fā)來的數(shù)據(jù)包,則會回復 RST 報文。而我們這次的題目里, shutdown 只關閉了寫方向,所以會繼續(xù)往下調用 tcp_data_queue 函數(shù)(因為 case TCP_FIN_WAIT2 代碼塊里并沒有 break 語句,所以會走到該函數(shù))。在上面的 tcp_data_queue 函數(shù)里,如果收到的報文的序列號是我們預期的,也就是有序的話:- 會判斷該報文有沒有 FIN 標志,如果有的話就會調用 tcp_fin 函數(shù),這個函數(shù)負責將 FIN_WAIT_2 狀態(tài)轉換為 TIME_WAIT。
- 接著還會看亂序隊列有沒有數(shù)據(jù),如果有的話會調用 tcp_ofo_queue 函數(shù),這個函數(shù)負責檢查亂序隊列中是否有數(shù)據(jù)包可用,即能不能在亂序隊列找到與當前數(shù)據(jù)包保持序列號連續(xù)的數(shù)據(jù)包。