1. 整體流程概覽
當一臺計算機通過以太網(wǎng)接收一個UDP數(shù)據(jù)包時,會經(jīng)歷以下步驟:
1.物理層:處理電信號或光信號,將其轉(zhuǎn)換為數(shù)字信號(比特流)。
2.數(shù)據(jù)鏈路層:將比特流組裝成幀(Frame),進行CRC校驗,檢查MAC地址。
3.網(wǎng)絡層:解析IP數(shù)據(jù)包,檢查目的IP地址是否為本機IP,如果是則傳遞給傳輸層。
4.傳輸層:解析UDP頭部,獲取目的端口,根據(jù)端口找到對應的Socket,并將數(shù)據(jù)放入該Socket的接收隊列。
5.應用層:應用程序通過Socket API(如`recvfrom`)從接收隊列中讀取數(shù)據(jù)。
2. 接收隊列的原理
接收隊列的位置:接收隊列位于操作系統(tǒng)內(nèi)核中,每個Socket都有一個獨立的接收隊列(對于UDP Socket)。
接收隊列的作用:當數(shù)據(jù)包到達的速度快于應用程序處理的速度時,接收隊列可以暫時存儲數(shù)據(jù)包,避免丟包;內(nèi)核網(wǎng)絡協(xié)議棧處理數(shù)據(jù)包與應用程序讀取數(shù)據(jù)包是異步的,接收隊列作為兩者之間的緩沖區(qū)。
接收隊列的工作流程:網(wǎng)卡通過DMA(直接內(nèi)存訪問)將數(shù)據(jù)包寫入內(nèi)核預先分配好的內(nèi)存區(qū)域(稱為環(huán)形緩沖區(qū),ring buffer);網(wǎng)卡觸發(fā)硬中斷,CPU執(zhí)行中斷處理程序,將數(shù)據(jù)包從網(wǎng)卡緩沖區(qū)轉(zhuǎn)移到內(nèi)核協(xié)議棧的輸入隊列(input queue);為了避免頻繁中斷導致CPU過載,現(xiàn)代網(wǎng)卡使用NAPI(New API)機制,在高速網(wǎng)絡環(huán)境下,采用輪詢(poll)方式處理多個數(shù)據(jù)包;在軟中斷(如NET_RX_SOFTIRQ)中,內(nèi)核從輸入隊列中取出數(shù)據(jù)包,進行網(wǎng)絡層(IP)和傳輸層(UDP)的處理;檢查UDP數(shù)據(jù)包的目的端口,找到對應的Socket。 將數(shù)據(jù)包(包括UDP頭部和負載數(shù)據(jù))放入該Socket的接收隊列。如果接收隊列已滿,則丟棄新到的數(shù)據(jù)包(UDP本身不保證可靠傳輸);如果應用程序因為等待數(shù)據(jù)而阻塞(例如調(diào)用了阻塞的`recvfrom`),則內(nèi)核會將其喚醒。如果應用程序使用I/O多路復用(如epoll)或非阻塞I/O,則通過相應機制通知應用程序。
接收隊列的管理
數(shù)據(jù)結(jié)構(gòu):通常是一個先進先出(FIFO)的隊列,由內(nèi)核維護。在Linux中,每個Socket的接收隊列是一個sk_buff鏈表(即socket buffer)。
隊列大?。嚎梢酝ㄟ^系統(tǒng)調(diào)用設置(例如,在Linux中使用`setsockopt`設置`SO_RCVBUF`選項)。但實際大小會略大于設置的值,因為內(nèi)核會進行一定的調(diào)整(包括考慮sk_buff的開銷)。
滿隊列的處理:當接收隊列滿時,新到的數(shù)據(jù)包會被丟棄,不會通知發(fā)送方(UDP特性)。應用程序可以通過增加接收緩沖區(qū)大小或加快讀取速度來減少丟包。
3. 應用程序讀取數(shù)據(jù)
當應用程序調(diào)用`recvfrom`(或類似函數(shù))時,內(nèi)核從Socket的接收隊列中取出一個數(shù)據(jù)包(如果隊列為空,則阻塞或返回錯誤,取決于Socket是否阻塞)。取出的數(shù)據(jù)包包含源IP地址和源端口等信息,應用程序可以據(jù)此知道數(shù)據(jù)包的來源。