一種嵌入式IPv4/IPv6雙協(xié)議棧的實(shí)現(xiàn)
1引言
隨著嵌入式系統(tǒng)與網(wǎng)絡(luò)的日益結(jié)合,在嵌入式系統(tǒng)中引入TCP/IP協(xié)議棧,以支持嵌入式設(shè)備接入網(wǎng)絡(luò),成為嵌入式領(lǐng)域重要的研究方向。并且隨著 Internet技術(shù)的迅猛發(fā)展和規(guī)模的不斷擴(kuò)大,現(xiàn)行的Internet協(xié)議IPv4在地址空間、端到端的IP連接、服務(wù)質(zhì)量和網(wǎng)絡(luò)安全等方面暴露出了不足,極大地限制了IP網(wǎng)絡(luò)的進(jìn)一步發(fā)展。而IPv6所提供的巨大地址空間和網(wǎng)絡(luò)安全等因素已經(jīng)使其成為下一代因特網(wǎng)IP協(xié)議,為了能夠支持IPv6的應(yīng)用,并且考慮到從IPv4到IPv6仍然需要一個過渡期,本文實(shí)現(xiàn)了一種基于實(shí)時操作系統(tǒng)的IPv4/IPv6雙協(xié)議棧結(jié)構(gòu)。
2協(xié)議棧的設(shè)計要點(diǎn)
2.1平臺無關(guān)性
本文所設(shè)計的TCP/IP雙協(xié)議棧,要求不能局限于特定的硬件環(huán)境和軟件系統(tǒng)。因此,本協(xié)議棧的實(shí)現(xiàn)采用將所有的TCP/IP協(xié)議都駐留在一個進(jìn)程當(dāng)中,協(xié)議棧模塊與操作系統(tǒng)內(nèi)核分開。通過定義一個操作系統(tǒng)模擬層實(shí)現(xiàn)平臺無關(guān)性。操作系統(tǒng)模擬層屏蔽硬件上的差異和獲取操作系統(tǒng)提供統(tǒng)一的接口,如時鐘、過程同步以及信息傳遞機(jī)制等。對于特定的嵌入式操作系統(tǒng),直接對操作系統(tǒng)模擬層相應(yīng)部分進(jìn)行修改,以符合具體的要求。操作系統(tǒng)模擬層主要包括下面兩個部分:
⑴與處理器和編譯器有關(guān)
對不同微處理器的BYTE_ORDER存儲系統(tǒng)定義;對不同編譯器的數(shù)據(jù)類型長度的定義;與CPU或編譯器相關(guān)的內(nèi)容的定義。
⑵與操作系統(tǒng)相關(guān)
協(xié)議棧進(jìn)程與應(yīng)用程序進(jìn)程之間的同步與通訊,需要對信號量sys_sem_t、消息隊(duì)列sys_mbox_t和時鐘函數(shù)進(jìn)行定義和操作。
2.2協(xié)議棧的裁減
標(biāo)準(zhǔn)的TCP/IP協(xié)議棧功能復(fù)雜,代碼量大,且需大量的存儲器資源。為了滿足嵌入式應(yīng)用,必須對RFC定義的協(xié)議棧進(jìn)行裁減[1]。本協(xié)議棧的實(shí)現(xiàn)作了如下裁減:
⑴IP模塊:不支持?jǐn)?shù)據(jù)分片,不支持?jǐn)?shù)據(jù)包轉(zhuǎn)發(fā),不支持IPv6移動功能,不支持部分IPv6的擴(kuò)展報頭。
⑵ICMPv6模塊:支持信息報文中的請求和應(yīng)答報文,支持錯誤報文中的目的不可達(dá)和超時報文。
⑶鄰居發(fā)現(xiàn)模塊:支持地址解析、重復(fù)性探測,省略了路由功能。
⑷TCP模塊:支持多個連接,簡化滑動窗口,實(shí)現(xiàn)快速重傳、慢啟動與擁塞避免算法的TCP可靠性機(jī)制;約減掉半關(guān)閉,緊急指針,大部分TCP選項(xiàng)等。
協(xié)議棧的層次結(jié)構(gòu)如圖1所示。采用獨(dú)立于網(wǎng)絡(luò)層的方式,IPv4協(xié)議和IPv6協(xié)議分開實(shí)現(xiàn),條理清楚,易于裁減,同時不會增加太多代碼空間。
上層應(yīng)用(HTTP)
TCP
ICMPv4ICMPv6
ARPIPv4IPv6
網(wǎng)絡(luò)驅(qū)動
3協(xié)議棧的實(shí)現(xiàn)
3.1內(nèi)存管理
內(nèi)存管理主要是針對協(xié)議棧內(nèi)部緩沖區(qū)的管理。為了勝任任意大小報文的處理,并且能夠達(dá)到比較高的處理效率,在這里定義了兩種緩沖區(qū)實(shí)現(xiàn)機(jī)制:固定長度緩沖區(qū)(pbuf_pool)和變長度緩沖區(qū)(pbuf_ram)。pbuf_pool主要適合于網(wǎng)絡(luò)設(shè)備驅(qū)動,存放從網(wǎng)卡接收的數(shù)據(jù)。 pbuf_ram根據(jù)數(shù)據(jù)的大小動態(tài)的分配緩沖區(qū),如協(xié)議的報頭空間。
在這里對存儲空間的申請做了一定改進(jìn)。由于發(fā)送數(shù)據(jù)時很難確定各層協(xié)議頭部需要多大的內(nèi)存空間,特別是IPv6報文可以包含若干個擴(kuò)展頭,所以只申請基本頭部的內(nèi)存空間,在使用中動態(tài)調(diào)整的可能性就會很大,使得系統(tǒng)的效率降低。在這里提出了一種優(yōu)化方法,根據(jù)局部性原理,通常情況下一個連接在局部時間范圍內(nèi)需要網(wǎng)絡(luò)層提供相同功能的概率非常大,所以在該連接的TCP_PCB控制塊中增加一個變量num,用于記錄上次通信時IPv6協(xié)議頭所使用的字節(jié)數(shù),并且此變量可以被網(wǎng)絡(luò)層的函數(shù)進(jìn)行修改。當(dāng)傳輸層下次申請pbuf時,就參考這個值。如果所需的存儲空間比此值大,就需重新申請能滿足要求的存儲空間,同時修改num的值,并作為下一次申請的參考。
3.2網(wǎng)絡(luò)接口的實(shí)現(xiàn)
網(wǎng)絡(luò)接口層在設(shè)計上主要考慮下面幾個目標(biāo):⑴向協(xié)議層提供一個統(tǒng)一的網(wǎng)絡(luò)通信接口,能夠?qū)⑸蠈訁f(xié)議模塊與具體的網(wǎng)絡(luò)接口硬件隔離開來,以利于向不同操作系統(tǒng)的移植;⑵支持一個網(wǎng)絡(luò)接口配置多個IP地址的功能,因?yàn)镮Pv6一個接口的IP地址包括本地鏈路、本地站點(diǎn)和全局三類地址;⑶支持多播報文的收發(fā),提供動態(tài)的多播IP與多播MAC地址的映射服務(wù);⑷提供較好的通信性能等。
針對上述目標(biāo),設(shè)計了如下的網(wǎng)絡(luò)接口控制結(jié)構(gòu):
struct netif {
struct netif *next; /*指向下一個netif結(jié)構(gòu)的指針*/
netif_ipaddr *iplist; /*指向接口的ip地址鏈的首指針*/
char name[2]; /*接口名稱*/
err_t (* input)(struct pbuf *p, struct netif *); /*接口輸入函數(shù)指針*/
err_t (* output)(struct netif *, struct pbuf *p,netif_addr *); /*接口輸出函數(shù)指針*/
err_t (* linkoutput)(struct netif *, struct pbuf *p); /*鏈路層輸出函數(shù)指針*/
void *state; /*指向接口的狀態(tài)信息*/
mac_addr netifmacaddr; /*接口的MAC地址*/
netif_multi *multilist; /*本接口的MAC多播地址鏈?zhǔn)字羔?/
┊ /*省略了部分信息 */
};
網(wǎng)絡(luò)接口層是協(xié)議棧與下層網(wǎng)絡(luò)設(shè)備驅(qū)動程序之間的接口,同時支持IPv4報文和IPv6報文,通過判斷幀的類型字段,把接收到的不同類型的報文交給不同的協(xié)議模塊進(jìn)行處理。
3.3 IPv6模塊
IPv6[2]模塊主要包括兩部分的功能,一是負(fù)責(zé)從網(wǎng)絡(luò)接口層接收IPv6數(shù)據(jù)包,對數(shù)據(jù)包進(jìn)行一定的處理后發(fā)送給上層處理模塊(TCP或ICMPv6)。二是從上層接收數(shù)據(jù),進(jìn)行報文的選路,封裝IPv6報頭后將數(shù)據(jù)報發(fā)送給網(wǎng)絡(luò)接口層。
3.3.1 ICMPv6[3]的簡化分析
⑴ICMPv6信息報文
嵌入式設(shè)備只需作為Ping的接收端,所以不需要發(fā)送回顯請求報文和處理回顯應(yīng)答報文。為了讓客戶端可以測試網(wǎng)絡(luò)狀態(tài)以及測試使用,必須支持接收請求報文和發(fā)送相應(yīng)的應(yīng)答報文。
⑵ICMPv6錯誤報文
由于嵌入式設(shè)備不會作為路由轉(zhuǎn)發(fā)設(shè)備,所以需要實(shí)現(xiàn)發(fā)送端口不可達(dá)報文,同時要支持超時報文通告對端超時錯誤。在BSD中,IP層沒有發(fā)送參數(shù)問題報文, ICMPv6無需支持處理參數(shù)問題報文。
3.3.2鄰居發(fā)現(xiàn)協(xié)議(NDP)的簡化分析
NDP[4]是IPv6協(xié)議的一個基本組成部分,它用于地址解析、鄰居發(fā)現(xiàn)以及路由器及網(wǎng)絡(luò)參數(shù)發(fā)現(xiàn)。本協(xié)議棧不支持路由功能,所以無需實(shí)現(xiàn)發(fā)送路由器通告報文,但必須接受路由器通告報文,以完成路由發(fā)現(xiàn)功能。同時支持鄰居通告和鄰居請求報文的接收和發(fā)送,以實(shí)現(xiàn)地址解析和重復(fù)探測。
3.4 TCP模塊
在TCP之上實(shí)現(xiàn)有限的WEB服務(wù),可以對該協(xié)議的實(shí)現(xiàn)機(jī)制作相應(yīng)的簡化及優(yōu)化。
3.4.1 TCP模塊的擴(kuò)展
TCP對IPv4和IPv6報文的處理過程沒有任何的不同,但是由于IPv4和IPv6地址結(jié)構(gòu)不同,需要對使用IP地址的部分進(jìn)行擴(kuò)展。
⑴數(shù)據(jù)結(jié)構(gòu)擴(kuò)展
PCB是用來記錄每個TCP連接狀態(tài)的,包括本地IP地址和遠(yuǎn)程IP地址,擴(kuò)展時使用union結(jié)構(gòu)添加IPv6地址,同時添加標(biāo)識位區(qū)別連接。
⑵操作擴(kuò)展
在TCP處理過程中包括輸入時對IP地址和端口號的匹配,輸出時校驗(yàn)和的計算和路由的查找。由于對IPv4和IPv6報文調(diào)用相同的處理函數(shù),需要在實(shí)現(xiàn)時在這幾個函數(shù)的處理過程中加入對相應(yīng)PCB中標(biāo)識位的判斷。
3.4.2 簡化TCP狀態(tài)機(jī)
TCP的面向連接和可靠性傳輸?shù)忍匦詻Q定了每一個標(biāo)準(zhǔn)的TCP狀態(tài)機(jī)龐大而且復(fù)雜,對于嵌入式應(yīng)用,可以根據(jù)需要進(jìn)行簡化。
建立連接分為主動打開和被動打開,本協(xié)議棧設(shè)計作為監(jiān)聽狀態(tài)的服務(wù)器端,僅實(shí)現(xiàn)被動打開。在設(shè)計中去掉了CLOSED狀態(tài),讓它一開始就處于LISTEN狀態(tài),等待對方發(fā)起連接。
斷開連接分為主動斷開和被動斷開,從安全性的角度考慮,本設(shè)計僅實(shí)現(xiàn)主動斷開連接。當(dāng)服務(wù)器發(fā)送完數(shù)據(jù)時,向客戶機(jī)發(fā)送關(guān)閉連接請求。
通過以上分析,根據(jù)特定的應(yīng)用不失一般性的裁減掉復(fù)雜和冗余的機(jī)制,除去標(biāo)準(zhǔn)狀態(tài)機(jī)中的客戶端部分,簡化連接的建立和關(guān)閉過程,就得到如圖2所示的簡化的TCP狀態(tài)機(jī)模型。
3.4.3 簡化的窗口機(jī)制
標(biāo)準(zhǔn)的TCP協(xié)議使用慢啟動的滑動窗口機(jī)制[5],它允許發(fā)送方在等待一個確認(rèn)之前發(fā)送多個窗口。其確認(rèn)是一種批量的確認(rèn),處理器要對多個數(shù)據(jù)報連續(xù)傳輸進(jìn)行維護(hù)和處理,困難較大。
而滑動窗口的一個極限情況,是只使用單個窗口,這就變成了一種簡單確認(rèn)的處理方法。只是對于單個數(shù)據(jù)報的發(fā)送和確認(rèn),雖然節(jié)約了系統(tǒng)的資源,也使維護(hù)更加方便,但是卻降低了效率。
系統(tǒng)采用了一個折中的辦法,適當(dāng)調(diào)整窗口的大小,限制連續(xù)發(fā)送報文段的個數(shù)來實(shí)現(xiàn)了一個簡化的窗口機(jī)制,如圖3所示。在這里,設(shè)置窗口大小(snd_wnd)為4個最大報文段長度(MSS),可以適當(dāng)提高數(shù)據(jù)傳輸效率。
4 協(xié)議棧的移植和測試
在完成雙協(xié)議棧的設(shè)計調(diào)試后,將此協(xié)議棧移植到基于ARM7TDMI核的AT91M40800開發(fā)板上,使用其中內(nèi)嵌的10Mbps以太網(wǎng)控制器 RTL8019AS作為網(wǎng)絡(luò)接口。在該平臺上實(shí)現(xiàn)了一個簡單的Web Server。通過構(gòu)建提供IPv4地址和IPv6地址訪問的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行測試,該雙協(xié)議棧運(yùn)行穩(wěn)定、正常。
同時,在相同環(huán)境下將此協(xié)議棧與開源的協(xié)議棧LwIP作了吞吐率性能方面的比較,如圖4所示??芍?,本協(xié)議棧有較好的吞吐率,在連接數(shù)達(dá)到3條以后,平均吞吐率達(dá)到了460kB/s。
5 結(jié)語
本文主要介紹了一種嵌入式雙協(xié)議棧的實(shí)現(xiàn),實(shí)踐證明它是一個符合TCP/IP協(xié)議規(guī)范的,高性能,低開銷,可移植的IPv4/IPv6雙協(xié)議棧。本協(xié)議棧僅實(shí)現(xiàn)了基本的IPv4和IPv6通信功能,還有需多需要改進(jìn)和增強(qiáng)的地方,擴(kuò)展IPv6的移動功能是此協(xié)議棧下一步的研究重點(diǎn)。
本文作者創(chuàng)新點(diǎn):嵌入式雙協(xié)議棧的實(shí)現(xiàn)獨(dú)立于操作系統(tǒng)內(nèi)核和硬件平臺。設(shè)計了具有較高處理效率的緩沖區(qū)管理機(jī)制,對IPv6功能模塊進(jìn)行了裁減,對TCP模塊中的運(yùn)行狀態(tài)機(jī)和滑動窗口機(jī)制進(jìn)行了簡化。
參考文獻(xiàn):
[1] OKABEN. Mininum Requirement of IPv6 for Low Cost Network Appliance[EB/OL]. INTERNET- DRAFT,2001-2002.
[2]張杰.一種Web服務(wù)中IPv4/IPv6兼容的實(shí)現(xiàn)方案[J].微計算機(jī)信息,2006,10-3:31-72.
[3] CONTA A, DEERING S.Internet Control Message Protocol(ICMPv6),RFC 2463[S].Internet Engineering Task Force,1998.
[4] NARTENT. Neighbor Discovery for IP Version 6 (IPv6), RFC2461[S].1998.
[5] STEVENSWR.TCP/IP詳解(卷1:協(xié)議)[M].范建華,胥光輝,張濤,等譯.北京:機(jī)械工業(yè)出版社,1999.209-224.