隨著人們對智能化產(chǎn)品需求的增加,未來的嵌入式產(chǎn)品,包括各種家電、通信、PDA、儀器儀表等設備正逐漸走向網(wǎng)絡化,以共享互聯(lián)網(wǎng)中龐大的信息資源,因此使嵌入式設備的網(wǎng)絡化開發(fā)有廣闊市場前景,由于嵌入式硬件資源有限,而傳統(tǒng)的TCP/IP等網(wǎng)絡通信協(xié)議對計算機存儲器、運算速度的要求較高,所以不能直接應用,為此,必須開發(fā)一套適合嵌入式系統(tǒng)的、高度優(yōu)化的、最為精簡的TCP/IP協(xié)議棧。
開放式多媒體應用平臺OMAP(Open Multimedia Application Platform)是美國德州儀器公司推出的高度集成的軟硬件平臺。OMAP具有獨特的雙芯結(jié)構(gòu),結(jié)合了DSP與RISC內(nèi)核,可為無線多媒體設備提供獨一無二的性能和功耗優(yōu)勢,OMAP可連接十分豐富的外圍設備,包括USB、攝像頭、聲音設備、視頻設備、網(wǎng)絡設備等,OMAP擁有開放式體系結(jié)構(gòu),其應用環(huán)境完全可編程。
軟件協(xié)議的設計與實現(xiàn)在很大深度上決定了通信終端的質(zhì)量,基于OMAP的3G移動終端軟件協(xié)議結(jié)構(gòu)由信令協(xié)議棧和應用業(yè)務協(xié)議棧組成,如圖1所示,TCP/IP協(xié)議棧位于應用業(yè)務協(xié)議棧的底層,為上層的H.323協(xié)議棧提供基礎與服務,其性能質(zhì)量將直接決定整個通信終端軟件系統(tǒng)的運行質(zhì)量。因此,針對嵌入式系統(tǒng)聯(lián)網(wǎng)的發(fā)展方向,為OMAP系統(tǒng)其設計一套高效、簡潔的TCP/IP協(xié)議,對其應用具有十分重要的意義。
1 開發(fā)方案
PC上有功能強大的VC平臺和網(wǎng)絡分析工具(如Sniffer)便于調(diào)試,其設計不針對任何一個嵌入式芯片,具有較好的通用性和可移植性,在PC機上實現(xiàn)的TCP/IP協(xié)議,除了以太網(wǎng)層要結(jié)合OMAP平臺的網(wǎng)卡硬件重寫外,基本上可以直接移植到OMAP平臺上,不需要再做大的改動,作為一個通信程序,必須需要兩端程序同時調(diào)試,在PC機上編好的程序能度OMAP平臺上程序的調(diào)試提供可靠的幫助,因此,協(xié)議開發(fā)采用先模擬再移植、先整體再部分的設計思路,而協(xié)議各層實現(xiàn)的順序為自下而上。具體步驟是:
(1)在PC機上的Windows操作系統(tǒng)及VC6.0開發(fā)平臺上,實現(xiàn)嵌入式系統(tǒng)TCP/IP協(xié)議族的模擬器,該模擬器應該能實現(xiàn)TCP/IP協(xié)議的基本功能,包括以太網(wǎng)驅(qū)動程序、ARP、IP、UDP、TCP等,并且實現(xiàn)的ARP、IP、UDP、TCP層的程序應該通用于各嵌入式系統(tǒng)并可移植。
(2)將該模擬器移植到OMAP開發(fā)平臺,用其以太網(wǎng)卡的驅(qū)動程序替換原模擬器的鏈路層程序,在TI提供的CCS平臺上最終實現(xiàn)基于OMAP的TCP/IP協(xié)議。
2 開發(fā)平臺
OMAP的多媒體開發(fā)平臺Innovator主要由4個模塊組成:PM(處理器模塊)、IM(接口模塊)、M(擴展模塊)、BOB(主連接板)。OMAP處理器在PM上,以太網(wǎng)卡在BOB上,可以通過Innovator上的OMAP1510芯片的ARM微處理器對單片以太網(wǎng)控制器LAN91C96的工作進行控制,實現(xiàn)以太網(wǎng)幀的收發(fā),并通過CCS對程序調(diào)試,圖2為OMAP平臺調(diào)試環(huán)境。
3 在PC上實現(xiàn)協(xié)議的基本模塊
3.1 主要模塊介紹
(1)主流程:首先對TCP/IP協(xié)議族的各層初始化,成功則進入主循環(huán),主循環(huán)采用"中斷+循環(huán))"結(jié)構(gòu),簡單且分層清晰,中斷作為應用層發(fā)出命令,調(diào)用下層的入口。對于接收到的以太網(wǎng)幀,則由下到上分別進入各層進行處理。協(xié)議實現(xiàn)主流程如圖3所示。
(2)PC上的以太網(wǎng)層:在內(nèi)存中開辟接收和發(fā)送兩個相同的循環(huán)緩沖區(qū),用于存放接收和發(fā)送的以太網(wǎng)幀。 Winpcap軟件是基于Windows平臺的一個網(wǎng)絡包工具,它提供一個系統(tǒng)內(nèi)核級的動態(tài)鏈接庫Packet.dll作為標準的API,具有獨立于操作系統(tǒng)的編程接口。利用其提供的API可直接聯(lián)系網(wǎng)卡驅(qū)動與已定義的循環(huán)緩沖區(qū),將緩沖區(qū)中的數(shù)據(jù)發(fā)出,并將網(wǎng)卡接收的數(shù)據(jù)存入緩沖區(qū)。
(3)ARP層,在內(nèi)存中開辟一塊循環(huán)存儲區(qū)域用于存放已知的IP-MAC對應表,該表可以由上層添加,在接收到ARP應答時會自動添加,也可以上層清空。處理ARP層函數(shù)的過程中:根據(jù)以太網(wǎng)首部協(xié)議字段過濾出ARP包,針對ARP請求與ARP應答進行不同的處理,應答對方的請求,記錄對方的應答。
(4)IP層:根據(jù)以太網(wǎng)首部的幀類型標注判斷接收到的是不是IP包來處理IP層函數(shù),如果是:則調(diào)用IP包的接收函數(shù),對給收到的IP包用各種條件進行過濾,對于滿足條件的包獲取其長度與指針信息供上層使用。本層另一個主要函數(shù)是IP包發(fā)送函數(shù),由上層調(diào)用進行IP封裝。
IP的檢驗和僅包括IP首部,長度一般為20字節(jié)(如果沒有選項)。在接收端,丟棄檢驗和不為OxFFFF的包,在發(fā)送端,將計算所得值的反碼填入檢驗和字節(jié),由于主機和網(wǎng)絡對數(shù)據(jù)中高低字節(jié)默認的順序不同,在讀寫包中的16、32數(shù)據(jù)時,應該先進行高低字節(jié)的交換。
(5)UDP 層,處理UDP層函數(shù)應根據(jù)IP首部的協(xié)議字段判斷是否UDP包。如果是:則調(diào)用UDP包接收函數(shù),用各種條件對其進行過濾,提出UDP數(shù)據(jù)及各種有用信息,根據(jù)端口號提交給應用進程處理,本層的另一個主要函數(shù)是UDP發(fā)送函數(shù),實現(xiàn)封裝UDP包(包括載入UDP數(shù)據(jù),計算并填入UDP首部信息),最后調(diào)用IP發(fā)送函數(shù),較由IP層處理。
(6)TCP層:與UDP不同,TCP主機要進行數(shù)據(jù)通信之前,必須與對方建立連。與幾個主機通信,就要建立幾個連接。然而,若要知道接收到的TCP包屬于哪個連接且使得幾個不同的連接之間獨立工作、互不干擾,則需要定義TCP的控制模塊,這里用一個結(jié)構(gòu)體數(shù)組實現(xiàn),存放所有關于連接的信息。
?
處理TCP層函數(shù),判斷接收包的類型,如果是TCP包,則調(diào)用TCP接收函數(shù),TCP接收函數(shù)用指定條件進行過濾,找到該包所屬的連接或完成一個新連接的被動打開,根據(jù)TCP的狀態(tài)轉(zhuǎn)換則完成11種狀態(tài)的轉(zhuǎn)移,并且實現(xiàn)了多路數(shù)據(jù)同時、雙向的傳輸。
TCP的發(fā)送函數(shù)包括主動打開、主動關閉(由上層調(diào)用完成新連接的主動打開,或主動關閉一個已建立的連接)和發(fā)送控制包(用于TCP連接的建立與終止,會在TCP接收函數(shù)中調(diào)用,從而實現(xiàn)TCP的轉(zhuǎn)換)三個函數(shù)。
TCP層還實現(xiàn)了兩個定時器,TCP重傳定時器函數(shù)可提供服務可靠性的有效保障;TCP保活定時器能夠避免資源的浪費。
3.2 程序特點分析
(1)簡單性:4.4BSD-Lite版的完整TCP/IP內(nèi)核實現(xiàn)大約有15 000行,而本程序源代碼約有1 400行,更適合嵌入式系統(tǒng)的應用。
(2)可重用性:本程序分層清晰。對于不同的嵌入式系統(tǒng),可能使用的CPU和以太網(wǎng)卡不同,這就需要針對其特點的以太網(wǎng)層設計,而ARP、IP、UDP、TCP則不需要改動。
(3)可拓展性:TCP/IP協(xié)議是底層網(wǎng)絡協(xié)議,本程序留有很好的接口,可在其上構(gòu)件更高層的網(wǎng)絡協(xié)議,包括H.323協(xié)議、ftp、telnet。
4 在OMAP平臺上的移植
4.1 單片以太網(wǎng)控制器LAN91C96
LAN91C96是SMSC公司生產(chǎn)的專門用于嵌入式產(chǎn)品的10Mbps以太網(wǎng)控制器,具有性能優(yōu)良,功耗低及尺寸小的特點,如圖4所示。
6KB的RAM:用來存放數(shù)據(jù)包。
MMU:對RAM進行有效管理,為接收和發(fā)送包在RAM中分配存儲空間。
ARBITE:使MMU和RAM與CPU、CSMA很好地連接。
CSMA/CD模塊:集成了IEEE 802.3 MAC層協(xié)議,負責監(jiān)聽網(wǎng)絡情況和地址過濾。若目的地址是LAN91C96的地址、廣播地址或多播地址,則接收此數(shù)據(jù)包,否則拋棄。
ENDEC:負責與10Mbps為以太網(wǎng)物理媒體的連接。
LAN91C96 采用地址映射方式,通過訪問Innovator為的指定地址對其存儲器訪問。LAN91C96的寄存器在Innovator內(nèi)存中的地址分配為:0x08000300-0x0800030F。寄存器共有4組(BANK0-BANK3),使用相同的地址,通過BANK_SELECT寄存器選擇。
4.2 移植過程
先實現(xiàn)該網(wǎng)卡芯片的驅(qū)動程序,再用它替換PC模擬器的以太網(wǎng)層,程序驅(qū)動主要包括以下三個部分:
(1)初始化:主要為Lan91C96的各寄存器填入正確的初始值使其正常工作。
(2)接收:如圖5所示,由CSMA(載波偵聽模塊)接收到符合地址要求的后,MMU(存儲器管理單元)為其請求在RAM中分配存儲空間并分配一個編號,DMA 將其存入RAM。接著在接收數(shù)據(jù)的前面封裝STATUS的化COUNT字節(jié)信息,如果CRC檢測正確,則將其編號放入接收FIFO,如果接收FIFO不為空,則RCV_INT(接收中斷標識)被設置。檢查接收中斷寄存器狀態(tài),如果就接收中斷,對應其編號,上層協(xié)議便可以取出數(shù)據(jù)了,取出后,將該數(shù)據(jù)編號從 FIFO中清除。
狀態(tài)字可以從RCR寄存器中讀取,它反應了接收過程出現(xiàn)的各種措施,如CRC錯誤、接收幀過長等,數(shù)據(jù)包的編號從FIFO_PORTS寄存器中獲得,而數(shù)據(jù)指針可從POINTER寄存器中獲得,數(shù)據(jù)信息從DATA寄存器中得到,根據(jù)這些信息將接收數(shù)據(jù)包復制到CPU內(nèi)存,供上層使用,接收函數(shù)的主要流程如圖6。
(3)發(fā)送:圖7描述了發(fā)送數(shù)據(jù)包FIFO中的排隊過程,首先MMU在RAM中分配一定字節(jié)的存儲空間,然后,將分配結(jié)果寄存器中的編號放入PNR 寄存器,寫數(shù)據(jù)指針寄存器POINTER并將上層數(shù)據(jù)封裝后拷入DATA寄存器,根據(jù)其編號放入發(fā)送FIFO,排隊的包將自動發(fā)出,發(fā)出包的編號接著進入發(fā)送完成FIFO。如果發(fā)送成功,則存儲空間自動釋放;否則釋放存儲空間并將其重新排隊。
5 實驗結(jié)果
5.1 內(nèi)存資源占用量
運行該TCP/IP協(xié)議棧需要3MB內(nèi)存,而Innovator體32MB SDRAM 和32MB Flash,內(nèi)存占用率為:3M/64M=4.7%,完全適用于嵌入式系統(tǒng)。
5.2 數(shù)據(jù)傳輸可靠性
TCP 利用以下機制糾錯。數(shù)據(jù)的傳輸過程中的誤碼:檢驗和機制與重傳機制,數(shù)據(jù)的重復,在接收端會自動舍棄已經(jīng)接收過的數(shù)據(jù)包,并且不發(fā)ACK,故不會發(fā)生一個數(shù)據(jù)包接收多次的情況,數(shù)據(jù)包的丟失,接收端在接收完一段數(shù)據(jù)后,會計算下一個預期數(shù)據(jù)的序號,如果不符合就不發(fā)ACK,從而導致發(fā)端重發(fā),避免了數(shù)據(jù)包的丟失,經(jīng)測試,在未發(fā)生擁塞情況下,傳輸?shù)恼`碼率幾乎為0。
5.3文件最大平均傳輸速率
下面就本程序所實現(xiàn)的利用TCP進行文件傳輸功能,給出不同情況下的最大傳輸速率,實驗環(huán)境為10Mbps以太網(wǎng)。
理想狀態(tài)下的理論最大吞吐量:假定發(fā)送方傳輸兩個背對背、滿長度的TCP數(shù)據(jù),接收方為其發(fā)出兩個ACK,每包中用戶數(shù)據(jù)量為1460位,總數(shù)據(jù)量為1538位,故最大的用戶數(shù)據(jù)吞吐量為:
本實驗測得文件的平均傳輸速率隨著TCP連接數(shù)的增多有如圖8所示的曲線變化,前半段隨著連接數(shù)的增加成線性增長,后半段由于出現(xiàn)了網(wǎng)絡擁塞,整體的平均速率反而有所下降。
實驗結(jié)果與理論最大吞吐量有所差距,原因在于:[!--empirenews.page--]
(1)理論上只是一種理想的狀態(tài),現(xiàn)實中難以達到。
(2)受CPU處理速度及文件傳輸過程的讀、寫文件操作的限制。
(3)本程序采用的數(shù)據(jù)傳輸機制是當收到上一個包的ACK之后再發(fā)送下一個數(shù)據(jù)包,這樣避免了對接收數(shù)據(jù)的排序,提高了可靠性,但數(shù)據(jù)的傳輸速度會受到制約。