l NetFlow技術(shù)
NetFlow是Cisco公司提出的基于Cisco IOS系統(tǒng)的一種應(yīng)用。它用于提供網(wǎng)絡(luò)設(shè)備上數(shù)據(jù)包形成的“流”的統(tǒng)計信息,并逐漸演變成為網(wǎng)絡(luò)流量統(tǒng)計和安全分析的主要手段。目前利用:NetFlow可以實現(xiàn)網(wǎng)絡(luò)流量監(jiān)測,用戶應(yīng)用監(jiān)控,網(wǎng)絡(luò)安全,網(wǎng)絡(luò)規(guī)劃以及流量計費等功能。
NetFlow有兩個核心的組件:NetFlow緩存,存儲IP流信息;NetFlow的數(shù)據(jù)導(dǎo)出或傳輸機(jī)制,NetFlow利用此機(jī)制將數(shù)據(jù)發(fā)送到網(wǎng)絡(luò)管理采集器。
1.1 流(Flow)的定義
一條流由一個源主機(jī)與一個目的主機(jī)間的單方向傳輸?shù)木W(wǎng)絡(luò)數(shù)據(jù)包組成,其中,源和目的主機(jī)由各自的IP地址和端口號來標(biāo)識。一條流一般由以下七個關(guān)鍵字段惟一標(biāo)識:
·源地址
·目的地址
·源端口號
·目的端口號
·第3層協(xié)議類型(如TCP,UDP)
·服務(wù)類型
·入邏輯接口標(biāo)示符
1.2 流(Flow)格式
啟動NetFlow的設(shè)備會輸出其緩沖區(qū)里的信息,以UDP包的形式傳送給NetFlow流量采集器。包由包頭和若干流記錄組成。常用的NetFlOW輸出包格式共有5個版本,它們分別是Version 1,Version 5,Ver-sion 7,Version 8和Version 9,其中V5是最為流行和成熟的版本,目前得到最廣泛的使用。最新的V9已經(jīng)被列入IETF的標(biāo)準(zhǔn),并有待進(jìn)一步研究和規(guī)范。V9采用了模板技術(shù)與流記錄相結(jié)合的方式,使NetFlow輸出包的格式具有動態(tài)和可擴(kuò)展的特性。NetFlow V9的輸出格式主要由三部分構(gòu)成:
(1)包頭部(Packet Header):包括版本號、包中數(shù)據(jù)流總數(shù)、系統(tǒng)時間、數(shù)據(jù)流序列、數(shù)據(jù)源ID等。
(2)模板流集(Template FlowSet):包含一個或多個模板,模板是用于描繪數(shù)據(jù)流中各個數(shù)據(jù)段的含義,可以在路由器上根據(jù)需要自行設(shè)置模板。
(3)數(shù)據(jù)流集(。Data FlowSet):包含多個數(shù)據(jù)流,每個數(shù)據(jù)流集通過模板ID對應(yīng)某個模板。數(shù)據(jù)采集端根據(jù)模板來解析數(shù)據(jù)流。
2 NetFlow流量采集與聚合
2.1 系統(tǒng)概述
根據(jù)NetFlow的特點,設(shè)計并實現(xiàn)了一個網(wǎng)絡(luò)流量監(jiān)測系統(tǒng),其系統(tǒng)結(jié)構(gòu)如圖1所示。
當(dāng)NetFlow采集器接收到從路由器發(fā)送來的Net-Flow數(shù)據(jù)包后,采集器將進(jìn)行數(shù)據(jù)包的解析和數(shù)據(jù)流聚合,形成多種適合統(tǒng)計分析需要的數(shù)據(jù),再分門別類地存入數(shù)據(jù)庫。分析器則根據(jù)前端不同的查詢請求,依照一定的查詢策略從數(shù)據(jù)庫不同的表中提取相應(yīng)數(shù)據(jù)進(jìn)行分析展現(xiàn)。
本系統(tǒng)的后臺采集器和聚合處理部分用JAVA編寫實現(xiàn),數(shù)據(jù)庫采用開源的MySQL,而NetFlow流量分析利用Tomcat服務(wù)器通過Web方式展現(xiàn),前臺部分用JSP編寫實現(xiàn)。工作的重點即在于數(shù)據(jù)采集、數(shù)據(jù)聚合以及數(shù)據(jù)庫設(shè)計部分。
2.2 NetFlow流采集
2.2.1 采集器的設(shè)計
數(shù)據(jù)采集模塊是整個系統(tǒng)的基礎(chǔ)。由于。NetFlow數(shù)據(jù)流量非常大,為防止丟包系統(tǒng)采用緩沖區(qū)和線程池結(jié)構(gòu),如圖2所示。
當(dāng)采集器監(jiān)聽到一個NetFlow數(shù)據(jù)包時,將該數(shù)據(jù)包接收到緩沖區(qū),并從包解析線程池中取出一個線程,根據(jù)相應(yīng)的NetFlow的報文格式解析出數(shù)據(jù)流信息,將該原始流信息放入緩沖區(qū),然后將原始流存入數(shù)據(jù)庫,同時采用相應(yīng)的聚合策略聚合原始流生成聚合流并存入相應(yīng)的數(shù)據(jù)庫中。
2.2.2 NetFlow數(shù)據(jù)包接收與解析
由于NetFlow數(shù)據(jù)是借助于UDP數(shù)據(jù)報來傳送,因而倘若后續(xù)的處理速度跟不上數(shù)據(jù)包到達(dá)的速度,則會出現(xiàn)嚴(yán)重丟包的現(xiàn)象。為解決高速大流量數(shù)據(jù)的及時接收及較低丟包率問題,采用了多線程的方式來實現(xiàn)。用獨立的兩個線程分別完成數(shù)據(jù)接收和解析操作:接收數(shù)據(jù)的線程在特定的IP地址監(jiān)聽相應(yīng)的UDP端口,接收到的數(shù)據(jù)暫存在緩沖區(qū)中;解析線程從緩沖區(qū)提取數(shù)據(jù),按照相應(yīng)的報文格式進(jìn)行解析。由于接收線程和解析線程共享同一個臨界資源,即接收的緩沖區(qū),需要對臨界資源進(jìn)行加鎖操作。
下面為部分實現(xiàn)多線程采集的JAVA代碼實例,其中packet為接收的NetFlow數(shù)據(jù)包對象,linkedLst為linkedList容器,利用synchronized進(jìn)行線程間同步。
(1) 接收線程
2.3 NetFlow流聚合
NetFlow的原始數(shù)據(jù)數(shù)據(jù)量非常龐大,保存每一條流數(shù)據(jù)的原始記錄將會使對數(shù)據(jù)進(jìn)行查詢分析時產(chǎn)生效率低下的問題,在絕大部分應(yīng)用中也沒有必要把數(shù)據(jù)粒度設(shè)計得如此之小。所謂流量聚合,是指對符合NetFlow數(shù)據(jù)格式的原始流記錄根據(jù)一定條件進(jìn)行流量合并,實現(xiàn)多條流合并為一條的過程,以實現(xiàn)原始流的壓縮整理。
2.3.1 聚合策略
流量聚合有三個關(guān)鍵要素:聚合條件(F)、時間粒度(T)和聚合項(C)。滿足相同聚合條件和時間粒度的流進(jìn)行流量疊加,并保留聚合項。三元組聚合策略:<F,T,c>,其中:
按照實際流量分析的需要,從F,T,C中各取出一個值組成一個聚合策略。對于T的粒度要根據(jù)實際監(jiān)控的時間長短和監(jiān)測精度來設(shè)置,一般來說T=3 min適合于當(dāng)天實時流量的監(jiān)測;T=30 min用于一周流量的分析;T=3 h用于一月內(nèi)流量的分析。
2.3.2 聚合的實現(xiàn)
對于一個新采集的原始流,必須能根據(jù)其所攜帶的聚合條件信息快速匹配是否已存在與其相同聚合條件的聚合流,若有則做流量疊加,若沒有則創(chuàng)建一條新的聚合流。Hash表具有從Key快速映射到Value的特點,這種特點對于實時性較高的聚合非常有意義。圖3為流量聚合的}Iash表設(shè)計。
在圖3中聚合條件(F)作為Key,聚合項(C)作為Hash函數(shù)的映射值,時間粒度(T)作為Hash表導(dǎo)出到數(shù)據(jù)庫的時間。這樣可以滿足實時流量監(jiān)測的需要,同時也壓縮數(shù)據(jù)減少存儲空間,提高數(shù)據(jù)的查詢效率。
3 實際NetFlow流采集與流量監(jiān)測
在本系統(tǒng)設(shè)計的數(shù)據(jù)采集器的支持下,系統(tǒng)數(shù)據(jù)庫為前端分析提供了充足且多樣化的數(shù)據(jù)準(zhǔn)備,前端程序只需通過簡單的查詢語句即可得到所需的數(shù)據(jù)集,簡化了查詢的工作量。利用該系統(tǒng)采集NetFlow數(shù)據(jù)包50 000個,時間持續(xù)約7 h,時間粒度為3 min,主要檢驗丟包情況,以及聚合后壓縮效率。這次采集無丟包發(fā)生,表1為該系統(tǒng)采集的數(shù)據(jù)結(jié)果。
圖4是系統(tǒng)由所采集的數(shù)據(jù)生成的該時段的流量監(jiān)測圖。
4 結(jié) 語
NetFlow數(shù)據(jù)流的海量特征使得服務(wù)器程序的效率至關(guān)重要,因此基于NetFlow的流量監(jiān)測的主要任務(wù)是如何根據(jù)應(yīng)用保存最重要的網(wǎng)絡(luò)流特征以及如何更高效地實現(xiàn)數(shù)據(jù)檢索?;贜etFlow特點,提出了一套適用于大流量網(wǎng)絡(luò)的流量采集與聚合存儲方案。流量采集通過多線程和緩沖區(qū)機(jī)制實現(xiàn),有效提高了流量采集的可靠性。采集的原始流經(jīng)聚合,并通過合理的分級存儲策略進(jìn)行存儲組織,為前端的數(shù)據(jù)分析提供了全面支持。本系統(tǒng)在實際應(yīng)用中取得了良好效果。下一步還將對采集和多級聚合存儲方案進(jìn)行改進(jìn),以豐富系統(tǒng)對網(wǎng)絡(luò)流量統(tǒng)計分析功能,并力爭為異常流量分析提供較為完善的數(shù)據(jù)支持。
北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報告》,報告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...
關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心東京2022年10月18日 /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運國際物流有限公司(Nipp...
關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP要問機(jī)器人公司哪家強,波士頓動力絕對是其中的佼佼者。近來年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機(jī)器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...
關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車