資源描述:
《基于支持向量機(jī)的網(wǎng)絡(luò)流量識(shí)別模型》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、為了確保“教學(xué)點(diǎn)數(shù)字教育資源全覆蓋”項(xiàng)目設(shè)備正常使用,我校做到安裝、教師培訓(xùn)同步進(jìn)行。設(shè)備安裝到位后,中心校組織各學(xué)點(diǎn)管理人員統(tǒng)一到縣教師進(jìn)修學(xué)校進(jìn)行培訓(xùn),熟悉系統(tǒng)的使用和維護(hù)?;谥С窒蛄繖C(jī)的網(wǎng)絡(luò)流量識(shí)別模型 摘要:針對(duì)網(wǎng)絡(luò)流量識(shí)別問(wèn)題,提出一種基于支持向量機(jī)的網(wǎng)絡(luò)流量識(shí)別模型。首先通過(guò)流量特征提取模塊,提取適合在支持向量機(jī)中識(shí)別網(wǎng)絡(luò)流量的6個(gè)主要特征。對(duì)數(shù)據(jù)進(jìn)行清洗、預(yù)處理以及訓(xùn)練和學(xué)習(xí),從而實(shí)現(xiàn)整個(gè)基于SVM的網(wǎng)絡(luò)流量識(shí)別系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,經(jīng)過(guò)交叉檢驗(yàn)選擇參數(shù)后,再用支持向量機(jī)模型進(jìn)行訓(xùn)練和學(xué)習(xí),
2、可以取得較好的分類(lèi)效果?! £P(guān)鍵詞:網(wǎng)絡(luò)流量;支持向量機(jī);流量識(shí)別 DOIDOI:/ 中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672--0162-03 0引言為了充分發(fā)揮“教學(xué)點(diǎn)數(shù)字教育資源全覆蓋”項(xiàng)目設(shè)備的作用,我們不僅把資源運(yùn)用于課堂教學(xué),還利用系統(tǒng)的特色欄目開(kāi)展課外活動(dòng),對(duì)學(xué)生進(jìn)行安全教育、健康教育、反邪教教育等豐富學(xué)生的課余文化生活。為了確?!敖虒W(xué)點(diǎn)數(shù)字教育資源全覆蓋”項(xiàng)目設(shè)備正常使用,我校做到安裝、教師培訓(xùn)同步進(jìn)行。設(shè)備安裝到位后,中心校組織各學(xué)點(diǎn)管理人員統(tǒng)一到縣教師進(jìn)修學(xué)校進(jìn)行
3、培訓(xùn),熟悉系統(tǒng)的使用和維護(hù)?! 【W(wǎng)絡(luò)流量識(shí)別一直以來(lái)都是業(yè)界研究的重點(diǎn)[1]。目前,網(wǎng)絡(luò)流量分類(lèi)和識(shí)別主要分為4種類(lèi)型:基于端口識(shí)別、基于應(yīng)用協(xié)議特征字識(shí)別、行為特征的啟發(fā)式識(shí)別、基于機(jī)器學(xué)習(xí)方法的分類(lèi)和識(shí)別[2-3]。隨著端口跳變、信息隱藏等技術(shù)的廣泛采用,基于特征端口的識(shí)別方法已經(jīng)不再適用于網(wǎng)絡(luò)流量的識(shí)別與檢測(cè)[4];基于應(yīng)用協(xié)議特征字的識(shí)別雖然準(zhǔn)確率比較高,但由于需要獲取分組的應(yīng)用層負(fù)載,對(duì)處理效率的影響較為嚴(yán)重,并且涉及到隱私保護(hù)等法律問(wèn)題,故不被廣泛采用[5];基于行為特征的啟發(fā)式識(shí)別是綜合利用流
4、的屬性、統(tǒng)計(jì)特性以及流的行為特征,按照啟發(fā)式負(fù)責(zé)對(duì)流量進(jìn)行分析,達(dá)到對(duì)網(wǎng)絡(luò)流量分類(lèi)和識(shí)別的目的,但其分類(lèi)和識(shí)別結(jié)果不確定,而是基于概率的結(jié)果,因此識(shí)別方法的精度取決于網(wǎng)絡(luò)流量應(yīng)用特征的顯著程度和啟發(fā)式規(guī)則對(duì)這種特征的覆蓋能力[6]。近年來(lái),基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量識(shí)別方法表現(xiàn)出了較高的準(zhǔn)確率,因此得到越來(lái)越多研究者的青睞[7-8]?! ”疚乃懻摰木W(wǎng)絡(luò)流量識(shí)別問(wèn)題,其本質(zhì)上就是一個(gè)二分類(lèi)問(wèn)題,考慮到SVM在解決二分類(lèi)問(wèn)題中的卓越性能,以及其具有的學(xué)習(xí)能力,故采用它來(lái)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)中正常流量和異常流量的初步識(shí)別。
5、 基于以上觀點(diǎn),本文提出一種基于SVM的網(wǎng)絡(luò)流量二分類(lèi)識(shí)別方法,與只采用特征值匹配的識(shí)別網(wǎng)絡(luò)流量方法相比,大大減少了特征值匹配模塊的工作量,提高了網(wǎng)絡(luò)流量識(shí)別系統(tǒng)效率?! ?基于SVM的流量識(shí)別系統(tǒng) 本文首先通過(guò)流量特征提取模塊,提取適合在支持向量機(jī)中識(shí)別的網(wǎng)絡(luò)流量的6個(gè)主要特征。接著,對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理,通過(guò)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),從而實(shí)現(xiàn)整個(gè)基于SVM的網(wǎng)絡(luò)流量識(shí)別系統(tǒng)?! ×髁刻卣魈崛∧KC和Υ為了充分發(fā)揮“教學(xué)點(diǎn)數(shù)字教育資源全覆蓋”項(xiàng)目設(shè)備的作用,我們不僅把資源運(yùn)用于課堂教學(xué),還利用系統(tǒng)的特色欄
6、目開(kāi)展課外活動(dòng),對(duì)學(xué)生進(jìn)行安全教育、健康教育、反邪教教育等豐富學(xué)生的課余文化生活。為了確?!敖虒W(xué)點(diǎn)數(shù)字教育資源全覆蓋”項(xiàng)目設(shè)備正常使用,我校做到安裝、教師培訓(xùn)同步進(jìn)行。設(shè)備安裝到位后,中心校組織各學(xué)點(diǎn)管理人員統(tǒng)一到縣教師進(jìn)修學(xué)校進(jìn)行培訓(xùn),熟悉系統(tǒng)的使用和維護(hù)。 本模塊采用了開(kāi)源軟件Winpcap進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的捕獲分析,選取數(shù)據(jù)包在特定時(shí)間間隔內(nèi)本機(jī)連接出去的IP數(shù)、端口數(shù)、包長(zhǎng)、包數(shù)、上行速度和下行速度6大特征信息。 基于SVM的P2P流量識(shí)別模塊 本模塊主要?ν?1中提取出的流量統(tǒng)計(jì)特征信息進(jìn)行整理
7、,剔除冗余數(shù)據(jù),并將其轉(zhuǎn)換為特征向量形式,采用支持向量機(jī)的方法將其交給SVM進(jìn)行訓(xùn)練,訓(xùn)練后得到一組支持向量,即今后的預(yù)測(cè)模型。將預(yù)測(cè)模型與預(yù)處理過(guò)的待預(yù)測(cè)特征向量共同代入SVM的決策函數(shù)中,從而判別出該網(wǎng)絡(luò)流量是否為P2P流?! ☆A(yù)處理 對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,即對(duì)數(shù)據(jù)進(jìn)行縮放的目的在于: ?、俦苊獠糠痔卣髦捣秶^(guò)大而另一部分特征值范圍過(guò)??; ②避免訓(xùn)練時(shí)為了計(jì)算核函數(shù)而計(jì)算內(nèi)積時(shí)引起數(shù)值計(jì)算困難。 因此通常將數(shù)據(jù)縮放到[-1,1]或者是[0,l]之間,本文采用默認(rèn)縮放范圍[-1,1]。 尋找最優(yōu)參數(shù)
8、C、Υ 數(shù)據(jù)預(yù)處理后,便可以利用網(wǎng)格搜索法來(lái)交叉驗(yàn)證尋找核函數(shù)RBF對(duì)于訓(xùn)練數(shù)據(jù)集的最優(yōu)參數(shù)C和Υ[9]。為了識(shí)別出好的,以便分類(lèi)器能準(zhǔn)確地預(yù)測(cè)未知數(shù)據(jù)?! ∧P陀?xùn)練為了充分發(fā)揮“教學(xué)點(diǎn)數(shù)字教育資源全覆蓋”項(xiàng)目設(shè)備的作用,我們不僅把資源運(yùn)用于課堂教學(xué),還利用系統(tǒng)的特色欄目開(kāi)展課外活動(dòng),對(duì)學(xué)生進(jìn)行安全教育、健康教育、反邪教教育等豐富學(xué)生的課余文化生活。為了確?!敖虒W(xué)點(diǎn)數(shù)字教育資源全覆蓋”項(xiàng)目設(shè)備正常使用,我校做到