資源描述:
《基于貝葉斯算法分類的反垃圾郵件系統(tǒng)的改進(jìn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、長春工業(yè)大學(xué)碩士學(xué)位論文學(xué)位論文題目:基于貝葉斯算法分類的反垃圾郵件系統(tǒng)的改進(jìn)III長春工業(yè)大學(xué)碩士學(xué)位論文學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律后果由本人承擔(dān)。作者簽名:日期:年月日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留
2、并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán) 大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。涉密論文按學(xué)校規(guī)定處理。作者簽名:日期:年月日導(dǎo)師簽名:日期:年月日III長春工業(yè)大學(xué)碩士學(xué)位論文摘 要電子郵件成為一種快捷、經(jīng)濟的現(xiàn)代通信技術(shù)手段,極大地方便了人們的通信與交流。然而,垃圾郵件的產(chǎn)生,影響了正常的電子郵件通信,占用了傳輸帶寬,對系統(tǒng)安全造成了嚴(yán)重的威脅。因此,研究反垃圾郵件問題已經(jīng)成為全球
3、性的具有重大現(xiàn)實意義的課題。目前,應(yīng)對垃圾郵件的主要方法和手段是通過反垃圾郵件立法和使用郵件過濾技術(shù)進(jìn)行處理,現(xiàn)已相繼出現(xiàn)了多種郵件過濾技術(shù)。常用的包括黑/白名單技術(shù)、基于內(nèi)容的分析方法以及基于規(guī)則的方法等?;趦?nèi)容分析的技術(shù)正逐步進(jìn)入郵件過濾技術(shù)當(dāng)中,并成為當(dāng)前研究熱點,其中,基于內(nèi)容分析的郵件過濾方法中的典型方法是基于貝葉斯算法的垃圾郵件過濾模型。本論文對中文垃圾郵件的特點進(jìn)行了比較系統(tǒng)的分析和研究,結(jié)合貝葉斯(Bayes)理論,構(gòu)造基于貝葉斯分類的垃圾郵件過濾模型,在特征提取方面,采用互信息值的方法
4、,在分類方法上,引入了適合本文的分類方法,并采用了一種更加適合于貝葉斯計算的表示方法;本文作者采用中國教育科研網(wǎng)(CERNET)收集并維護(hù)的大量中文垃圾郵件和正常郵件樣本的標(biāo)準(zhǔn)數(shù)據(jù)集,對本文研究的方法進(jìn)行了大量測試,準(zhǔn)確率和誤判率分別達(dá)到了95.8%和5.3%。結(jié)果表明基于貝葉斯算法的垃圾郵件過濾系統(tǒng)對攔截垃圾郵件有很好的作用。關(guān)鍵詞:電子郵件,垃圾郵件,郵件過濾,貝葉斯理論III長春工業(yè)大學(xué)碩士學(xué)位論文AbstractThee-mailhasbecomeaquickandeconomicalmeanso
5、fmoderncommunicationtechnology,whichenormouslyfacilitatespeople'scommunicationandexchanges.However,theemergenceofspamhasaffectedthenormalemailcorrespondence,andtakenthetransmissionbandwidth,evenposedtheseriousthreattothesystemsafety.Therefore,thestudyofan
6、ti-spamhasbecomeaglobalproblemofgreatpracticalsignificanceofthetopic.Atpresent,themainwaysandmeansoftheresponsetospamaretheanti-spamlegislationandtheuseofmailfilteringtechnology.Butnowavarietyofmailfilteringtechnologieshaveappearedinsuccession,whichareusu
7、allyusedincludingblack/whitelisttechnologies,content-basedanalysismethods,andrule-basedmethods.Content-basedanalysistechniquesaregraduallyenteringthemailfilteringtechnologywhichhasbecomehotspotsofcurrentresearch.Thetypicalmethodofcontent-basedanalysismail
8、filteringmethodsisbasedonBayesianalgorithmforspamfilteringmodel.Inthispaper,theChinesecharacteristicsofspamhasbeenstudiedandanalyzedsystematically.CombiningwithBayesian(Bayes)theory,thispaperconstructsthespamfilteri