基于稀疏貝葉斯模型的文本分類(lèi)方案研究

基于稀疏貝葉斯模型的文本分類(lèi)方案研究

ID:35068739

大?。?.43 MB

頁(yè)數(shù):36頁(yè)

時(shí)間:2019-03-17

基于稀疏貝葉斯模型的文本分類(lèi)方案研究_第1頁(yè)
基于稀疏貝葉斯模型的文本分類(lèi)方案研究_第2頁(yè)
基于稀疏貝葉斯模型的文本分類(lèi)方案研究_第3頁(yè)
基于稀疏貝葉斯模型的文本分類(lèi)方案研究_第4頁(yè)
基于稀疏貝葉斯模型的文本分類(lèi)方案研究_第5頁(yè)
資源描述:

《基于稀疏貝葉斯模型的文本分類(lèi)方案研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、r瞧'誦1.隱.'‘^-'"..巧':;^\中:杳:.巧讀.'’.u’井中'、八'少r詰.'分類(lèi)號(hào)‘:10165C學(xué)校代碼;於山v:::密級(jí)::n子學(xué)號(hào):201211000719',‘、—v、一、'm遠(yuǎn)掌卽範(fàn)乂學(xué)蒙Ip碩±學(xué)位論文、’'■..::W觀!纖::、刻-.麵臺(tái):參嚇、獨(dú)確皂于稀疏貝葉斯模型的女本分類(lèi)方案研究、、-’.4-.、?:.,、.i.:作者姓名燕榮江滿::'’、皆’、.-.一.^、-:托.iy學(xué)科計(jì)算數(shù)學(xué).、

2、專(zhuān)業(yè);、占,壤研究方向:計(jì)算機(jī)輔助幾何設(shè)計(jì).-一丫-苗紫黃,試導(dǎo)師姓名:彭興薇副教授:,-?'II'I;巧‘.振為冉芭心、誦午。4月讀擊躁r;.'臟麵?絮、在鴻騎沒(méi)做c讀^HBH,如''儀輸Ilf屬謹(jǐn)11漏國(guó)學(xué)位論文獨(dú)創(chuàng)住聲明本人承諾:所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下所取得的研究成果。論丈中除恃別加tJl標(biāo)注和致謝的地方外,不包含他人和其他機(jī)構(gòu)己經(jīng)撰寫(xiě)或發(fā)表過(guò)的研巧成果,其他同志的研究成果對(duì)本人的啟示和所提供的幫助,均已在論文中做了明確的聲明并表示謝意。學(xué)位論文作者

3、笠名;學(xué)位論文版權(quán)的使用授權(quán)書(shū)本學(xué)位論文作者完全了解狂寧師范大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,及學(xué)校有權(quán)江保留并向國(guó)家有關(guān)部口或機(jī)構(gòu)送交復(fù)印件或磁盤(pán),允許論文被査閱和借閱。本文授權(quán)寧師范大學(xué),可W將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)并進(jìn)行檢索,可采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文,并且本人電子文檔的內(nèi)容和紙質(zhì)一論文的內(nèi)容相致。保密的學(xué)位論文在解密后使用本授權(quán)書(shū)。./學(xué)位論文作者簽名;若指導(dǎo)教師簽名:r、從、韋簽名日期:年J:月;4巧分類(lèi)號(hào):學(xué)校代碼:10165密級(jí):學(xué)號(hào):201

4、211000719碩士學(xué)位論文基于稀疏貝葉斯模型的文本分類(lèi)方案研究作者姓名:燕榮江學(xué)科、專(zhuān)業(yè):計(jì)算數(shù)學(xué)研究方向:計(jì)算機(jī)輔助幾何設(shè)計(jì)導(dǎo)師姓名:彭興璇2016年04月遼寧師范大學(xué)碩士學(xué)位論文摘要文本分類(lèi)是按照一定的分類(lèi)標(biāo)準(zhǔn)進(jìn)行自動(dòng)的標(biāo)記分類(lèi)的。這種智能化的分類(lèi)使得我們無(wú)需通過(guò)文本的表達(dá)等信息,就能從中得知后面的文本是否是自己所需要的。文本分類(lèi)一般包括文本的表達(dá)、分類(lèi)器的選擇、分類(lèi)結(jié)果的評(píng)價(jià)和反饋等過(guò)程。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,自動(dòng)文本成為行業(yè)先驅(qū)以及各種智能化、個(gè)性化的搜索引擎,并且在許多領(lǐng)域獨(dú)領(lǐng)風(fēng)騷。文章不僅對(duì)部分特征提取的工作做了細(xì)化,還對(duì)

5、各種算法和一些基本概念以及分類(lèi)器的選擇作出了說(shuō)明,并對(duì)文本分類(lèi)的問(wèn)題進(jìn)行了剖析并說(shuō)明其優(yōu)缺點(diǎn),以及如何更好的應(yīng)用它們。其次,針對(duì)各種算法存在的弊端提出了稀疏貝葉斯概率模型,使其能夠更好的適應(yīng)文本分類(lèi)的需要,并完善相關(guān)的技術(shù)。再次,通過(guò)判斷收縮因子的類(lèi)密度以及相關(guān)的性質(zhì),給出了必要的證明和解釋。稀疏貝葉斯概率模型大大提升了文本分類(lèi)的準(zhǔn)確度,使人力成本大幅降低。我們還利用了統(tǒng)計(jì)學(xué)習(xí)的辦法,對(duì)分類(lèi)器進(jìn)行了有效的分類(lèi),最后對(duì)各類(lèi)分類(lèi)器的優(yōu)缺點(diǎn)進(jìn)行了評(píng)價(jià),指明了模型的用途和相應(yīng)的局限性?,F(xiàn)今,統(tǒng)計(jì)方法已成為文本分類(lèi)領(lǐng)域的主要方法以及明確的標(biāo)準(zhǔn),這

6、樣應(yīng)用起來(lái)更加的得心應(yīng)手。我們采用的稀疏貝葉斯模型不僅降低了文本分類(lèi)的計(jì)算量,還提高了文本分類(lèi)的速度。我們的實(shí)驗(yàn)結(jié)果表明,稀疏貝葉斯模型在大數(shù)據(jù)方面優(yōu)于傳統(tǒng)的模型的算法,不僅有效的提高了查重率和分類(lèi)速度,還更好的實(shí)現(xiàn)面向?qū)ο蟮臏?zhǔn)確率。關(guān)鍵詞:文本分類(lèi);稀疏貝葉斯;權(quán)重;特征選擇;算法;向量空間模型-I-基于稀疏貝葉斯模型的文本分類(lèi)方案研究SPARSEBAYESIANMODELBASEDONTEXTCLASSFICATIONAbstractTextclassificationisautomaticallysignedandclassifi

7、edaccordingtocertainclassificationstandards.Thisintelligentclassificationmakesusbeabletoknowwhetherthesubsequenttextisneededbyuswithouttheexpressionoftextandotherinformation.Textclassificationgenerallyincludestextexpression,categorizationclassifierselection,evaluationand

8、feedbackofclassificationresults,etc.Withthedevelopmentofnetworktechnology,automatictextbecametheindustr

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。