基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)

基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)

ID:33508182

大?。?.47 MB

頁數(shù):69頁

時(shí)間:2019-02-26

基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)_第1頁
基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)_第2頁
基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)_第3頁
基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)_第4頁
基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)_第5頁
資源描述:

《基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、青海民族大學(xué)碩士學(xué)位論文設(shè)計(jì)題目:基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)姓名:葉西切忠學(xué)號(hào):0501070905院系:計(jì)算機(jī)學(xué)院專業(yè):中國少數(shù)民族語言文學(xué)研究方向:藏文信息處理及應(yīng)用指導(dǎo)教師:安見才讓教授青海民族大學(xué)研究生工作部2012年5月25日萬方數(shù)據(jù)基于web的藏文文本自動(dòng)分類研究與實(shí)現(xiàn)摘要隨著互聯(lián)網(wǎng)的普及和藏文信息技術(shù)的發(fā)展,藏文網(wǎng)站的數(shù)量越來越多,藏文信息資源從匱乏的時(shí)代過渡到極為豐富的藏文數(shù)字化時(shí)代。但面對(duì)海量的藏文信息資源,人們又很難得到實(shí)際需要的信息。因此,人們常對(duì)藏文網(wǎng)頁按照其內(nèi)容進(jìn)行分類。目前,用傳統(tǒng)的分

2、類方法來處理是不切實(shí)際的,必須借助計(jì)算機(jī)對(duì)藏文網(wǎng)頁進(jìn)行自動(dòng)分類,一來減少了人力的耗費(fèi)和財(cái)力的投資,二來提高了網(wǎng)頁分類的效率和準(zhǔn)確率。因此,用計(jì)算機(jī)進(jìn)行藏文網(wǎng)頁文本的自動(dòng)分類,可以滿足人們所期望對(duì)各類藏文文本分類應(yīng)用需求,這也成為迫在眉睫的研究課題。筆者認(rèn)為對(duì)藏文網(wǎng)頁文本自動(dòng)分類的研究在藏文搜索引擎、藏文數(shù)字圖書館和藏文出版等領(lǐng)域,以及對(duì)推動(dòng)藏文信息技術(shù)的發(fā)展與應(yīng)用有著重要的現(xiàn)實(shí)意義和使用價(jià)值。本文主要對(duì)藏文網(wǎng)頁的凈化、藏文分詞、特征選取、權(quán)值計(jì)算、分類算法等相關(guān)技術(shù)進(jìn)行了較深入的分析和研究,其中重點(diǎn)研究了藏文分詞和藏文網(wǎng)頁分

3、類算法,并借鑒現(xiàn)有的中英文分類算法,提出了符合藏文文法及藏文字結(jié)構(gòu)特征的分類算法,即詞頻統(tǒng)計(jì)+詞匹配法、基于標(biāo)題的藏文網(wǎng)頁分類算法和基于導(dǎo)航欄的藏文網(wǎng)頁分類算法的一種新的混合分類算法,該方法大大提高了基于web的藏文文本自動(dòng)分類系統(tǒng)的查全率和查準(zhǔn)率。最后實(shí)現(xiàn)了基于web的藏文文本自動(dòng)分類系統(tǒng),同時(shí)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析并具有良好的分類結(jié)果。關(guān)鍵詞:藏文網(wǎng)頁,自動(dòng)分類,藏文分詞,特征提取,分類算法;I萬方數(shù)據(jù)Web??????????????????????????????????????????????????????????

4、?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

5、?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

6、?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

7、?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

8、?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。