資源描述:
《基于隱馬爾可夫模型的中文詞義消歧方法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、工學(xué)碩士學(xué)位論文基于隱馬爾可夫模型的中文詞義消歧方法研究孫彥晨哈爾濱理工大學(xué)2016年3月國內(nèi)圖書分類號:TP391.2工學(xué)碩士學(xué)位論文基于隱馬爾可夫模型的中文詞義消歧方法研究碩士研究生:孫彥晨導(dǎo)師:張春祥申請學(xué)位級別:工學(xué)碩士學(xué)科、專業(yè):計算機科學(xué)與技術(shù)所在單位:計算機科學(xué)與技術(shù)學(xué)院答辯日期:2016年3月授予學(xué)位單位:哈爾濱理工大學(xué)ClassifiedIndex:TP391.2DissertationfortheMasterDegreeinEngineeringChineseWordSenseDisambiguationBasedonHiddenMarkovModelC
2、andidate:SunYanchenSupervisor:ZhangChunxiangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈爾濱理工大學(xué)碩±學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:此處所提交的碩±學(xué)位論文《基于隱馬爾可夫模型的中文詞義消歧技術(shù)研巧》,是本人在導(dǎo)師指導(dǎo)下,在哈爾濱理工大學(xué)攻
3、讀碩±學(xué)位期間獨立進行研巧工作所取得的成果。據(jù)本人所知,論文中除已注明部分外不包含他人已發(fā)表或撰寫過的研究成果。對本文研巧工作做出貢獻的個人和集體,均己在文中明確方式注明。本聲明的法律結(jié)果將完全由本人承擔(dān)。。乂作者簽名日期:2年W月?巧哈爾濱理工大學(xué)碩±學(xué)位論文使用授權(quán)書《基于隱馬爾可夫模型的中文詞義消歧技術(shù)研究》系本人在哈爾濱理工大學(xué)攻讀碩±學(xué)位期間在導(dǎo)師指導(dǎo)下完成的碩±學(xué)位論文。本論文的研巧成果歸哈。爾濱理工大學(xué)所有,本論文的研究內(nèi)容不得其他單位的名義發(fā)表本人完全了解哈爾濱理工大學(xué)關(guān)于保存、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向有關(guān)
4、部口提交論文和電子版本。,允許論文被查閱和借閱本人授權(quán)哈爾濱理工大學(xué)可、縮印或其他復(fù)制手段保存論文,可W公布論文的全部或部分內(nèi)1^采用影印容。■本學(xué)位論文屬于保密,在年解密后適用授權(quán)書。I□不保密0。(請在W上相應(yīng)方框內(nèi)打V)日期‘作者簽名:年W月日o?i導(dǎo)師簽名;:日期年的月日基于隱馬爾可夫模型的中文詞義消歧技術(shù)研究摘要在自然語言中,一詞多義的現(xiàn)象普遍存在,這使得機器對自然語言的處理變得十分困難,詞義消歧是自然語言處理領(lǐng)域的一個關(guān)鍵問題。詞義消歧的目標(biāo)就是讓機器能夠在特定的上下文中自動判斷歧義詞的準(zhǔn)確含義。在信息檢索、主題跟蹤、文本
5、分類和機器翻譯等方面,都有著十分重要的作用。到目前為止,詞義消歧一直是困擾計算語言研究者的復(fù)雜問題。本文的主要研究內(nèi)容是基于機器學(xué)習(xí)理論的有監(jiān)督詞義消歧方法,這種方法是目前詞義消歧領(lǐng)域中的主流研究方法。該方法有著很強的擴展性和靈活性,能夠應(yīng)對不同語言并適應(yīng)語言的發(fā)展。本文的主要研究內(nèi)容有以下幾個部分:首先,對詞義消歧領(lǐng)域的發(fā)展情況進行了闡述,并列舉了有代表性的方法。對消歧模型的權(quán)威評價體系進行了介紹,并闡述了影響詞義消歧研究的仍未解決的問題。其次,介紹了消歧過程中所用到的語料及詞典,對語料的解析過程、語料的性能、消歧特征的提取和選擇進行了研究。為了判定分類器結(jié)果的正確性,研
6、究了兩種映射方法。在分析了同義詞詞林中對語義分類方式后,選擇兩層語義代碼作為消歧特征,以此來優(yōu)化隱馬爾可夫模型,構(gòu)建了基于隱馬爾可夫模型的消歧分類器。最后,將詞義消歧看作隱馬爾可夫模型的解碼問題,提出了基于維特比算法的消歧算法,并詳細講解了算法的計算過程。做了兩組實驗來評價本文所提出的方法。關(guān)鍵詞自然語言處理;詞義消歧;特征提??;隱馬爾可夫模型-I-ChineseWordSenseDisambiguationBasedonHiddenMarkovModelAbstractInnaturallanguage,thepolysemyphenomenonisuniversal.S
7、oitisverydifficultforthemachinetoprocessnaturallanguage.Wordsensedisambiguation(WSD)isanimportantprobleminnaturallanguageprocessing.Thetaskofwordsensedisambiguationistodeterminetheexactmeaningofanambiguouswordsinaspecificcontext.Ithasimportantrolesininformatio