中文短文本情感傾向性的分析研究

中文短文本情感傾向性的分析研究

ID:32258755

大?。?.53 MB

頁數(shù):76頁

時間:2019-02-02

中文短文本情感傾向性的分析研究_第1頁
中文短文本情感傾向性的分析研究_第2頁
中文短文本情感傾向性的分析研究_第3頁
中文短文本情感傾向性的分析研究_第4頁
中文短文本情感傾向性的分析研究_第5頁
資源描述:

《中文短文本情感傾向性的分析研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫

1、CategoryNumber:LevelofSecrecy:SerialNumber:StudentNumber:50100812308Master'sDissertationofChongqingUniversityofTechnologyResearchonChineseShort-TextSentimentAnalysisPostgraduate:SongJingjingSupervisor:Prof.YangWuSpecialty:ComputerAppliedTechnologyResearchDirection:Infor

2、mationRetrievalTrainingUnit:ComputerScienceSchoolThesisDeadline:April10,2013OralDefenseDate:May30,2013重慶理工大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學位論文是本人在導(dǎo)師的指導(dǎo)下,獨立進行研究所取得的成果。除文中特別加以標注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果、作品。對本文的研究做出重要貢獻的集體和個人,均已在文中以明確方式標明。本人承擔本聲明的法律后果。作者簽名:日期:年月日學位論文使用授權(quán)聲明本學位

3、論文作者完全了解學校有關(guān)保留、使用學位論文的規(guī)定,同意學校保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)重慶理工大學可以將本學位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學位論文。本學位論文屬于(請在以下相應(yīng)方框內(nèi)打“√”):1.保密□,在年解密后適用本授權(quán)書。2.不保密□。作者簽名:日期:年月日導(dǎo)師簽名:日期:年月日摘要摘要隨著互聯(lián)網(wǎng)的飛速發(fā)展,以網(wǎng)上論壇、微博等形式為主的帶有個人情感色彩的言論信息迅速膨脹,這些言論信息多數(shù)是人們對網(wǎng)購商品、影視作品

4、、公眾人物、熱點事件等發(fā)表的評論,蘊含著巨大的商業(yè)價值和社會價值,分析這些信息具有很大的現(xiàn)實意義。文本情感分析是指通過分析和挖掘文本中的表達情感、觀點和立場的主觀性信息并判斷其情感傾向。它涉及計算機語言學、機器學習、信息檢索等眾多領(lǐng)域,具有廣泛的應(yīng)用價值。目前針對中文的情感分析仍處于起步階段,各項技術(shù)尚未成熟,情感分析系統(tǒng)由實驗走向?qū)嵱?,還有很長的路要走。本文以微博消息為研究對象,針對句子級中文短文本的情感傾向分析進行研究,主要內(nèi)容涉及以下三個方面。首先,構(gòu)建了多分類情感詞典。通過對情感詞的極性分析,提出將情感詞分為靜態(tài)情感詞、動態(tài)情

5、感詞、網(wǎng)絡(luò)熱點詞和情感短語四類,并對動態(tài)情感詞的極性判別方式進行研究。其次,提出了基于規(guī)則過濾和機器學習的觀點句識別方法。根據(jù)微博語言特點,制定觀點句和非觀點句的過濾規(guī)則,并設(shè)計了基于上下文滑動窗口的觀點句規(guī)則匹配算法。然后針對機器學習分類方法中觀點句的特征提取方式進行了研究,對觀點句的特征選取方式進行了創(chuàng)新,不但抽取了傳統(tǒng)信息處理方法中的普通文本特征,還針對微博的自身特點提取了相應(yīng)的特征。最后,提出了多策略觀點句極性判別方法。根據(jù)不同的觀點句類型,分別采用基于情感詞典、基于機器學習和基于依存句法分析三種方法對觀點句的情感極性進行判別

6、。其中研究了基于機器學習情感分類方法中褒義句和貶義句的特征選取,提出了基于依存句法分析的情感依存關(guān)系對抽取方法和句子情感極性判別方法。實驗以提出的情感分析方法為基礎(chǔ),借助中科院分詞工具、哈工大依存句法分析工具以及LibSVM工具包,共同構(gòu)建了文本情感分析處理系統(tǒng),并以NLP&CC2012評測語料作為測試數(shù)據(jù)進行了句子級短文本的情感分析。實驗結(jié)果表明,本文提出的短文本情感分析方法在準確率和召回率方面均比改進前有較大提高。關(guān)鍵詞:文本分類;特征提取;微博;情感分析;依存關(guān)系IAbstractAbstractWiththerapiddeve

7、lopmentofInternet,onlineforumsandmicroblogprovidepeoplewithabroaderinformationexchangeplatform.Mostoftheinformationisreviewsofonlinecommodity,filmortelevisionworks,publicfigures,andhotevents,whichcontainhugecommercialvaluesandsocialvalues.Toanalyzethisinformationhasagre

8、atpracticalsignificance.Sentimentanalysisoropinionminingreferstotheapplicationofnaturallanguageprocessing,comp

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。