中文評論文本情感的分析研究

中文評論文本情感的分析研究

ID:32258779

大小:2.61 MB

頁數(shù):54頁

時間:2019-02-02

中文評論文本情感的分析研究_第1頁
中文評論文本情感的分析研究_第2頁
中文評論文本情感的分析研究_第3頁
中文評論文本情感的分析研究_第4頁
中文評論文本情感的分析研究_第5頁
資源描述:

《中文評論文本情感的分析研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、摘要隨著Internet的日益普及和廣泛應(yīng)用,越來越多的網(wǎng)民開始在Internet上發(fā)表自己的觀點,意見和評論。網(wǎng)絡(luò)上的這些評論文本包含了大眾群體對熱點事件的態(tài)度,或者消費者對所購買的商品或者服務(wù)的情感態(tài)度等。這些信息對國家政府,商業(yè)組織以及個體消費者都有重要的價值。然而,網(wǎng)絡(luò)上的數(shù)據(jù)規(guī)模極其龐大;并且其中很多的語句都是雜亂無章、語言不規(guī)范、無結(jié)構(gòu)化的等。如何在海量的評價文本中分析出情感信息成為研究熱點之一。評價搭配的抽取和傾向性分析是文本情感分析研究的重要基礎(chǔ)任務(wù)。在線商品評論是指消費者在網(wǎng)絡(luò)上用文字的形式表達(dá)對自己購買的商品或服務(wù)的體驗和觀點。這些信息對于商家和消費

2、者都具有重要的商業(yè)價值,然而網(wǎng)上的很多的評價語句是散亂且海量的,用人工的方法進(jìn)行情感分析幾乎是不可能的,本文以在線評價語句為研究對象,對其使用自然語言處理技術(shù)進(jìn)行情感分析,進(jìn)而獲得評價搭配和評價對象的傾向性。本文的主要研究內(nèi)容和創(chuàng)新點如下:(1)針對評價搭配的抽取問題,本文提出了一種改進(jìn)的基于核心句的評價搭配抽取方法。目前常用的評價搭配的抽取方法主要有兩類:一類是基于語言特征利用機(jī)器學(xué)習(xí)模型的方法抽取評價搭配;另一類是使用基于規(guī)則或模板的方法識別評價搭配。上述兩類方法中,句法分析都在評價搭配識別方面起著重要的作用,然而由于中文評價語句的不規(guī)范性,會導(dǎo)致句法分析結(jié)果不準(zhǔn)確

3、,最終影響評價搭配的抽取效果。針對這個問題,本文用提取評價語句核心句的方法有效的提高了中文評價語句的規(guī)范性,提高了句法分析的準(zhǔn)確率。同時在處理復(fù)雜的語句時,本文著重分析了評價對象之間以及評價詞之間的并列關(guān)系,提高了評價搭配抽取的召回率。實驗結(jié)果表明,本文提出的方法取得了不錯的抽取效果,驗證了本文提出的方法是有效的,具有較好的應(yīng)用價值。(2)針對評價對象的傾向性分析的問題,本文采用基于情感詞語義加權(quán)的方法進(jìn)行傾向性分析。評價對象的傾向性分析屬于屬性級傾向性分析,基本上都以詞典為基礎(chǔ),在傾向性分析中,尤其是網(wǎng)絡(luò)評價語句中會經(jīng)常出現(xiàn)網(wǎng)絡(luò)詞匯,然而由于使用詞典很難識別網(wǎng)絡(luò)詞匯。

4、針對這個問題,本文使用了常用情感詞中文評論文本情感分析研究置換網(wǎng)絡(luò)詞匯的方法有效的解決了網(wǎng)絡(luò)詞匯難以識別的問題。另外,針對中文評價文本中經(jīng)常出現(xiàn)的包含隱含的評價信息的語句的問題,本文制定了潛在評價信-‘息抽取規(guī)則,該方法有效的解決了評價語句中潛在評價信息難以識別的問題。實驗結(jié)果顯示本文提出的方法在覆蓋率和準(zhǔn)確率上都有所提升,驗證了本文提出方法的有效性。關(guān)镅!詞:評價搭配抽取,核心句,依存分析,傾向性分析,語義加權(quán)AbstractWiththegrowingpopularityandwideapplicationofInternet,moreandmorepeoplebe

5、gantoexpresstheirviews,opinionsandcommentsontheInternet.Thetextcontainsthepublicattitudestowardshotissuesandconsumerevaluationofgoodsorserviceswhichtheypurchasedin.Thisinformationhasanimportantvalueforgovernments,businessorganizationsandindividualconsumers.However,thelargescaleinformatio

6、nonInteract,whicharescattered,non-standardandunstructured.Tothisproblem,sentimentanalysisemerged,extractionofevaluationcollocationandsentimentorientationanalysisareimportantbasictasksintheareaoftextsentimentanalysis.Onlineproductreviewsbyarethatconsumerstoexpresstheirviewstothesegoodsors

7、erviceswhichtheypurchasedontheInternetbytheexperienceandperspectiveintheformoftext.Theinformationhasimportantvalueforbusinessesandconsumers.However,becauseevaluationstatementontheInternetiSscatteredandmassive,textsentimentanalysisbyartificialmeansisimpossible.Thispapercon

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。