資源描述:
《中文評論文本情感的分析研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、摘要隨著Internet的日益普及和廣泛應(yīng)用,越來越多的網(wǎng)民開始在Internet上發(fā)表自己的觀點,意見和評論。網(wǎng)絡(luò)上的這些評論文本包含了大眾群體對熱點事件的態(tài)度,或者消費者對所購買的商品或者服務(wù)的情感態(tài)度等。這些信息對國家政府,商業(yè)組織以及個體消費者都有重要的價值。然而,網(wǎng)絡(luò)上的數(shù)據(jù)規(guī)模極其龐大;并且其中很多的語句都是雜亂無章、語言不規(guī)范、無結(jié)構(gòu)化的等。如何在海量的評價文本中分析出情感信息成為研究熱點之一。評價搭配的抽取和傾向性分析是文本情感分析研究的重要基礎(chǔ)任務(wù)。在線商品評論是指消費者在網(wǎng)絡(luò)上用文字的形式表達(dá)對自己購買的商品或服務(wù)的體驗和觀點。這些信息對于商家和消費
2、者都具有重要的商業(yè)價值,然而網(wǎng)上的很多的評價語句是散亂且海量的,用人工的方法進(jìn)行情感分析幾乎是不可能的,本文以在線評價語句為研究對象,對其使用自然語言處理技術(shù)進(jìn)行情感分析,進(jìn)而獲得評價搭配和評價對象的傾向性。本文的主要研究內(nèi)容和創(chuàng)新點如下:(1)針對評價搭配的抽取問題,本文提出了一種改進(jìn)的基于核心句的評價搭配抽取方法。目前常用的評價搭配的抽取方法主要有兩類:一類是基于語言特征利用機(jī)器學(xué)習(xí)模型的方法抽取評價搭配;另一類是使用基于規(guī)則或模板的方法識別評價搭配。上述兩類方法中,句法分析都在評價搭配識別方面起著重要的作用,然而由于中文評價語句的不規(guī)范性,會導(dǎo)致句法分析結(jié)果不準(zhǔn)確
3、,最終影響評價搭配的抽取效果。針對這個問題,本文用提取評價語句核心句的方法有效的提高了中文評價語句的規(guī)范性,提高了句法分析的準(zhǔn)確率。同時在處理復(fù)雜的語句時,本文著重分析了評價對象之間以及評價詞之間的并列關(guān)系,提高了評價搭配抽取的召回率。實驗結(jié)果表明,本文提出的方法取得了不錯的抽取效果,驗證了本文提出的方法是有效的,具有較好的應(yīng)用價值。(2)針對評價對象的傾向性分析的問題,本文采用基于情感詞語義加權(quán)的方法進(jìn)行傾向性分析。評價對象的傾向性分析屬于屬性級傾向性分析,基本上都以詞典為基礎(chǔ),在傾向性分析中,尤其是網(wǎng)絡(luò)評價語句中會經(jīng)常出現(xiàn)網(wǎng)絡(luò)詞匯,然而由于使用詞典很難識別網(wǎng)絡(luò)詞匯。
4、針對這個問題,本文使用了常用情感詞中文評論文本情感分析研究置換網(wǎng)絡(luò)詞匯的方法有效的解決了網(wǎng)絡(luò)詞匯難以識別的問題。另外,針對中文評價文本中經(jīng)常出現(xiàn)的包含隱含的評價信息的語句的問題,本文制定了潛在評價信-‘息抽取規(guī)則,該方法有效的解決了評價語句中潛在評價信息難以識別的問題。實驗結(jié)果顯示本文提出的方法在覆蓋率和準(zhǔn)確率上都有所提升,驗證了本文提出方法的有效性。關(guān)镅!詞:評價搭配抽取,核心句,依存分析,傾向性分析,語義加權(quán)AbstractWiththegrowingpopularityandwideapplicationofInternet,moreandmorepeoplebe
5、gantoexpresstheirviews,opinionsandcommentsontheInternet.Thetextcontainsthepublicattitudestowardshotissuesandconsumerevaluationofgoodsorserviceswhichtheypurchasedin.Thisinformationhasanimportantvalueforgovernments,businessorganizationsandindividualconsumers.However,thelargescaleinformatio
6、nonInteract,whicharescattered,non-standardandunstructured.Tothisproblem,sentimentanalysisemerged,extractionofevaluationcollocationandsentimentorientationanalysisareimportantbasictasksintheareaoftextsentimentanalysis.Onlineproductreviewsbyarethatconsumerstoexpresstheirviewstothesegoodsors
7、erviceswhichtheypurchasedontheInternetbytheexperienceandperspectiveintheformoftext.Theinformationhasimportantvalueforbusinessesandconsumers.However,becauseevaluationstatementontheInternetiSscatteredandmassive,textsentimentanalysisbyartificialmeansisimpossible.Thispapercon