基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究

基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究

ID:31359846

大?。?12.00 KB

頁數(shù):8頁

時間:2019-01-09

基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究_第1頁
基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究_第2頁
基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究_第3頁
基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究_第4頁
基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究_第5頁
資源描述:

《基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、基于多種情感特征的網(wǎng)絡(luò)文本傾向性判別方法研究  摘要:網(wǎng)絡(luò)文本的情感傾向性分析對于電子商務(wù)、網(wǎng)絡(luò)信息安全、網(wǎng)絡(luò)輿情等方面具有非常重要的意義。本文在對文本傾向性分析的常用方法作了分析和研究的基礎(chǔ)上,提出了一種綜合情感詞語、否定詞、程度副詞、關(guān)聯(lián)詞和詞句類型等多種特征計算詞句的極性值,進而判別文本情感傾向性的方法。實驗結(jié)果表明,與ku提出的算法相比,該方法更能有效地判定文本情感傾向性?! £P(guān)鍵詞:情感詞典;情感特征;網(wǎng)絡(luò)文本;文本傾向性;傾向性分析  中圖分類號:TP391文獻標(biāo)識碼:A文章編號:1009-3044

2、(2015)22-0018-04  Abstract:Theanalysisofthesentimentorientationofthenetworktextisveryimportantfortheelectroniccommerce,thenetworkinformationsecurity,thenetworkpublicopinionandsoon.Inthispaper,thegeneralmethodoftextorientationanalysisisstudied.Weproposeanewme

3、thodtocalculatethepolarityvalueofthewordsandtojudgethesentimentorientationoftext,whichcomprehensivesavarietyofcharacteristics,suchastheemotionalwords,negativewords,adverbsofdegree,relatedwords,andsoon.Theexperimentalresultsshowthattheproposedmethodismoreeffe

4、ctivethantheKualgorithmforjudgingsentiment8orientation.  Keywords:sentimentlexicon;sentimentfeature;networktext;textorientation;orientationanalysis  隨著互聯(lián)網(wǎng)的飛速發(fā)展以及網(wǎng)絡(luò)信息交流的便捷性和信息傳播的迅速性,使得越來越多的人使用網(wǎng)絡(luò)作為信息交流的平臺,發(fā)表自己的意見和觀點。由此產(chǎn)生了大量帶有個人主觀情感色彩的在線文本,如個人博客、產(chǎn)品評論、新聞評論等。在這些浩

5、如煙海的大量文本中,大多數(shù)都帶有作者對人、事、物的觀點和態(tài)度。提取這些反映著網(wǎng)民真實觀點和態(tài)度的情感信息,對于電子商務(wù)、網(wǎng)絡(luò)信息安全、網(wǎng)絡(luò)輿情等方面具有非常重要的意義?! 【W(wǎng)絡(luò)文本傾向性分析是指通過采集、組織和分析這些網(wǎng)絡(luò)文本中的立場、觀點、看法、態(tài)度、情緒等主觀信息,從而對文本的情感傾向性做出正負褒貶的判斷。目前,這一技術(shù)已成為信息處理領(lǐng)域的一個研究熱點,已被廣泛應(yīng)用在信息檢索、信息過濾、信息安全、自動文摘等多個方面。  1相關(guān)研究  文本情感分析可以分為基于機器學(xué)習(xí)的情感分類方法和基于語義理解的情感分析方法

6、兩大類?! 』跈C器學(xué)習(xí)的情感分類方法利用訓(xùn)練語料對分類器進行訓(xùn)練,然后將測試語料用已訓(xùn)練好的分類器進行分類測試,得到文本的情感傾向性。例如,Pang等[1]運用樸素貝葉斯網(wǎng)絡(luò)、最大熵模型和支持向量機三種分類器對于影評進行了分類研究;李素科等[2]針對監(jiān)督學(xué)習(xí)分類的不足之處,對情感特征進行聚類,并提出了一種半監(jiān)督式的情感分析算法。8  基于語義理解的情感分析又可以分為兩類:基于情感詞的傾向性分析方法和基于語義規(guī)則的傾向性分析方法?;谇楦性~的傾向性分析首先抽取出文本中的情感詞,然后對情感詞逐一進行情感傾向判斷,

7、得到各自的情感傾向值,最后通過累加這些傾向值獲得文本最終的情感傾向和強度。例如,徐琳宏等[3]采用HowNet作為基準(zhǔn)詞,并在實驗中考慮否定詞和程度副詞的影響,計算待測詞與關(guān)聯(lián)度確定語義傾向,對電影評論進行了傾向性識別研究。基于語義規(guī)則的傾向性分析首先建立一個情感傾向語義模式庫,然后將文本按照這個語義模式庫進行模式匹配,計算得到一系列情感傾向值,最后將這些傾向值進行累加,得到整個文本的情感傾向和強度。例如,Ku等[4]對新聞和博客文本從詞級、句子級和文檔級進行了意見抽取,得出觀點摘要,進而對文本進行情感傾向和強

8、度分析。  對上述幾種文本傾向性分析的常用方法進行深入的分析和研究后發(fā)現(xiàn),許多方法只是片面地進行文本傾向性的判定,其準(zhǔn)確性和有效性得不到保證。本文在精心構(gòu)建基礎(chǔ)情感詞典和網(wǎng)絡(luò)情感詞典的基礎(chǔ)上,根據(jù)網(wǎng)絡(luò)文本的組成特點,綜合利用情感詞語、否定詞、程度副詞、關(guān)聯(lián)詞和詞句類型等多種特征計算詞句的情感極性值,據(jù)此判別文本情感傾向性。實驗結(jié)果表明,該方法提高了網(wǎng)絡(luò)文本傾向性判別的準(zhǔn)確性?! ?情感

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。