基于條件隨機(jī)場的中文微博情感分析研究

基于條件隨機(jī)場的中文微博情感分析研究

ID:35066565

大?。?.81 MB

頁數(shù):59頁

時間:2019-03-17

基于條件隨機(jī)場的中文微博情感分析研究_第1頁
基于條件隨機(jī)場的中文微博情感分析研究_第2頁
基于條件隨機(jī)場的中文微博情感分析研究_第3頁
基于條件隨機(jī)場的中文微博情感分析研究_第4頁
基于條件隨機(jī)場的中文微博情感分析研究_第5頁
資源描述:

《基于條件隨機(jī)場的中文微博情感分析研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、廣東工業(yè)大學(xué)碩±學(xué)位論文(工學(xué)碩±)基于條件隨機(jī)場的中文微博情感分析研究梁禮欣?二〇—六年五月分類號:11845;學(xué)校代號UDC:密級:學(xué)號;2111305035廣東工業(yè)大學(xué)碩主學(xué)位論文(工學(xué)碩±)基于條件隨機(jī)場的中文微博情感分析研究梁禮欣指導(dǎo)教師姓名、職稱;郝志峰教授專業(yè)或領(lǐng)域名稱;軟件工程學(xué)生所屬學(xué)院:計覚機(jī)學(xué)院論文答辯日期:2016年5月25日ADissertationSubmitedtoGuando

2、nUniversitofggyTechnolofor化eDereeofMast;ergygResearchofSentimentAnalsisforChineseyMicroBlog目asedonConditionalRandomFieldCandidate:LianLngixiSuervisor.p;ProfHaoZhifengMa2016ySchoolofcomputersGuangdongUniversit

3、yofTechnologyGuanzhouGuandonP.R.China510006g,gg,,^摘要近年來,越來越多用戶喜歡在微博上發(fā)表自己對某個熱點事件或商品的態(tài)度和觀點,對。由于這些觀點信息往往帶有很強(qiáng)的情感傾向其進(jìn)行情感信息的挖掘是對商家和政府都具有重大意義的。然而,由于微博句子存在表達(dá)不規(guī)范性和簡短性,而且當(dāng)前的基礎(chǔ)中文文本處理工具并不能很好的適用于微博文本,使得從其中準(zhǔn)確地提取情感信息變得十分困難,已。其次有的情感分析方法都忽略了

4、觀點句識別和情感傾向分析這兩個任務(wù)之間的聯(lián)系,最終導(dǎo)致情感分析的效果普遍不理想,。為此本文主要針對中文微博的特點和影響情感分析效果的關(guān)鍵因素進(jìn)行深入研究,提出了針對中文微博情感分析的改進(jìn)算法WDC民巧Word2vecDCRF。具體工作如下:)(1)利用Word2vec擴(kuò)展微博句子,即利用Word2vec來求句子中每個詞的一,,從而得到該句子的詞序列前k個相似詞。首先對條微博句子進(jìn)行分詞。然后對句子中的每個詞利用Word2vec來求它的前k個相似詞。最后,將每個詞的前

5、k個相似詞都加在原句子的詞序列后面,從而達(dá)到擴(kuò)展微博的目的。實驗證明,擴(kuò)展后的微博句子會比原微博句子含有更豐富的情感信息,最終使得算法性能提升。(2)建立觀點句識別和情感傾向分析這兩個任務(wù)之間的聯(lián)系。適過利用Two-Level結(jié)構(gòu)的動態(tài)條件隨機(jī)場(DC民F)模型來建立起觀點句識別和情感傾,,向分析這兩個任務(wù)之間的聯(lián)系信息使得這兩個任務(wù)可W同時進(jìn)行。同時Two-Level結(jié)構(gòu)的動態(tài)條件隨機(jī)場(DC民F)模型還能引入句子間的上下文信息。結(jié)合上面兩個策略,本文提^WDCRF

6、方法,該方法是將能夠融合兩個任務(wù)間聯(lián)系信息和句子間上下文聯(lián)系信息的DCRF模型應(yīng)用在(1)中利用Word2vec擴(kuò)展后的微博句子上。最終實驗結(jié)果證明,本文提出的情感分析方法WDCRF的平均性能高于目前主流的方法,而且能更好地識別中文微博的情感傾向。關(guān)鍵詞:情感分析:微博;條件隨機(jī)場:Word2vecIABSTRACTABSTRACTInrece打tears,morea打dmoreeoleliketoreferthemicrobloexress

7、theirypppgpattitudesa打dopi打io打sforahotcommodityoreve打t.Becausethesemessagesoftenhaveastronemotionaltendenciesitisversinificantforovernmentandg,yggbusiness.However,microblogsen1:enceisofte打shortandexpressionis

8、打otsta打dardized,a打dthecurrentGhinesetextprocessi打gtoolsare打otwellsuitedformicroblog,whichleadsusdifficulttoextractemotionalinformation打omthem.MoreovertheexistinworksinoretheinformationbetweenSubective,ggjcl

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。