資源描述:
《基于pad模型中文微博情感的分析研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、大連理工大學學位論文獨創(chuàng)性聲明作者鄭重聲明:所呈交的學位論文,是本人在導師的指導下進行研究工作所取得的成果。盡我所知,除文中已經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個人或集體已經(jīng)發(fā)表的研究成果,也不包含其他已申請學位或其他用途使用過的成果。與我一同工作的同志對本研究所做的貢獻均已在論文中做了明確的說明并表示了謝意。若有不實之處,本人愿意承擔相關法律責任。學位論文題目:應亟陛絲型險靼盜嗵疊蹩瞄酶豇—一作者簽名:嗑姿盛昌期:之!蘭年上月么生日大連理工大學碩士學位論文摘要近年來,微博已經(jīng)成為全
2、球最受歡迎的網(wǎng)絡應用之一,微博的快速發(fā)展使其顯示出了巨大的社會價值和商業(yè)價值,人們逐漸習慣在以微博為代表的社交網(wǎng)絡上獲取、交流信息與表達情感。文本情感傾向性分析主要關注以文本方式存在的信息中的情感傾向,當龐大的數(shù)據(jù)量使得它無法手動對它們進行分析時,情感分析就開始發(fā)揮作用了。情感分析在英文世界一直是一個被廣泛研究的領域,而中文情感分析的研究仍處于起步階段,大部分工作己通過嘗試被證明是適用于英文的。首先,本文總結(jié)分析了文本傾向性分析的基本概念與算法模型,在此基礎上,將心理學中的PAD情感模型引入,結(jié)
3、合知網(wǎng)提供的語義相似度計算方法,提出了一種使用給定基礎情感詞匯與其對應PAD值計算詞匯的PAD值的方法,并以此構(gòu)建了一個基于PAD情感模型的情感詞典。其次,本文將問題擴展到中文的文本傾向性分析研究中,提出了一種結(jié)合統(tǒng)計信息與語義信息的權重計算方法,通過該方法,在一定程度上消除特征歧義對于分類器的影響,使得特征的權重更貼合文本的語義,分類的效果更好。最后,本文綜合中文微博文本分析研究現(xiàn)狀,分析了現(xiàn)有的文本表示模型,結(jié)合機器學習中的支持向量機算法,提出了基于PAD情感語義特征的支持向量機分類方法。實
4、驗結(jié)果表明,基于支持向量機的分類算法的效果好于k最近鄰節(jié)點算法的效果。同時,本文提出的基于PAD情感語義特征的支持向量機分類方法都能夠取得比較實用的效果,并對普通的支持向量機方法效果有著顯著的改進。關鍵詞:中文信息處理;微博;情感分析;PAD情感模型基于PAD模型的中文微博隋感分析研究ChineseMicroblogSentimentAnalysisBasedonthePADModelAbstractInrecentyears,microbloghasbecomeoneoftheworld’Sm
5、ostpopularnetworkapplications,therapiddevelopmentofmicrobloghasshownsignificantsocialvalueandcommercialvalue,peoplegraduallyaccustomedtoobtaininformationinSNSsuchasmicroblog,alsoknownasweibo.Thetextsentimentanalysisfocusesontheemotionaltendenciesofth
6、etextinformationandbegintoplayarolewhenahugeamountofdatamakesitimpossibletoanalyzethemmanually.SentimentanalysisintheEnglish—speakingworldhasbeenawiderangeofresearchareaswhiletheChinesesentimentanalysisresearchiSstillinitsinfancy.Mostoftheworkbytheat
7、tempthasbeenprovedtobesuitableforEnglish.First,thispapersummarizesandanalyzesthebasicconceptsandalgorithmsmodeloftextsentimentanalysis.Onthebasis,thispaperintroducesthepsychologyofthePADemotionmodel,combinedwiththesemanticsimilaritycalculationmethodp
8、rovidedbyHowNet,proposedamethodofusingagivenbasicemotionalvocabularywordsandtheircorrespondingPADvalues,andbuildadictionarybasedonit.Secondly,thispaperextendtheproblemtothefieldofChinesetextsentimentanalysis,proposesacombinationofstatisticalinformati