資源描述:
《中文微博情感分類的研究與應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、中文圖書分類號(hào):TP311密級(jí):公開UDC:004學(xué)校代碼:10005工程碩士學(xué)位論文M.E.DISSERTATION論文題目:中文微博情感分類的研究與應(yīng)用論文作者:曹可領(lǐng)域:軟件工程指導(dǎo)教師:沈琦副教授論文提交日期:2016年5月UDC:004學(xué)校代碼:10005中文圖書分類號(hào):TP311學(xué)號(hào):S201325040密級(jí):公開北京工業(yè)大學(xué)碩士專業(yè)學(xué)位論文(全日制)題目:中文微博情感分類的研究與應(yīng)用英文題目:RESEARCHANDAPPLICATIONONCHINESEMICRO-BLOGSENTIMENTCLASSIFICATION論文作者:曹
2、可領(lǐng)域:軟件工程研究方向:軟件工程技術(shù)與應(yīng)用申請(qǐng)學(xué)位:工程碩士專業(yè)學(xué)位指導(dǎo)教師:沈琦副教授所在單位:軟件學(xué)院答辯日期:2016年6月1日授予學(xué)位單位:北京工業(yè)大學(xué)獨(dú)創(chuàng)性聲明本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得北京工業(yè)大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說(shuō)明并表示了謝意。簽名:曹可日期:2016年6月8日關(guān)于論文使用授權(quán)的說(shuō)明本人完全了
3、解北京工業(yè)大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留送交論文的復(fù)印件,允許論文被查閱和借閱;學(xué)校可以公布論文的全部或部分內(nèi)容,可以采用影印、縮印或其他復(fù)制手段保存論文。(保密的論文在解密后應(yīng)遵守此規(guī)定)簽名:曹可日期:2016年6月8日導(dǎo)師簽名:沈琦日期:2016年6月8日摘要摘要Web2.0時(shí)代以來(lái),隨著互聯(lián)網(wǎng)社交媒體的迅猛發(fā)展,微博已逐漸成為了時(shí)下最為主流的信息發(fā)布與信息共享平臺(tái)。大量微博用戶通過此平臺(tái)來(lái)表達(dá)自己的看法、情緒和觀點(diǎn)。對(duì)微博情感分類的深入研究可以快速捕捉微博用戶的情感訴求,進(jìn)行輿情管控、挖掘市場(chǎng)需求等。目前對(duì)于英文微博
4、文本的情感分類相關(guān)研究已較為成熟,而面向中文微博情感分類的研究工作由于起步較晚,且受中文語(yǔ)法復(fù)雜性等因素的影響,因此尚處于探索階段,并且相關(guān)研究中鮮有將微博情感分類技術(shù)運(yùn)用于微博中某一特定話題領(lǐng)域的應(yīng)用研究。針對(duì)上述問題,本文以中文微博情感分類研究為主線,在結(jié)合現(xiàn)有文本分類技術(shù)的基礎(chǔ)上,進(jìn)行了以下研究工作。首先,對(duì)新浪微博數(shù)據(jù)獲取的方法進(jìn)行研究,分析了微博開放平臺(tái)API數(shù)據(jù)獲取機(jī)制及其在獲取微博話題數(shù)據(jù)時(shí)的局限性。在此基礎(chǔ)上,提出了基于模擬登錄與頁(yè)面解析技術(shù)的微博話題數(shù)據(jù)獲取方法,為實(shí)現(xiàn)更好的分類效果奠定了數(shù)據(jù)基礎(chǔ)。其次,對(duì)傳統(tǒng)情感詞典在微博領(lǐng)
5、域情感分類的適用性進(jìn)行研究,將兩種基礎(chǔ)情感詞典資源進(jìn)行了整合,并針對(duì)微博特點(diǎn)構(gòu)建了微博表情符號(hào)詞典以及微博網(wǎng)絡(luò)用語(yǔ)詞典。再次,對(duì)微博情感分類特征選取一般方法進(jìn)行研究,總結(jié)歸納了中文微博基礎(chǔ)特征集合,并加入了一元表情符號(hào)特征與一元情感詞特征對(duì)基礎(chǔ)特征集合進(jìn)行了擴(kuò)充,構(gòu)建了多分類的SVM微博情感分類模型將微博情感劃分為正面、負(fù)面以及中性。通過實(shí)驗(yàn)驗(yàn)證了本文提出的特征選取方法以及分類模型的有效性。最后,基于對(duì)中文微博情感分類的研究,設(shè)計(jì)并實(shí)現(xiàn)了酒店微博情感分類系統(tǒng)。系統(tǒng)的目標(biāo)在于對(duì)微博中不同酒店話題下用戶評(píng)論的語(yǔ)料進(jìn)行情感傾向性分類,了解用戶對(duì)不同酒
6、店品牌的認(rèn)可度,以及對(duì)酒店品牌的品牌效應(yīng)進(jìn)行評(píng)估。通過系統(tǒng)的實(shí)例驗(yàn)證,證實(shí)了本文提出的模型與方法對(duì)微博情感分類的適用性。本文的成果有利于酒店行業(yè)及消費(fèi)者了解酒店真實(shí)的服務(wù)水平,便于酒店方對(duì)服務(wù)進(jìn)一步改善以及消費(fèi)者合理的做出選擇。關(guān)鍵詞:微博情感分類;數(shù)據(jù)獲?。磺楦性~典;特征選擇;酒店微博情感分類系統(tǒng)-I-AbstractAbstractWiththerapiddevelopmentofInternet,Micro-blogasthenewinformationpublishingandsharingplatformattractedalarge
7、numberofuserstoexpresstheiropinions,emotionsandideassincetheWeb2.0era.Theresearchesaboutmicro-blogsentimentclassificationcontributetograsptheviewsandattitudesofusers,controlthepublicopinion,explorethemarketdemand,etc.Atpresent,comparedwithChinesemicroblog,theresearchesonsent
8、imentclassificationofEnglishmicrobloghavebeenmature.However,duetoalatestart