基于情緒特征的中文微博用戶性別識(shí)別

基于情緒特征的中文微博用戶性別識(shí)別

ID:35065020

大?。?.89 MB

頁數(shù):70頁

時(shí)間:2019-03-17

基于情緒特征的中文微博用戶性別識(shí)別_第1頁
基于情緒特征的中文微博用戶性別識(shí)別_第2頁
基于情緒特征的中文微博用戶性別識(shí)別_第3頁
基于情緒特征的中文微博用戶性別識(shí)別_第4頁
基于情緒特征的中文微博用戶性別識(shí)別_第5頁
資源描述:

《基于情緒特征的中文微博用戶性別識(shí)別》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、中圖分類號(hào):TP391論文編號(hào):102871616-S041學(xué)科分類號(hào):081200碩士學(xué)位論文基于情緒特征的中文微博用戶性別識(shí)別研究生姓名劉寶芹學(xué)科、專業(yè)計(jì)算機(jī)科學(xué)與技術(shù)研究方向自然語言處理指導(dǎo)教師牛耘副教授南京航空航天大學(xué)研究生院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院二О一六年一月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofComputerScienceandTechnologyEmotion-basedFeaturesinGenderRe

2、cognitionofChineseMicro-blogAThesisinComputerScienceandTechnologybyLiuBaoqinAdvisedbyAssociateProf.NiuYunSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringJanuary,2016承諾書本人聲明所呈交的碩士學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他

3、人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得南京航空航天大學(xué)或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。本人授權(quán)南京航空航天大學(xué)可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本承諾書)作者簽名:日期:南京航空航天大學(xué)碩士學(xué)位論文摘要隨著社交媒體的迅猛發(fā)展,微博成為備受用戶青睞的網(wǎng)絡(luò)交流平臺(tái),微博用戶性別識(shí)別逐漸成為學(xué)術(shù)界研究的熱點(diǎn)。心理學(xué)和語言學(xué)領(lǐng)域的大量研究表明男性和女性在情緒表達(dá)上存在差異。然而,目前利用兩性情緒差異幫助識(shí)別微博用戶

4、性別的研究較少。本文以中文微博文本為研究對(duì)象,從情緒的角度出發(fā),分析微博文本中兩性表達(dá)情緒的差異,并以兩性情緒差異為特征,對(duì)中文微博用戶的性別進(jìn)行識(shí)別。首先,本文對(duì)中文微博情緒識(shí)別進(jìn)行了研究,主要包括兩個(gè)方面。一方面,對(duì)大量中文微博中表情符號(hào)的使用特點(diǎn)、分布情況和情緒表達(dá)特點(diǎn)進(jìn)行了統(tǒng)計(jì)分析;根據(jù)統(tǒng)計(jì)數(shù)據(jù)為表情符號(hào)構(gòu)建情緒向量,并利用其識(shí)別微博情緒。在兩個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文建立的表情符情緒向量,有效地提高了微博情緒識(shí)別的精度。另一方面,提出了多層次中文微博情緒識(shí)別方法。本文將Ekman六類情緒按照情感極性及情緒間的

5、相互關(guān)系組織成三層樹狀結(jié)構(gòu),在此基礎(chǔ)上提出了一種多層次微博情緒識(shí)別方法。實(shí)驗(yàn)結(jié)果表明,該方法降低了各情緒類微博數(shù)量分布不平衡對(duì)分類結(jié)果造成的影響,提高了微博情緒識(shí)別的精度。其次,本文從兩性表達(dá)情緒的差異出發(fā),提出了一種基于情緒特征的中文微博用戶性別識(shí)別方法。本文考慮的情緒特征包括Ekman情緒特征、情緒詞特征和與情緒相關(guān)的語言風(fēng)格特征。實(shí)驗(yàn)結(jié)果表明,本文提取的情緒特征提高了用戶性別識(shí)別的精度。最后,本文基于微博文本中詞匯的性別傾向性,對(duì)如何構(gòu)建性別傾向性詞典進(jìn)行了探索。首先提取性別傾向性候選詞。然后根據(jù)候選詞在男性和女性微

6、博中使用頻率的差異,提取性別傾向性詞,加入性別傾向性詞典。若一個(gè)候選詞在男性用戶中的使用頻率高于女性用戶,則將該候選詞作為男性傾向性詞。否則,將其作為女性傾向性詞。最后使用構(gòu)建的性別傾向性詞典,對(duì)微博用戶的性別進(jìn)行識(shí)別。關(guān)鍵詞:表情符號(hào),層次型分類方法,微博情緒識(shí)別,性別識(shí)別,情緒特征,性別傾向性詞典i基于情緒特征的中文微博用戶性別識(shí)別ABSTRACTWiththevigorousdevelopmentofsocialmedia,micro-blogisbecomingahotnetworkcommunicationpla

7、tformformoreandmoreusers.Genderrecognitionofmicro-blogusershasbecomeahotresearchtopic.Alotofeffortshadbeenmadeongenderemotionaldifferencesinthefieldofpsychologyandlinguistics.Nonetheless,researchongenderrecognitionofChinesemicro-blogusersusinggenderemotionaldiffer

8、encesisstillnew.ThispapertookChinesemicro-blogsastheresearchobject,analyzingthedifferencesofmalesandfemalesintheperspectiveofemotion.Basedonthedifferenc

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。