面向評(píng)論的跨領(lǐng)域情感分類研究

面向評(píng)論的跨領(lǐng)域情感分類研究

ID:34589222

大小:6.31 MB

頁(yè)數(shù):56頁(yè)

時(shí)間:2019-03-08

面向評(píng)論的跨領(lǐng)域情感分類研究_第1頁(yè)
面向評(píng)論的跨領(lǐng)域情感分類研究_第2頁(yè)
面向評(píng)論的跨領(lǐng)域情感分類研究_第3頁(yè)
面向評(píng)論的跨領(lǐng)域情感分類研究_第4頁(yè)
面向評(píng)論的跨領(lǐng)域情感分類研究_第5頁(yè)
資源描述:

《面向評(píng)論的跨領(lǐng)域情感分類研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)

1、碩士學(xué)位論文面向評(píng)論的跨領(lǐng)域情感分類研究ResearchonCross.domainSentimentClaSSincationofReviews學(xué)號(hào):量!!Q壁壘!璺完成日期:2Q!壘二Q壘二星Q大連理工大學(xué)DalianUniversit),ofTechnology洲IIIIIIIIUI—Y2590474大連理工大學(xué)學(xué)位論文獨(dú)創(chuàng)性聲明作者鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下進(jìn)行研究工作所取得的成果。盡我所知,除文中已經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個(gè)人或集體已經(jīng)發(fā)表的研究成果,也不包含其他已申請(qǐng)學(xué)位或其他用途使用過(guò)的成果。與我一同工作的同志對(duì)本研究所做的貢獻(xiàn)均

2、已在論文中做了明確的說(shuō)明并表示了謝意。學(xué)位論文題目:盔函聾囪疊逢魚趣:睦叢堡蚴作者簽名:建漁占焦鰱日期:挫J年—£與jL日大連理工大學(xué)碩士學(xué)位論文摘要隨著網(wǎng)絡(luò)社交平臺(tái)的崛起,海量主觀性信息迅速涌現(xiàn)。鑒于這些主觀數(shù)據(jù)往往具有巨大的潛在價(jià)值,情感分類、觀點(diǎn)挖掘等領(lǐng)域逐漸引起了廣泛的關(guān)注。然而傳統(tǒng)的情感分類具有領(lǐng)域特定性(dormin-specific),即當(dāng)訓(xùn)練集和測(cè)試集數(shù)據(jù)分布不同時(shí),分類效果往往欠佳。隨著信息的迅猛發(fā)展,新的領(lǐng)域不斷涌現(xiàn),而人工標(biāo)注數(shù)據(jù)既耗時(shí)又費(fèi)力,因此跨領(lǐng)域情感分類具有極其重要的意義。它旨在通過(guò)一個(gè)領(lǐng)域的數(shù)據(jù)訓(xùn)練模型,來(lái)預(yù)測(cè)另一個(gè)領(lǐng)域文本的情感傾向性。本文旨在解決跨領(lǐng)域

3、文本情感分類問(wèn)題,主要工作包括以下三個(gè)方面:首先,本文提出了一種基于加權(quán)SimRank算法的跨領(lǐng)域情感分類模型。該模型先通過(guò)ADMI(AbsoluteDifferemeofMutualInformation)算法挑選出頻繁出現(xiàn)在兩個(gè)領(lǐng)域中且?guī)в邢嗤楦袃A向性的樞紐特征作為橋梁,然后將樞紐特征與非樞紐特征的關(guān)系映射為二部圖,在加權(quán)SimRank算法的基礎(chǔ)下構(gòu)建潛在特征空問(wèn)LFS(LatentFeatureSpace)。最后,利用LFS對(duì)樣本進(jìn)行重映射,從而減小了不同領(lǐng)域之間的數(shù)據(jù)分布差異,較好的實(shí)現(xiàn)了領(lǐng)域遷移。實(shí)驗(yàn)結(jié)果表明了該模型在跨領(lǐng)域文本情感分類中的有效性。其次,受評(píng)論中旬子主語(yǔ)與領(lǐng)域

4、獨(dú)立性(dormin-independent)/特定性(donmin-specific)情感詞分布關(guān)系的啟發(fā),本文提出一種主語(yǔ)啟發(fā)式的跨領(lǐng)域文本情感分類集成模型(Subject-basedModel)。該模型依照評(píng)論中旬子的主語(yǔ),將評(píng)論劃分為Personal和Object兩個(gè)視圖。其中,Personal視圖包括主語(yǔ)或隱含主語(yǔ)是人物(評(píng)價(jià)者)的句子集;Object視圖由主語(yǔ)或隱含主語(yǔ)是評(píng)價(jià)對(duì)象的句子組成。統(tǒng)計(jì)發(fā)現(xiàn),Persoml視圖往往具有較好的領(lǐng)域獨(dú)立性,而Object視圖則常常具有領(lǐng)域特定性。在此基礎(chǔ)上,通過(guò)集成學(xué)習(xí),有效地融合兩個(gè)視圖,既可以更大的受益于領(lǐng)域獨(dú)立性部分(Persona

5、l視圖),而在一定程度上又可以避免領(lǐng)域特定性部分(Object視圖)拉大數(shù)據(jù)分布差異。最后,實(shí)驗(yàn)從監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)兩個(gè)方面,驗(yàn)證了Subject-based模型的有效性。最后,鑒于同一條評(píng)論中主題(產(chǎn)品屬性)的混雜性和情感對(duì)主題的依賴性,本文在第2部分工作的基礎(chǔ)上,充分考慮樣本的質(zhì)量,提出了一種聯(lián)合樣本過(guò)濾和主語(yǔ)啟發(fā)式的跨領(lǐng)域情感分類集成模型SF.SE(JointSampkFilteringwithSubject.basedEmerrbleModel)。文中首先在句子級(jí)上提出了一種同時(shí)考慮主題和情感因素的主題模型,稱之為SS.LDA。在此基礎(chǔ)上,以無(wú)監(jiān)督的方式過(guò)濾掉同一條評(píng)論中與其情

6、感傾向性不同的句子,從而提高了評(píng)論的質(zhì)量。實(shí)驗(yàn)結(jié)果表明,該模型能進(jìn)一步提高分類性能。關(guān)鍵詞:情感分類;跨領(lǐng)域;遷移學(xué)習(xí);主題模型面向評(píng)論的跨領(lǐng)域情感分類研究ResearchonCross.domainSentimentClassificationofReviewsAbstractWiththeriseofsocialnetworkplatforms,massivesubjectiveinformationquicklyemerges.Someresearchfieldssuchasser吐hnentclassificationandopinionmininghaveattractedwi

7、deattentiomowingtoitspotentialapplications.However,sentimentclassificationisdomain-specificduetothedivergentdistributions.Thatistosay,theperformanceUSl.1anyactspoorlywhenthedistribuliorddiffersubstamially.Withtherapidd

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。