基于動態(tài)labeled-lda模型的微博主題挖掘

基于動態(tài)labeled-lda模型的微博主題挖掘

ID:34045589

大?。?.29 MB

頁數(shù):48頁

時間:2019-03-03

基于動態(tài)labeled-lda模型的微博主題挖掘_第1頁
基于動態(tài)labeled-lda模型的微博主題挖掘_第2頁
基于動態(tài)labeled-lda模型的微博主題挖掘_第3頁
基于動態(tài)labeled-lda模型的微博主題挖掘_第4頁
基于動態(tài)labeled-lda模型的微博主題挖掘_第5頁
資源描述:

《基于動態(tài)labeled-lda模型的微博主題挖掘》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、學(xué)位論文獨(dú)創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下獨(dú)立研究工作所取得的成果。據(jù)我所知,除了文中特別加以標(biāo)注和致謝的內(nèi)容外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得金旦里王些太堂或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。對本文成果做出貢獻(xiàn)的個人和集體,本人已在論文中作了明確的說明,并表示謝意。學(xué)位論文中表達(dá)的觀點(diǎn)純屬作者本人觀點(diǎn),與合肥工業(yè)大學(xué)無關(guān)。學(xué)位論文作者簽名:同垅驕簽名日期砸.牛.f7學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解金膽王些太堂有關(guān)保留、使用學(xué)位論文的規(guī)定,即:除保密期內(nèi)的涉密學(xué)位論文外,學(xué)校有權(quán)保存并向國家有關(guān)部門或機(jī)構(gòu)送

2、交論文的復(fù)印件和電子光盤,允許論文被查閱或借閱。本人授權(quán)金月巴工些太堂可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫,允許采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位論文作者簽名:1虱眵磅喬簽名日期:洲r(nóng)年4月門日論文作者畢業(yè)去向工作單位:聯(lián)系電話:通訊地址:指導(dǎo)教師簽名:簽名日期:幻f亍年呼月Z5日E—mai1:郵政編碼:致謝時光飛逝,轉(zhuǎn)眼問,三年的研究生時光即將落幕。追憶過去,有很多值得自己去回顧去反思。在整個學(xué)習(xí)過程中,許多人都給予了我無私的指導(dǎo)與幫助。使我在這人生的關(guān)鍵階段得到了鍛煉與成長。在這臨近畢業(yè)之際,我想借此機(jī)會對

3、他們表達(dá)深深的感謝。首先,我最要感謝的就是我的導(dǎo)師李鋒剛副教授。李老師是一位學(xué)術(shù)水平很高的學(xué)者,他不僅有著嚴(yán)謹(jǐn)?shù)目蒲袘B(tài)度、兢兢業(yè)業(yè)的工作精神、深厚的專業(yè)修養(yǎng)及和藹可親的待人方式,而且他還非常善于教學(xué),每每與他交流問題時,都會給予我很多的啟發(fā)以及對問題的更深層次思考,讓我受益匪淺。在將近三年的碩士生涯里,李老師在理論學(xué)習(xí)、科研項(xiàng)目、論文撰寫等方方面面給予了我悉心的指導(dǎo)。在學(xué)習(xí)上迷茫時,他總是能給出很多建議,為我指明方向。我很感激能有這樣一個跟著李老師學(xué)習(xí)的機(jī)會,我深刻地體會到了科研工作的嚴(yán)謹(jǐn)與思考,也從中領(lǐng)悟到了一些做人做的態(tài)度與道理。在此,向李老師的諄諄教誨致以最誠摯的謝意。同

4、時,非常感謝智能管理研究所的所長倪志偉教授,經(jīng)我們提供了良好的學(xué)習(xí)環(huán)境和很多學(xué)習(xí)機(jī)會;他高尚的品德、嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)作風(fēng)及和藹可親的態(tài)度,讓我十分敬佩。其次,感謝我們智能管理研究所的所有兄弟姐妹們,梁婷、張國強(qiáng)、郭文陽、丁斌、荊婷婷、何巖新、萬飛、楊曉斌、王萍、尤其是徐凱,以及同班的童雅林、陳驁等。他們不僅在學(xué)習(xí)上給予我很大的幫助同時也讓我收獲了深厚的友誼,也為我的研究生生活增添了許多樂趣,從他們身上也學(xué)習(xí)到了很多優(yōu)秀的品質(zhì)。還有,感謝我的家人,感謝其他所有好朋友的陪伴,感謝一直以來的生活上與精神上的鼓舞與動力,讓我更加熱愛生活,更加積極學(xué)習(xí)與工作,也更加充滿自信。最后,向各位專家表

5、示由衷的感謝!作者:周先琳2015年4月摘要隨著微博用戶的不斷增加,微博的影響力也在不斷地擴(kuò)張。微博類動態(tài)短文本由于其特有的文本特征,微博主題受時間因素的影響很大。Labeled—LDA模型是傳統(tǒng)的LDA模型的一種變形,它是在LDA原有的基礎(chǔ)上附加了一層類別標(biāo)簽。使傳統(tǒng)的LDA多了一個直接的分配模型類別的優(yōu)勢,同時很好的優(yōu)化了傳統(tǒng)LDA模型在處理文本分類時會出現(xiàn)的在不屬于自己的類別上進(jìn)行生成時可能會導(dǎo)致隱主題的強(qiáng)制分配的問題。本文的研究目的:由于微博類短文本式網(wǎng)絡(luò)信息的及時性、動態(tài)性和主題復(fù)雜性及多樣性,首先對己選取好的微博文本在做了預(yù)處理后,進(jìn)行文本特征選擇。動態(tài)化改進(jìn)后的V

6、SM特征選擇方法明顯優(yōu)于傳統(tǒng)的TF.IDF算法。其次,本文構(gòu)建了動態(tài)的Labeled-LDA模型,將標(biāo)簽與動態(tài)相結(jié)合。方法包括三部分:第一,用Labeled-LDh主題模型進(jìn)行建模和特征選擇,確定主題數(shù)和隱主題一文本矩陣;第二,對微博文本劃分時間文本集;第三,對Labeled—LDA模型進(jìn)行動態(tài)化的改進(jìn),最終給出了針對微博文體的一種新的主題檢索模型。實(shí)驗(yàn)結(jié)論:時間對微博的影響很大,動態(tài)化改進(jìn)后的模型可以看出主題隨時問因素的變化更為明顯,本文提出的動態(tài)標(biāo)簽LDA模型對微博類的動態(tài)文本的主題挖掘具有優(yōu)化作用。關(guān)鍵字:微博;文本挖掘;標(biāo)簽;動態(tài);模型;LDAIIABSTRACTWit

7、htheconstamincreasingoftheusersofmicroblog.TheinfluenceofWeiboiscontinuallyexpanding.Becauseoftheuniquetextfeatureofmicroblogclassdynamicshorttext.Thethemeofblogaregreatlyaffectedbythetimefactor.Labeled—LDAmodelisamodificationoftheconventionalLDAmo

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。