基于cmb-lda的微博主題挖掘

基于cmb-lda的微博主題挖掘

ID:34045282

大小:4.66 MB

頁數(shù):53頁

時間:2019-03-03

基于cmb-lda的微博主題挖掘_第1頁
基于cmb-lda的微博主題挖掘_第2頁
基于cmb-lda的微博主題挖掘_第3頁
基于cmb-lda的微博主題挖掘_第4頁
基于cmb-lda的微博主題挖掘_第5頁
資源描述:

《基于cmb-lda的微博主題挖掘》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、浙江大學(xué)碩士學(xué)位論文AbstractThroughexperiments,wecalculatedtheperplexityvaluesofCMB-LDAmodelandLDAmodel,theexperimentalresultsshowthat,underthesameiterations,CMB—LDAmodel’SperplexityvalueissmallerthanLDAmodel’S(thesmallerofperplexityvalue,thebetter).4)UsedGibbsSamplingtorealizeChineseMicroBlogtopicmini

2、ng,besidesanalogiedthistopicmodeltoothersocialplatforms,suchasWeixin,Renren,QQchatandSOon.Keywords:LDA;CMB—LDA;GibbsSampling;TopicMining;Microblog浙江大學(xué)碩士學(xué)位論文目錄摘要????????????????????????????????iAbstract..................................................?.........................................

3、.........................iii第1章緒論????????????????????????????l1.1課題研究背景及意義?????????????????????11.2國內(nèi)外研究現(xiàn)狀???????????????????????21.3本文研究內(nèi)容????????????????????????31.4本文組織結(jié)構(gòu)????????????????????????41.5本章小節(jié)??????????????????????????5第2章微博主題相關(guān)研究及總體流程?????????????????62.1微博數(shù)據(jù)處理用到的分詞和新詞識別技術(shù)??????

4、??????62.1.1分詞算法????????????????????????62.1.2未登錄詞識別算法????????????????????72。2主題挖掘相關(guān)算法??????????????????????82.2.1基于向量空間的主題挖掘算法???????????????82.2.2基于改進(jìn)的向量空間主題挖掘算法?????????????92.2.3基于概率的主題挖掘算法????????????????一lO2.3微博主題挖掘的總體流程??????????????????..162.4本章小節(jié)?????????????????????????一18第3章微博數(shù)據(jù)采集和

5、整理????????????????????..193.1微博數(shù)據(jù)采集整理的流程??????????????????..193.2微博實驗數(shù)據(jù)爬取方式???????????????????一203.2.1基于API的數(shù)據(jù)獲取流程?????????????????213.2.2基于web爬蟲抓取數(shù)據(jù)?????????????????一233.3微博數(shù)據(jù)分詞???????????????????????一253.4去除微博實驗數(shù)據(jù)中的停用詞????????????????一263.5本章小節(jié)?????????????????????????一27第4章微博主題挖掘??????????

6、?????????????..284.1LDA模型推導(dǎo)方法??????????????????????28浙江大學(xué)碩士學(xué)位論文目錄4.1.1吉布斯抽樣??????????????????????一284.1.2變分推理???????????????????????一284.1.3最大期望???????????????????????一294.2中文微博主題模型(CMB—LDA)????????????????304.2.1微博定義???????????????????????一304.2.2CMB-LDA模型介紹????????????????????324.2.3CMB—LDA

7、模型推導(dǎo)????????????????????334.2.4CMB—LDA模型微博生成步驟????????????????354.3CMB—LDA模型延伸??????????????????????374.4本章小結(jié)?????????????????????????一37第5章實驗分析?????????????????????????..395.1實驗準(zhǔn)備?????????????????????????一395.1.1數(shù)據(jù)預(yù)處理??????????????????????一3

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。