基于cmb-ld的微博主題挖掘

基于cmb-ld的微博主題挖掘

ID:34186708

大?。?.72 MB

頁(yè)數(shù):55頁(yè)

時(shí)間:2019-03-03

基于cmb-ld的微博主題挖掘_第1頁(yè)
基于cmb-ld的微博主題挖掘_第2頁(yè)
基于cmb-ld的微博主題挖掘_第3頁(yè)
基于cmb-ld的微博主題挖掘_第4頁(yè)
基于cmb-ld的微博主題挖掘_第5頁(yè)
資源描述:

《基于cmb-ld的微博主題挖掘》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、浙江大學(xué)碩士學(xué)位論文AbstractThroughexperiments,wecalculatedtheperplexityvaluesofCMB-LDAmodelandLDAmodel,theexperimentalresultsshowthat,underthesameiterations,CMB—LDAmodel’SperplexityvalueissmallerthanLDAmodel’S(thesmallerofperplexityvalue,thebetter).4)UsedGibbsSampli

2、ngtorealizeChineseMicroBlogtopicmining,besidesanalogiedthistopicmodeltoothersocialplatforms,suchasWeixin,Renren,QQchatandSOon.Keywords:LDA;CMB—LDA;GibbsSampling;TopicMining;Microblog浙江大學(xué)碩士學(xué)位論文目錄摘要????????????????????????????????iAbstract....................

3、..............................?..................................................................iii第1章緒論????????????????????????????l1.1課題研究背景及意義?????????????????????11.2國(guó)內(nèi)外研究現(xiàn)狀???????????????????????21.3本文研究?jī)?nèi)容????????????????????????31.4本文組織結(jié)構(gòu)????????????

4、????????????41.5本章小節(jié)??????????????????????????5第2章微博主題相關(guān)研究及總體流程?????????????????62.1微博數(shù)據(jù)處理用到的分詞和新詞識(shí)別技術(shù)????????????62.1.1分詞算法????????????????????????62.1.2未登錄詞識(shí)別算法????????????????????72。2主題挖掘相關(guān)算法??????????????????????82.2.1基于向量空間的主題挖掘算法???????????????82.2.2基

5、于改進(jìn)的向量空間主題挖掘算法?????????????92.2.3基于概率的主題挖掘算法????????????????一lO2.3微博主題挖掘的總體流程??????????????????..162.4本章小節(jié)?????????????????????????一18第3章微博數(shù)據(jù)采集和整理????????????????????..193.1微博數(shù)據(jù)采集整理的流程??????????????????..193.2微博實(shí)驗(yàn)數(shù)據(jù)爬取方式???????????????????一203.2.1基于API的數(shù)據(jù)獲取流

6、程?????????????????213.2.2基于web爬蟲抓取數(shù)據(jù)?????????????????一233.3微博數(shù)據(jù)分詞???????????????????????一253.4去除微博實(shí)驗(yàn)數(shù)據(jù)中的停用詞????????????????一263.5本章小節(jié)?????????????????????????一27第4章微博主題挖掘???????????????????????..284.1LDA模型推導(dǎo)方法??????????????????????28浙江大學(xué)碩士學(xué)位論文目錄4.1.1吉布斯抽樣??

7、????????????????????一284.1.2變分推理???????????????????????一284.1.3最大期望???????????????????????一294.2中文微博主題模型(CMB—LDA)????????????????304.2.1微博定義???????????????????????一304.2.2CMB-LDA模型介紹????????????????????324.2.3CMB—LDA模型推導(dǎo)????????????????????334.2.4CMB—LDA模型微

8、博生成步驟????????????????354.3CMB—LDA模型延伸??????????????????????374.4本章小結(jié)?????????????????????????一37第5章實(shí)驗(yàn)分析?????????????????????????..395.1實(shí)驗(yàn)準(zhǔn)備?????????????????????????一395.1.1數(shù)據(jù)預(yù)處理??????????????????????一3

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。