資源描述:
《基于cmb-ld的微博主題挖掘》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、浙江大學(xué)碩士學(xué)位論文AbstractThroughexperiments,wecalculatedtheperplexityvaluesofCMB-LDAmodelandLDAmodel,theexperimentalresultsshowthat,underthesameiterations,CMB—LDAmodel’SperplexityvalueissmallerthanLDAmodel’S(thesmallerofperplexityvalue,thebetter).4)UsedGibbsSampli
2、ngtorealizeChineseMicroBlogtopicmining,besidesanalogiedthistopicmodeltoothersocialplatforms,suchasWeixin,Renren,QQchatandSOon.Keywords:LDA;CMB—LDA;GibbsSampling;TopicMining;Microblog浙江大學(xué)碩士學(xué)位論文目錄摘要????????????????????????????????iAbstract....................
3、..............................?..................................................................iii第1章緒論????????????????????????????l1.1課題研究背景及意義?????????????????????11.2國(guó)內(nèi)外研究現(xiàn)狀???????????????????????21.3本文研究?jī)?nèi)容????????????????????????31.4本文組織結(jié)構(gòu)????????????
4、????????????41.5本章小節(jié)??????????????????????????5第2章微博主題相關(guān)研究及總體流程?????????????????62.1微博數(shù)據(jù)處理用到的分詞和新詞識(shí)別技術(shù)????????????62.1.1分詞算法????????????????????????62.1.2未登錄詞識(shí)別算法????????????????????72。2主題挖掘相關(guān)算法??????????????????????82.2.1基于向量空間的主題挖掘算法???????????????82.2.2基
5、于改進(jìn)的向量空間主題挖掘算法?????????????92.2.3基于概率的主題挖掘算法????????????????一lO2.3微博主題挖掘的總體流程??????????????????..162.4本章小節(jié)?????????????????????????一18第3章微博數(shù)據(jù)采集和整理????????????????????..193.1微博數(shù)據(jù)采集整理的流程??????????????????..193.2微博實(shí)驗(yàn)數(shù)據(jù)爬取方式???????????????????一203.2.1基于API的數(shù)據(jù)獲取流
6、程?????????????????213.2.2基于web爬蟲抓取數(shù)據(jù)?????????????????一233.3微博數(shù)據(jù)分詞???????????????????????一253.4去除微博實(shí)驗(yàn)數(shù)據(jù)中的停用詞????????????????一263.5本章小節(jié)?????????????????????????一27第4章微博主題挖掘???????????????????????..284.1LDA模型推導(dǎo)方法??????????????????????28浙江大學(xué)碩士學(xué)位論文目錄4.1.1吉布斯抽樣??
7、????????????????????一284.1.2變分推理???????????????????????一284.1.3最大期望???????????????????????一294.2中文微博主題模型(CMB—LDA)????????????????304.2.1微博定義???????????????????????一304.2.2CMB-LDA模型介紹????????????????????324.2.3CMB—LDA模型推導(dǎo)????????????????????334.2.4CMB—LDA模型微
8、博生成步驟????????????????354.3CMB—LDA模型延伸??????????????????????374.4本章小結(jié)?????????????????????????一37第5章實(shí)驗(yàn)分析?????????????????????????..395.1實(shí)驗(yàn)準(zhǔn)備?????????????????????????一395.1.1數(shù)據(jù)預(yù)處理??????????????????????一3