基于圖排序的微博個性化主題搜索

基于圖排序的微博個性化主題搜索

ID:33487229

大?。?.56 MB

頁數(shù):55頁

時間:2019-02-26

基于圖排序的微博個性化主題搜索_第1頁
基于圖排序的微博個性化主題搜索_第2頁
基于圖排序的微博個性化主題搜索_第3頁
基于圖排序的微博個性化主題搜索_第4頁
基于圖排序的微博個性化主題搜索_第5頁
資源描述:

《基于圖排序的微博個性化主題搜索》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、浙江大學(xué)碩士學(xué)位論文目錄4.2.3微博語義空間學(xué)習(xí)????????????????????3l4.2.4算法實現(xiàn)????????????????????????354.3本章小結(jié)??????????????????????????36第5章實驗設(shè)計與評估??????????????????????..375.1實驗數(shù)據(jù)集和實驗環(huán)境????????????????????375.2評價指標(biāo)介紹????????????????????????375.3微博主題詞提取實驗?????????????????????395.3.1實驗設(shè)置???????

2、?????????????????39513.2參數(shù)設(shè)置????????????????????????395.3-3實驗結(jié)果????????????????????????415.4微博個性化主題搜索實驗???????????????????435.4.1實驗設(shè)置????????????????????????435.4.2參數(shù)設(shè)置????????????????????????445.4.3實驗結(jié)果????????????????????????475.5本章小結(jié)??????????????????????????????..49第6章總

3、結(jié)與展望????????????????????????..506.1工作總結(jié)??????????????????????????506.2未來展望??????????????????????????50參考文獻?????????????????????????????52致謝???????????????????????????????56浙江大學(xué)碩士學(xué)位論文目錄圖目錄圖2.1IRA算法圖模型??????????????????????8圖2—2PageRank算法計算過程??????????????????.10圖2—3流行空間示例圖??

4、???????????????????一12圖2—4概率潛在語義分析模型??????????????????..15圖2.5潛在狄利克雷分配模型??????????????????一15圖3.1BTWR算法總體流程圖??????????????????.18圖3—2BTWR圖排序算法的詳細過程???????????????.19圖3—3詞語共現(xiàn)圖實例?????????????????????一21圖4.1微博官方搜索示例????????????????????..28圖4-2微博圖結(jié)構(gòu)???????????????????????..30圖4

5、—3用戶,微博,關(guān)鍵詞的鄰接圖???????????????一31圖5.1當(dāng)統(tǒng)汁特征權(quán)重對算法的影響???????????????一40圖5.2不同方法的關(guān)鍵詞提取的精確度??????????????一41圖5—3關(guān)鍵詞提取算法的MAP值?????????????????42圖5.4關(guān)鍵詞提取算法的NDCG值????????????????.42圖5.5關(guān)鍵詞數(shù)量對算法的影響?????????????????..45圖5-6用戶一微博的權(quán)重系數(shù)對算法的影響?????????????.46圖5—7語義空問維度對算法的影響????????????

6、????..46圖5.8排序算法在不同查詢關(guān)鍵詞上的準(zhǔn)確率???????????一47圖5-9排序算法的MAP比較???????????????????48圖5一10排序算法的NDCG比較??????????????????48浙江大學(xué)碩士學(xué)位論文目錄表目錄表5—1實驗環(huán)境配置??????????????????????~37表5-2關(guān)鍵詞的統(tǒng)計特征????????????????????..40表5—3不同關(guān)鍵詞提取方法的精確度???????????????一41表5—4BTWR算法關(guān)鍵詞提取示例????????????????.43V浙江

7、大學(xué)碩士學(xué)位論文第1章緒論1.1課題背景隨著Web2.0技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)已經(jīng)不僅僅是一個信息獲取途徑,更重要的,它己成為人們發(fā)布信息的平臺。由于用戶的廣泛參與,一方面,使得互聯(lián)網(wǎng)上的信息呈現(xiàn)爆炸式增長,另一方面,信息的結(jié)構(gòu)更加復(fù)雜和多元化。這給信息檢索[1】帶來了巨大挑戰(zhàn)?!の⒉鳛橐粋€典型的新型互聯(lián)網(wǎng)信息平臺,在最近幾年迅速發(fā)展壯大。以新浪微博為例,人們每天發(fā)布數(shù)以億計的消息,并造成爆炸式的傳播。為了適應(yīng)現(xiàn)在社會的快節(jié)奏和人們的浮躁心理,微博上的每條信息必須控制在140個字以內(nèi),這人人促進了消息的發(fā)布和傳播,同時,也使數(shù)據(jù)更加零散和

8、不規(guī)則。用戶為了在有限的文本內(nèi)表達豐富的思想,已經(jīng)習(xí)慣在微博中使用各種含有特殊意義的符號,比如用“拌”標(biāo)注話題,使用“@”提及他人等。區(qū)別于傳統(tǒng)信息檢索所面對的文檔

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。