資源描述:
《基于圖排序的微博個性化主題搜索》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、浙江大學(xué)碩士學(xué)位論文目錄4.2.3微博語義空間學(xué)習(xí)????????????????????3l4.2.4算法實現(xiàn)????????????????????????354.3本章小結(jié)??????????????????????????36第5章實驗設(shè)計與評估??????????????????????..375.1實驗數(shù)據(jù)集和實驗環(huán)境????????????????????375.2評價指標(biāo)介紹????????????????????????375.3微博主題詞提取實驗?????????????????????395.3.1實驗設(shè)置???????
2、?????????????????39513.2參數(shù)設(shè)置????????????????????????395.3-3實驗結(jié)果????????????????????????415.4微博個性化主題搜索實驗???????????????????435.4.1實驗設(shè)置????????????????????????435.4.2參數(shù)設(shè)置????????????????????????445.4.3實驗結(jié)果????????????????????????475.5本章小結(jié)??????????????????????????????..49第6章總
3、結(jié)與展望????????????????????????..506.1工作總結(jié)??????????????????????????506.2未來展望??????????????????????????50參考文獻?????????????????????????????52致謝???????????????????????????????56浙江大學(xué)碩士學(xué)位論文目錄圖目錄圖2.1IRA算法圖模型??????????????????????8圖2—2PageRank算法計算過程??????????????????.10圖2—3流行空間示例圖??
4、???????????????????一12圖2—4概率潛在語義分析模型??????????????????..15圖2.5潛在狄利克雷分配模型??????????????????一15圖3.1BTWR算法總體流程圖??????????????????.18圖3—2BTWR圖排序算法的詳細過程???????????????.19圖3—3詞語共現(xiàn)圖實例?????????????????????一21圖4.1微博官方搜索示例????????????????????..28圖4-2微博圖結(jié)構(gòu)???????????????????????..30圖4
5、—3用戶,微博,關(guān)鍵詞的鄰接圖???????????????一31圖5.1當(dāng)統(tǒng)汁特征權(quán)重對算法的影響???????????????一40圖5.2不同方法的關(guān)鍵詞提取的精確度??????????????一41圖5—3關(guān)鍵詞提取算法的MAP值?????????????????42圖5.4關(guān)鍵詞提取算法的NDCG值????????????????.42圖5.5關(guān)鍵詞數(shù)量對算法的影響?????????????????..45圖5-6用戶一微博的權(quán)重系數(shù)對算法的影響?????????????.46圖5—7語義空問維度對算法的影響????????????
6、????..46圖5.8排序算法在不同查詢關(guān)鍵詞上的準(zhǔn)確率???????????一47圖5-9排序算法的MAP比較???????????????????48圖5一10排序算法的NDCG比較??????????????????48浙江大學(xué)碩士學(xué)位論文目錄表目錄表5—1實驗環(huán)境配置??????????????????????~37表5-2關(guān)鍵詞的統(tǒng)計特征????????????????????..40表5—3不同關(guān)鍵詞提取方法的精確度???????????????一41表5—4BTWR算法關(guān)鍵詞提取示例????????????????.43V浙江
7、大學(xué)碩士學(xué)位論文第1章緒論1.1課題背景隨著Web2.0技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)已經(jīng)不僅僅是一個信息獲取途徑,更重要的,它己成為人們發(fā)布信息的平臺。由于用戶的廣泛參與,一方面,使得互聯(lián)網(wǎng)上的信息呈現(xiàn)爆炸式增長,另一方面,信息的結(jié)構(gòu)更加復(fù)雜和多元化。這給信息檢索[1】帶來了巨大挑戰(zhàn)?!の⒉鳛橐粋€典型的新型互聯(lián)網(wǎng)信息平臺,在最近幾年迅速發(fā)展壯大。以新浪微博為例,人們每天發(fā)布數(shù)以億計的消息,并造成爆炸式的傳播。為了適應(yīng)現(xiàn)在社會的快節(jié)奏和人們的浮躁心理,微博上的每條信息必須控制在140個字以內(nèi),這人人促進了消息的發(fā)布和傳播,同時,也使數(shù)據(jù)更加零散和
8、不規(guī)則。用戶為了在有限的文本內(nèi)表達豐富的思想,已經(jīng)習(xí)慣在微博中使用各種含有特殊意義的符號,比如用“拌”標(biāo)注話題,使用“@”提及他人等。區(qū)別于傳統(tǒng)信息檢索所面對的文檔