基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化

基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化

ID:35067953

大小:2.74 MB

頁數(shù):58頁

時(shí)間:2019-03-17

基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化_第1頁
基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化_第2頁
基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化_第3頁
基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化_第4頁
基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化_第5頁
資源描述:

《基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化OptimizationAlgorithmofRetrievalResultinMicroblogbasedonUserPersonalization學(xué)科專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)研究生:緱小路指導(dǎo)教師:喻梅副教授天津大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院二零一五年十二月摘要近年來,互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的飛速發(fā)展使得通過網(wǎng)絡(luò)進(jìn)行通信的網(wǎng)絡(luò)社交成為可能。在眾多的社會(huì)網(wǎng)絡(luò)平臺(tái)中,微博成為了使用廣泛、最受人們歡迎和研究學(xué)者關(guān)注的社交平臺(tái),微博搜索服務(wù)在實(shí)時(shí)性方面也得到了人們的認(rèn)可。然而,經(jīng)過大量的研究分析發(fā)現(xiàn),

2、在以人為本,追求個(gè)性化服務(wù)的今天,微博搜索服務(wù)并沒有做到個(gè)性化搜索,造成了浪費(fèi)豐富的微博用戶信息資源的同時(shí),搜索結(jié)果有些不盡人意的后果。對大量的搜索引擎技術(shù)進(jìn)行研究后發(fā)現(xiàn),查詢擴(kuò)充機(jī)制可以有效的提高搜索查詢的準(zhǔn)確率。論文基于以上發(fā)現(xiàn),提出一種基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化算法。由于目前微博搜索引擎相對完善,其搜索結(jié)果具有一定的可靠性,因此論文假設(shè)微博搜索引擎得到的搜索結(jié)果的前N頁包含所有與查詢詞相關(guān)的文檔內(nèi)容?;谶@一假設(shè),論文使用主題模型分析和提取用戶的興趣,結(jié)合這一用戶興趣和加權(quán)關(guān)聯(lián)規(guī)則算法對查詢詞進(jìn)行語義關(guān)聯(lián)擴(kuò)

3、充。使用傳統(tǒng)的相似性計(jì)算方法TF-IDF計(jì)算查詢詞與微博搜索文檔的相似度,再結(jié)合微博平臺(tái)時(shí)效性的特點(diǎn)共同作為文檔重新排序的評分依據(jù),進(jìn)而優(yōu)化微博搜索結(jié)果。論文的實(shí)驗(yàn)以微博平臺(tái)用戶的發(fā)布、轉(zhuǎn)發(fā)等信息為數(shù)據(jù)集,以微博搜索引擎的搜索結(jié)果為基準(zhǔn)結(jié)果,以基于詞典的查詢擴(kuò)充方法優(yōu)化微博搜索結(jié)果的實(shí)驗(yàn),基于關(guān)聯(lián)規(guī)則的查詢擴(kuò)充方法優(yōu)化微博搜索結(jié)果的實(shí)驗(yàn)作為對比實(shí)驗(yàn),對論文提出的基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化算法進(jìn)行分析。實(shí)驗(yàn)結(jié)果表明,論文提出的基于個(gè)性化特征的微博搜索結(jié)果優(yōu)化算法相比于基準(zhǔn)結(jié)果和以上兩種對比實(shí)驗(yàn)在搜索準(zhǔn)確率上有明顯的

4、提高。關(guān)鍵詞:加權(quán)關(guān)聯(lián)規(guī)則,主題模型,查詢擴(kuò)充機(jī)制,微博個(gè)性化搜索IABSTRACTInrecentyears,therapiddevelopmentofInternettechnologyandinformationtechnologymakesitpossibletocommunicatethroughthenetwork.Amongnumeroussocialnetworkplatforms,microbloghasbecomeasocialplatformwhichhasbeenwidelyused,themost

5、popularandresearchscholarsareconcernedon.Andintermsofrealtime,themicroblogretrievalservicehasbeenapproved.However,afteralargenumberofresearchandanalysis,wecouldfindthatmicroblogretrievalservicedoesnotdopersonalizedsearchintoday’speople-orientedandthepursuitofperso

6、nalizedservice,resultinginawasteofinformationresourcesoftherichmicrobloggingusers,andretrievalresultsaresomewhatunsatisfactory.Studyingalargenumberofretrievalenginetechnology,weacknowledgethatthequeryexpansionmechanismcaneffectivelyimprovetheaccuracyofquery.Basedo

7、ntheabovefindings,thisthesispresentsanewalgorithmfortheoptimizationofmicroblogretrievalresultsbasedonuserpersonalizedfeatures.Thisalgorithmassumesthattheretrievalresultsofthemicroblogretrievalenginecontainsallthedocumentsrelatedtothequeryterms.Basedonthisassumptio

8、n,thethesisusesTopicModelandweightedassociationrulestoexpandthesemanticrelevanceofthequeryterms.UsingthetraditionalsimilaritycalculationmethodTF-IDFtoge

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。