資源描述:
《基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化OptimizationAlgorithmofRetrievalResultinMicroblogbasedonUserPersonalization學(xué)科專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)研究生:緱小路指導(dǎo)教師:喻梅副教授天津大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院二零一五年十二月摘要近年來,互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的飛速發(fā)展使得通過網(wǎng)絡(luò)進(jìn)行通信的網(wǎng)絡(luò)社交成為可能。在眾多的社會(huì)網(wǎng)絡(luò)平臺(tái)中,微博成為了使用廣泛、最受人們歡迎和研究學(xué)者關(guān)注的社交平臺(tái),微博搜索服務(wù)在實(shí)時(shí)性方面也得到了人們的認(rèn)可。然而,經(jīng)過大量的研究分析發(fā)現(xiàn),
2、在以人為本,追求個(gè)性化服務(wù)的今天,微博搜索服務(wù)并沒有做到個(gè)性化搜索,造成了浪費(fèi)豐富的微博用戶信息資源的同時(shí),搜索結(jié)果有些不盡人意的后果。對大量的搜索引擎技術(shù)進(jìn)行研究后發(fā)現(xiàn),查詢擴(kuò)充機(jī)制可以有效的提高搜索查詢的準(zhǔn)確率。論文基于以上發(fā)現(xiàn),提出一種基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化算法。由于目前微博搜索引擎相對完善,其搜索結(jié)果具有一定的可靠性,因此論文假設(shè)微博搜索引擎得到的搜索結(jié)果的前N頁包含所有與查詢詞相關(guān)的文檔內(nèi)容?;谶@一假設(shè),論文使用主題模型分析和提取用戶的興趣,結(jié)合這一用戶興趣和加權(quán)關(guān)聯(lián)規(guī)則算法對查詢詞進(jìn)行語義關(guān)聯(lián)擴(kuò)
3、充。使用傳統(tǒng)的相似性計(jì)算方法TF-IDF計(jì)算查詢詞與微博搜索文檔的相似度,再結(jié)合微博平臺(tái)時(shí)效性的特點(diǎn)共同作為文檔重新排序的評分依據(jù),進(jìn)而優(yōu)化微博搜索結(jié)果。論文的實(shí)驗(yàn)以微博平臺(tái)用戶的發(fā)布、轉(zhuǎn)發(fā)等信息為數(shù)據(jù)集,以微博搜索引擎的搜索結(jié)果為基準(zhǔn)結(jié)果,以基于詞典的查詢擴(kuò)充方法優(yōu)化微博搜索結(jié)果的實(shí)驗(yàn),基于關(guān)聯(lián)規(guī)則的查詢擴(kuò)充方法優(yōu)化微博搜索結(jié)果的實(shí)驗(yàn)作為對比實(shí)驗(yàn),對論文提出的基于用戶個(gè)性化特征的微博搜索結(jié)果優(yōu)化算法進(jìn)行分析。實(shí)驗(yàn)結(jié)果表明,論文提出的基于個(gè)性化特征的微博搜索結(jié)果優(yōu)化算法相比于基準(zhǔn)結(jié)果和以上兩種對比實(shí)驗(yàn)在搜索準(zhǔn)確率上有明顯的
4、提高。關(guān)鍵詞:加權(quán)關(guān)聯(lián)規(guī)則,主題模型,查詢擴(kuò)充機(jī)制,微博個(gè)性化搜索IABSTRACTInrecentyears,therapiddevelopmentofInternettechnologyandinformationtechnologymakesitpossibletocommunicatethroughthenetwork.Amongnumeroussocialnetworkplatforms,microbloghasbecomeasocialplatformwhichhasbeenwidelyused,themost
5、popularandresearchscholarsareconcernedon.Andintermsofrealtime,themicroblogretrievalservicehasbeenapproved.However,afteralargenumberofresearchandanalysis,wecouldfindthatmicroblogretrievalservicedoesnotdopersonalizedsearchintoday’speople-orientedandthepursuitofperso
6、nalizedservice,resultinginawasteofinformationresourcesoftherichmicrobloggingusers,andretrievalresultsaresomewhatunsatisfactory.Studyingalargenumberofretrievalenginetechnology,weacknowledgethatthequeryexpansionmechanismcaneffectivelyimprovetheaccuracyofquery.Basedo
7、ntheabovefindings,thisthesispresentsanewalgorithmfortheoptimizationofmicroblogretrievalresultsbasedonuserpersonalizedfeatures.Thisalgorithmassumesthattheretrievalresultsofthemicroblogretrievalenginecontainsallthedocumentsrelatedtothequeryterms.Basedonthisassumptio
8、n,thethesisusesTopicModelandweightedassociationrulestoexpandthesemanticrelevanceofthequeryterms.UsingthetraditionalsimilaritycalculationmethodTF-IDFtoge