資源描述:
《基于微博的個(gè)性化搜索系統(tǒng)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、摘要當(dāng)今,互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,能夠隨時(shí)隨地發(fā)表和分享自己的即興感受成為人們新的需求。微博作為一種新型社會(huì)媒體形式,受到了廣泛的關(guān)注。目前在互聯(lián)網(wǎng)上每天產(chǎn)生數(shù)以百萬計(jì)的微博,給用戶快速尋找所需的微博信息帶來了挑戰(zhàn)?;谖⒉╅_發(fā)的搜索引擎可以部分解決這一問題。但是,大多數(shù)的搜索引擎都僅僅基于內(nèi)容構(gòu)建,無法滿足不同用戶從海量微博中獲取個(gè)性化信息的需求。因此,如何將個(gè)性化需求融入微博搜索是一個(gè)亟待研究的課題。針對(duì)上述問題,本文通過建立用戶模型,將個(gè)性化信息引入到微博搜索的過程中,在此基礎(chǔ)上,設(shè)計(jì)實(shí)現(xiàn)了一個(gè)基于微博平臺(tái)的個(gè)性化搜索系統(tǒng)。本文所進(jìn)行的研究工作主要涵蓋了以下幾個(gè)方面:首先
2、是對(duì)用戶模型的構(gòu)建展開了深入研究。本文在組建用戶模型過程中主要研究了四個(gè)方面的內(nèi)容,即數(shù)據(jù)獲取、建模技術(shù)、表示方法以及模型更新方式。在個(gè)性化技術(shù)方面,系統(tǒng)主要通過分析用戶原創(chuàng)微博和轉(zhuǎn)發(fā)微博來構(gòu)建用戶興趣模型,對(duì)這兩種微博進(jìn)行了統(tǒng)計(jì),選取詞頻最高的前50個(gè)詞語作為該用戶的興趣關(guān)鍵詞,并在此基礎(chǔ)上實(shí)現(xiàn)了個(gè)性化搜索。然后本文基于Lucene實(shí)現(xiàn)了基于微博平臺(tái)的個(gè)性化搜索功能,并對(duì)系統(tǒng)平臺(tái)的注冊(cè)/登錄模塊、建立索引模塊、興趣模型構(gòu)建模塊、個(gè)性化搜索模塊這四個(gè)關(guān)鍵部分的具體實(shí)現(xiàn)進(jìn)行了詳細(xì)分析。此外,還通過提交查詢?cè)~來對(duì)比系統(tǒng)返回的普通搜索結(jié)果以及個(gè)性化搜索結(jié)果,最后分析了本系統(tǒng)的優(yōu)缺
3、點(diǎn)。綜上所述,本文抓住了當(dāng)前微博平臺(tái)這個(gè)熱點(diǎn)話題,并結(jié)合信息檢索和個(gè)性化領(lǐng)域相關(guān)的理論和技術(shù),設(shè)計(jì)了一個(gè)基于微博平臺(tái)的個(gè)性化搜索系統(tǒng)。關(guān)鍵詞:個(gè)性化搜索;微博搜索;向量空間模型;用戶興趣模型;-i-萬方數(shù)據(jù)ABSTRACTToday,therapiddevelopmentofInternettechnology,wheneverandwhereverpeoplecanpublishandsharetheirfeelingsbecomethenewdemand.Micro-blogasanewtypeofsocialmedia,ithasbeenwidespreadconce
4、rn.Currentlythousandsofmicro-blogsareemergedontheInterneteveryday,anditbringschallengestoquicklyfindthedesiredinformationforusers.Thesearchenginebasedonmicro-blogcansolutepartoftheproblem.However,mostsearchenginesarebasedononlythecon-tent,itcannotmeettheneedsofaccessingtopersonalizedinform
5、ationforusersfromthemassofmicro-blogs.Therefore,howtorealizethepersonalizeddemandinthemicro-blogsearchengineisahottopic.thispaperestablishesusermodelandinteg-rateintotheinformationretrievalprocess.Thepaperalsodesignedapersonalizedsearchsystembasedonmicro-blog.Theresearchworkofthispapermain
6、lyincludethefollowingaspects:Thefirstistobuildusermodel.Thispapermainlyaroundtheusermodeldataacquisition,themodelingmethodandrepresentation,modelupdatingmethodsofthe-sefouraspectshascarriedonthekeydiscussionandresearchwork.Inthepersonal-izedtechnology,systemmainlythroughtheanalysisoftheuse
7、roriginalmicro-blogandretweetedmicro-blogtobuilduserinterestmodel,itstatisticsthetheirfrequen-cy,andselectedthetop50wordsastheuserinterestkeywords,andonthisbasistoachievethepersonalizedsearch.Afterthat,thispaperusesLuceneframeworkandsuccessfullyresearchapers-o