資源描述:
《基于個(gè)性化標(biāo)簽和微博主題的重要用戶(hù)推薦方法研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、分類(lèi)號(hào):?jiǎn)挝淮a:10140密級(jí)4031531904:公開(kāi)學(xué)號(hào):m?i£¥A4LIAONINGUNIVERSITY碩士學(xué)位論文THESISFORMASTERDEGREE基于個(gè)性化標(biāo)簽和微博主題的重要用戶(hù)推薦方法研九論文題目:ResearchonImportantUserRecommendationMethods英文題目:BasedonPersonalizedTagandMicroblogTopic論文作者:安維凱指導(dǎo)教師:徐紅艷副教授計(jì)算機(jī)應(yīng)用技術(shù)專(zhuān)業(yè):二〇—八年五月娜寸間:遼寧大學(xué)學(xué)位
2、論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立完成的。論文中取得的研究成果除加以標(biāo)注的內(nèi)容外,不包含其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果,不包含本人為獲得其他學(xué)位而使用過(guò)的成果。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體均已在文中進(jìn)行了標(biāo)注,并表示謝意。本人完全意識(shí)到本聲明的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:l年r月3〇日名象令i學(xué)位論文版權(quán)使用授權(quán)書(shū)本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國(guó)家有關(guān)部門(mén)或機(jī)構(gòu)送交學(xué)位論文的原件、復(fù)印件和電子版,允許學(xué)位論文被查閱和借閱。本人授權(quán)遼
3、寧大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編學(xué)位論文。同時(shí)授權(quán)中國(guó)學(xué)術(shù)期刊(光盤(pán)版)電子雜志社將本學(xué)位論文收錄到《中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù)》和《中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)》并通過(guò)網(wǎng)絡(luò)向社會(huì)公眾提供信息服務(wù)。學(xué)校須按照授權(quán)對(duì)學(xué)位論文進(jìn)行管理,不得超越授權(quán)對(duì)學(xué)位論文進(jìn)行任意處理。保密(),在年后解密適用本授權(quán)書(shū)。(保密:請(qǐng)?jiān)诶ㄌ?hào)內(nèi)劃“”7)授權(quán)人簽名:指導(dǎo)教師簽名:日期:年S月少日日期:年1月汐日申請(qǐng)遼寧大學(xué)碩士學(xué)位論文基于個(gè)性化標(biāo)簽和微博主題的重要用戶(hù)推薦方法研究R
4、esearchonImportantUserRecommendationMethodsBasedonPersonalizedTagandMicroblogTopic作者:安維凱指導(dǎo)教師:徐紅艷副教授專(zhuān)業(yè):計(jì)算機(jī)應(yīng)用技術(shù)答辯日期:2018年5月22日二○一八年五月·中國(guó)遼寧摘要摘要隨著互聯(lián)網(wǎng)與智能手機(jī)的飛速發(fā)展與普及,社交網(wǎng)絡(luò)平臺(tái)變得熾手可熱,越來(lái)越多的用戶(hù)開(kāi)始依賴(lài)于社交網(wǎng)絡(luò)平臺(tái)進(jìn)行實(shí)時(shí)通訊、獲得相關(guān)熱點(diǎn)信息。其中,社交網(wǎng)絡(luò)平臺(tái)中最受用戶(hù)喜愛(ài)的就是微博。因?yàn)樵谖⒉┲杏脩?hù)既可以發(fā)布信息,又可以傳遞信息。但同時(shí)這將導(dǎo)致網(wǎng)絡(luò)中的信息量快速增長(zhǎng),帶來(lái)信息過(guò)載問(wèn)題。然而,這些過(guò)載的信息中卻蘊(yùn)
5、含著很多有用的信息,為了從這些過(guò)載的信息中挖掘出有用的信息,個(gè)性化推薦算法及技術(shù)應(yīng)運(yùn)而生。對(duì)微博平臺(tái)而言,為用戶(hù)推薦相關(guān)興趣領(lǐng)域的重要用戶(hù),可以有效提高用戶(hù)對(duì)平臺(tái)的依賴(lài)度。微博平臺(tái)中根據(jù)用戶(hù)從剛注冊(cè)到擁有一定規(guī)模朋友圈,用戶(hù)在不同階段時(shí)體現(xiàn)興趣的有效信息也不同,本文分析用戶(hù)在不同階段的有效信息,對(duì)基于個(gè)性化標(biāo)簽和微博主題的重要用戶(hù)推薦方法開(kāi)展研究。該方法包括兩個(gè)部分,主要解決個(gè)性化標(biāo)簽稀疏問(wèn)題和推薦準(zhǔn)確率低問(wèn)題:(1)為了解決個(gè)性化標(biāo)簽稀疏問(wèn)題,本文通過(guò)對(duì)個(gè)性化標(biāo)簽進(jìn)行分詞來(lái)增加標(biāo)簽數(shù)量;為了解決推薦準(zhǔn)確率低問(wèn)題,本文還通過(guò)給出了一種標(biāo)簽權(quán)重設(shè)置方案并結(jié)合用戶(hù)之間的關(guān)系及用戶(hù)重要
6、度;通過(guò)對(duì)以上兩個(gè)問(wèn)題的解決從而提出了一種基于個(gè)性化標(biāo)簽的重要微博用戶(hù)推薦算法。該算法有效地解決了稀疏問(wèn)題和提高推薦準(zhǔn)確率。(2)為了解決推薦準(zhǔn)確率低問(wèn)題,本文提出了一種基于相似主題的重要微博用戶(hù)推薦算法。算法首先對(duì)HITS算法改進(jìn),然后采用改進(jìn)的HITS算法進(jìn)行用戶(hù)類(lèi)別劃分并準(zhǔn)確計(jì)算用戶(hù)權(quán)威度和中心度,最后通過(guò)在主題相似度計(jì)算時(shí)引入權(quán)威度和中心度來(lái)提高用戶(hù)之間的主題相似度,從而有效提高推薦準(zhǔn)確率。為了說(shuō)明所提方法的有效性與準(zhǔn)確率,本文采用對(duì)比實(shí)驗(yàn)進(jìn)行驗(yàn)證。實(shí)驗(yàn)分為兩部分,第一部分是通過(guò)爬蟲(chóng)技術(shù)爬取的微博數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),通過(guò)實(shí)驗(yàn)結(jié)果可以看出本文提出的基于個(gè)性化標(biāo)簽的重要微博
7、用戶(hù)推薦算法能有效解決了個(gè)性化標(biāo)簽稀疏性問(wèn)題,同時(shí)將標(biāo)簽相似度和用戶(hù)重要度進(jìn)行結(jié)合,有效提高推薦準(zhǔn)確率。第二部分也是通過(guò)爬蟲(chóng)技術(shù)對(duì)數(shù)據(jù)集進(jìn)行爬取并在該數(shù)據(jù)集上完成對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明所提的基于相似主題的重要微博用戶(hù)推薦I摘要算法能提高用戶(hù)權(quán)威度和中心度的計(jì)算準(zhǔn)確性和用戶(hù)之間的主題相似度計(jì)算的精度,有效地提高了推薦準(zhǔn)確率。關(guān)鍵詞:個(gè)性化推薦,PageRank,HITS算法,權(quán)威度,中心度IIAbstractABSTRACTWiththerapiddevelopmentandpop