資源描述:
《基于微博社會網(wǎng)絡(luò)的用戶興趣模型研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、上海交通大學(xué)專業(yè)學(xué)位碩士論文摘要基于微博社會網(wǎng)絡(luò)的用戶興趣模型研究摘要微博是一個基于用戶關(guān)系的信息分享、傳播以及獲取平臺,是基于web2.0平臺新近興起的開放互聯(lián)網(wǎng)社交服務(wù)。在微博平臺中,用戶通過關(guān)注形成人際關(guān)系網(wǎng),用戶發(fā)布的信息通過轉(zhuǎn)發(fā)等方式以病毒的方式飛速傳播。這使得微博不僅僅是擴大人際圈實現(xiàn)社會交往的社交網(wǎng)絡(luò),更是獲取最新資訊和各方評論信息的重要媒介。近年來國外基于社會網(wǎng)絡(luò)的用戶興趣研究越來越多,利用用戶興趣模型提供的精準(zhǔn)化廣告投放服務(wù)成本低、效果好,逐漸成長為一種主要盈利模式。國內(nèi)目前還沒有十分完善成熟的類似系統(tǒng),因此本文針對微博的社會網(wǎng)
2、絡(luò)特性進行了如下研究:第一,分析了微博社會網(wǎng)絡(luò)的信息結(jié)構(gòu),概括了微博用戶興趣的構(gòu)成,針對傳統(tǒng)微博信息采集方案的不足提出了具有可行性的微博信息采集系統(tǒng)設(shè)計方案,實現(xiàn)的分布式采集系統(tǒng)在實際應(yīng)用中效率和擴展性好于傳統(tǒng)采集方案;第二,構(gòu)建出真實的微博社會網(wǎng)絡(luò)關(guān)系,結(jié)合復(fù)雜網(wǎng)絡(luò)中節(jié)點重要度算法相關(guān)理論,以PageRank算法思想為基礎(chǔ)提出了微博用戶重要度的收斂算法,以用戶重要度反映微博用戶的現(xiàn)實影響力;第三,研究了微博短文本的關(guān)鍵詞提取方案,包括微博中冗余信息的過濾,利用自然語言處理工具分詞,用同義詞詞林計算詞語相似度,根據(jù)詞語間相似度關(guān)系構(gòu)造無向圖,用圖
3、的鄰接矩陣計算詞語重要度,從而提取出微博文本中的關(guān)鍵詞;第四,在用戶重要度和微博關(guān)鍵詞的基礎(chǔ)上,提出了基于TF-IDFI萬方數(shù)據(jù)上海交通大學(xué)專業(yè)學(xué)位碩士論文摘要改進的微博用戶興趣特征項提取算法,利用向量空間模型建立微博用戶的興趣空間,通過長期興趣與短期興趣定義用戶的興趣度,完成用戶興趣建模,并通過實驗證明了該模型與人工標(biāo)注的結(jié)果相吻合且具有良好的準(zhǔn)確性。關(guān)鍵詞:微博,復(fù)雜網(wǎng)絡(luò),節(jié)點重要度,用戶興趣模型II萬方數(shù)據(jù)上海交通大學(xué)專業(yè)學(xué)位碩士論文ABSTRACTRESEARCHONUSERINTERESTMODELINGBASEDONMICROBLOG
4、SOCIALNETWORKABSTRACTMicro-Blogisaninformation-sharing,disseminatingandaccessingplatformbasedonuserrelationship.It’sanewlyraisedopenInternetsocialservicewhichismostlyknownasweb2.0.InaMicro-Blogsystem,relationshipnetworkisformedbyfolloworfollowedbyeachother.Theinformationuserp
5、ublishedbroadcastinanamazingspeedthroughthefunctioncalledforward.InthissituationMicro-Bloghasbecomenotonlyasocialnetworkbutalsoanimportantmediawhichprovidelargeamountoffreshnewsandcomments.RecentlymoreandmoreforeigncompaniesstarttoresearchonuserinterestinMicro-Blogbecauseofth
6、ecommercialpotentialbehindthemarket.Thereisnosuchsystemresearchindomesticcurrently,sothispaperproposesthefollowingmethodsandideasforuserinterestmodeling:Firstly,gothroughtheinformationstructureofMicro-Blogsocialnetwork,summarizesthecompositionofuserinterest.DesignaMicro-Blogi
7、nformationcollectionsystemwhichismoreefficientthantraditionalcollectionprogram.Thedistributedcollectionsystemperformsmoreefficiencyandscalabilityinpracticalapplicationsthanthetraditionalprograms;Secondly,buildarealMicro-Blogsocialnetwork.Anewalgorithmisproposedbasedonthedegre
8、eofconvergencealgorithmMicro-Bloguser-importantdegreecombinedwithcom