基于微博客人物關(guān)系的研究

基于微博客人物關(guān)系的研究

ID:33147621

大?。?.50 MB

頁數(shù):56頁

時間:2019-02-21

基于微博客人物關(guān)系的研究_第1頁
基于微博客人物關(guān)系的研究_第2頁
基于微博客人物關(guān)系的研究_第3頁
基于微博客人物關(guān)系的研究_第4頁
基于微博客人物關(guān)系的研究_第5頁
資源描述:

《基于微博客人物關(guān)系的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、萬方數(shù)據(jù)分類號:TP391單位代碼:11232密級.0◆f京信息斟技太雩工程碩士學(xué)位論文基于微博客人物關(guān)系的研究學(xué)院:工程領(lǐng)域:學(xué)號:作者.0學(xué)校指導(dǎo)教師:企業(yè)指導(dǎo)教師:完成日期:計算機學(xué)院計算機技術(shù)2012020260凌曉濱李淑琴教授白栓虎高級工程師2014年12月31日萬方數(shù)據(jù)學(xué)位論文版權(quán)使用授權(quán)書I刪嬲本人完全了解北京信息科技大學(xué)關(guān)于收集、保存、使用學(xué)位論文的規(guī)定,按照學(xué)校要求提交學(xué)位論文的印刷本和電子版本。學(xué)校有權(quán)保留學(xué)位論文并向中國科學(xué)技術(shù)信息研究所等國家主管部門或其指定機構(gòu)送交論文的電子版和紙質(zhì)版,允許論文被

2、查閱和借閱,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。學(xué)校有權(quán)適當(dāng)復(fù)制、公布論文的全部或部分內(nèi)容。學(xué)校有權(quán)將本人的學(xué)位論文加入《中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫》和編入《中國知識資源總庫》。學(xué)位論文作者簽名:凌唬謬7x>IS年弓月/≯日口公開口保密(——年——月)(保密的學(xué)位論文在解密后應(yīng)遵守此協(xié)議)指導(dǎo)教師簽名:爿≥渤駑jll5年3只,鄉(xiāng)B學(xué)位論文作者簽名:愛%瘴矽f許弓月/≯日萬方數(shù)據(jù)碩士學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文題目為《基于微博客人物關(guān)系的研究》學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下,進行研究工作

3、所取得的成果。盡我所知,除了文中特別加以標(biāo)注的內(nèi)容外,本學(xué)位論文的研究成果不包含任何他人創(chuàng)作的、已公開發(fā)表或者沒有公開發(fā)表的作品的內(nèi)容。對本論文所涉及的研究工作做出貢獻的其他個人和集體,均已在文中以明確方式標(biāo)明并表示了謝意。本學(xué)位論文原創(chuàng)性聲明的法律責(zé)任由本人承擔(dān)。作者簽字:愛%壤≯塍年名月膨曰萬方數(shù)據(jù)摘要摘要在微博客中,用戶與用戶之間會產(chǎn)生各種關(guān)系,諸如通過關(guān)注其他用戶而產(chǎn)生的關(guān)注關(guān)系,通過轉(zhuǎn)發(fā)與@操作而產(chǎn)生的互動關(guān)系以及基于興趣加入社區(qū)而與社區(qū)中的其他用戶產(chǎn)生的共同興趣關(guān)系等。有效的分析和挖掘用戶問的關(guān)系,既可以有效

4、處理輿論信息、引導(dǎo)熱點事件的發(fā)展趨勢,也可以為用戶做出更為合理的推薦,為商家提供合理的建議,降低消費者與商家之間的交易成本。本文基于微博客,對其中人物關(guān)系進行了研究,主要工作如下:1.編寫了基于用戶關(guān)注關(guān)系的爬蟲軟件。從一個中心用戶出發(fā),以滾雪球的方式,爬取中心用戶以及中心用戶關(guān)注對象的注冊信息、關(guān)注信息以及其發(fā)布的微博文本等,經(jīng)過分析處理,存入數(shù)據(jù)庫中,作為后續(xù)研究的基礎(chǔ)數(shù)據(jù)。2.給出了基于親密度的用戶關(guān)系挖掘方法。將現(xiàn)實生活人際關(guān)系中的親密關(guān)系引入微博客平臺,把微博用戶信息中的所在地、教育背景、工作經(jīng)歷等作為基本因素

5、;用戶間的共同關(guān)注與共同好友作為考慮因素;轉(zhuǎn)發(fā)與@操作作為影響因素,通過融合這三種因素,給出了親密度的計算方法。得到用戶之間的親密度大小,親密度值越大表示用戶間關(guān)系越近。3.給出兩種基于用戶關(guān)系的微博用戶推薦方法。一種是基于親密關(guān)系的微博用戶推薦。使用所得的用戶間的親密度,向用戶推薦與其親密度值較大的用戶。另一種是基于用戶興趣相似的微博用戶推薦。通過分析用戶所發(fā)微博文本內(nèi)容,提取其興趣特征,利用余弦公式計算用戶之間的興趣相似度,將興趣相似的用戶進行相互推薦。4.提出一種基于信息生產(chǎn)力的用戶分類方法。從微博用戶的影響力出發(fā)

6、,分析新浪微博用戶數(shù)據(jù),觀察用戶在信息獲取、發(fā)布與交流方面的特征,結(jié)合傳統(tǒng)營銷與微博新環(huán)境,創(chuàng)新地將微博用戶按其發(fā)布微博數(shù)量分為高、中、低三類,并對每一類又進一步進行了影響力分析。目的是探討“作為消費者的受眾”在微博客中的信息生產(chǎn)力問題,為商家提供參考數(shù)據(jù),以便針對不同類型的用戶采取不同的營銷手段。5.針對微博來源和微博的影響力,對爬取的微博數(shù)據(jù)從微博所獲的評論、轉(zhuǎn)發(fā)與贊的數(shù)量等方面進行了初步的統(tǒng)計分析,得出一些有益的結(jié)論。關(guān)鍵詞:微博客;親密關(guān)系;興趣相似度;用戶推薦;微博營銷萬方數(shù)據(jù)ABSTRACTTherearea

7、varietyofrelationshipsbetweenusers,suchastheconcemrelationsarisingfromotherusersbyfocusingattentiononthem,theinteractiverelationshipthrough@andforwardsoperatorwithothersandrelationsbasedoncommoninterestswithothersinthecommunitywhichonejoined.Effectiveanalysisandm

8、iningrelationshipsbetweenusers,whichCannotonlyeffectivelydeal謝t11publicinformationtoguidethedevelopmenttrendofhotevents,butalsoforuserstomakemorereasonablereco

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。