資源描述:
《基于微博客人物關(guān)系的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、萬(wàn)方數(shù)據(jù)分類號(hào):TP391單位代碼:11232密級(jí).0◆f京信息斟技太雩工程碩士學(xué)位論文基于微博客人物關(guān)系的研究學(xué)院:工程領(lǐng)域:學(xué)號(hào):作者.0學(xué)校指導(dǎo)教師:企業(yè)指導(dǎo)教師:完成日期:計(jì)算機(jī)學(xué)院計(jì)算機(jī)技術(shù)2012020260凌曉濱李淑琴教授白栓虎高級(jí)工程師2014年12月31日萬(wàn)方數(shù)據(jù)學(xué)位論文版權(quán)使用授權(quán)書(shū)I刪嬲本人完全了解北京信息科技大學(xué)關(guān)于收集、保存、使用學(xué)位論文的規(guī)定,按照學(xué)校要求提交學(xué)位論文的印刷本和電子版本。學(xué)校有權(quán)保留學(xué)位論文并向中國(guó)科學(xué)技術(shù)信息研究所等國(guó)家主管部門或其指定機(jī)構(gòu)送交論文的電子版和紙質(zhì)版,允許論文被
2、查閱和借閱,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。學(xué)校有權(quán)適當(dāng)復(fù)制、公布論文的全部或部分內(nèi)容。學(xué)校有權(quán)將本人的學(xué)位論文加入《中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)》和編入《中國(guó)知識(shí)資源總庫(kù)》。學(xué)位論文作者簽名:凌唬謬7x>IS年弓月/≯日口公開(kāi)口保密(——年——月)(保密的學(xué)位論文在解密后應(yīng)遵守此協(xié)議)指導(dǎo)教師簽名:爿≥渤駑jll5年3只,鄉(xiāng)B學(xué)位論文作者簽名:愛(ài)%瘴矽f許弓月/≯日萬(wàn)方數(shù)據(jù)碩士學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文題目為《基于微博客人物關(guān)系的研究》學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下,進(jìn)行研究工作
3、所取得的成果。盡我所知,除了文中特別加以標(biāo)注的內(nèi)容外,本學(xué)位論文的研究成果不包含任何他人創(chuàng)作的、已公開(kāi)發(fā)表或者沒(méi)有公開(kāi)發(fā)表的作品的內(nèi)容。對(duì)本論文所涉及的研究工作做出貢獻(xiàn)的其他個(gè)人和集體,均已在文中以明確方式標(biāo)明并表示了謝意。本學(xué)位論文原創(chuàng)性聲明的法律責(zé)任由本人承擔(dān)。作者簽字:愛(ài)%壤≯塍年名月膨曰萬(wàn)方數(shù)據(jù)摘要摘要在微博客中,用戶與用戶之間會(huì)產(chǎn)生各種關(guān)系,諸如通過(guò)關(guān)注其他用戶而產(chǎn)生的關(guān)注關(guān)系,通過(guò)轉(zhuǎn)發(fā)與@操作而產(chǎn)生的互動(dòng)關(guān)系以及基于興趣加入社區(qū)而與社區(qū)中的其他用戶產(chǎn)生的共同興趣關(guān)系等。有效的分析和挖掘用戶問(wèn)的關(guān)系,既可以有效
4、處理輿論信息、引導(dǎo)熱點(diǎn)事件的發(fā)展趨勢(shì),也可以為用戶做出更為合理的推薦,為商家提供合理的建議,降低消費(fèi)者與商家之間的交易成本。本文基于微博客,對(duì)其中人物關(guān)系進(jìn)行了研究,主要工作如下:1.編寫了基于用戶關(guān)注關(guān)系的爬蟲(chóng)軟件。從一個(gè)中心用戶出發(fā),以滾雪球的方式,爬取中心用戶以及中心用戶關(guān)注對(duì)象的注冊(cè)信息、關(guān)注信息以及其發(fā)布的微博文本等,經(jīng)過(guò)分析處理,存入數(shù)據(jù)庫(kù)中,作為后續(xù)研究的基礎(chǔ)數(shù)據(jù)。2.給出了基于親密度的用戶關(guān)系挖掘方法。將現(xiàn)實(shí)生活人際關(guān)系中的親密關(guān)系引入微博客平臺(tái),把微博用戶信息中的所在地、教育背景、工作經(jīng)歷等作為基本因素
5、;用戶間的共同關(guān)注與共同好友作為考慮因素;轉(zhuǎn)發(fā)與@操作作為影響因素,通過(guò)融合這三種因素,給出了親密度的計(jì)算方法。得到用戶之間的親密度大小,親密度值越大表示用戶間關(guān)系越近。3.給出兩種基于用戶關(guān)系的微博用戶推薦方法。一種是基于親密關(guān)系的微博用戶推薦。使用所得的用戶間的親密度,向用戶推薦與其親密度值較大的用戶。另一種是基于用戶興趣相似的微博用戶推薦。通過(guò)分析用戶所發(fā)微博文本內(nèi)容,提取其興趣特征,利用余弦公式計(jì)算用戶之間的興趣相似度,將興趣相似的用戶進(jìn)行相互推薦。4.提出一種基于信息生產(chǎn)力的用戶分類方法。從微博用戶的影響力出發(fā)
6、,分析新浪微博用戶數(shù)據(jù),觀察用戶在信息獲取、發(fā)布與交流方面的特征,結(jié)合傳統(tǒng)營(yíng)銷與微博新環(huán)境,創(chuàng)新地將微博用戶按其發(fā)布微博數(shù)量分為高、中、低三類,并對(duì)每一類又進(jìn)一步進(jìn)行了影響力分析。目的是探討“作為消費(fèi)者的受眾”在微博客中的信息生產(chǎn)力問(wèn)題,為商家提供參考數(shù)據(jù),以便針對(duì)不同類型的用戶采取不同的營(yíng)銷手段。5.針對(duì)微博來(lái)源和微博的影響力,對(duì)爬取的微博數(shù)據(jù)從微博所獲的評(píng)論、轉(zhuǎn)發(fā)與贊的數(shù)量等方面進(jìn)行了初步的統(tǒng)計(jì)分析,得出一些有益的結(jié)論。關(guān)鍵詞:微博客;親密關(guān)系;興趣相似度;用戶推薦;微博營(yíng)銷萬(wàn)方數(shù)據(jù)ABSTRACTTherearea
7、varietyofrelationshipsbetweenusers,suchastheconcemrelationsarisingfromotherusersbyfocusingattentiononthem,theinteractiverelationshipthrough@andforwardsoperatorwithothersandrelationsbasedoncommoninterestswithothersinthecommunitywhichonejoined.Effectiveanalysisandm
8、iningrelationshipsbetweenusers,whichCannotonlyeffectivelydeal謝t11publicinformationtoguidethedevelopmenttrendofhotevents,butalsoforuserstomakemorereasonablereco