新浪微博用戶行為分析及預測

新浪微博用戶行為分析及預測

ID:35083608

大?。?.30 MB

頁數(shù):60頁

時間:2019-03-17

新浪微博用戶行為分析及預測_第1頁
新浪微博用戶行為分析及預測_第2頁
新浪微博用戶行為分析及預測_第3頁
新浪微博用戶行為分析及預測_第4頁
新浪微博用戶行為分析及預測_第5頁
資源描述:

《新浪微博用戶行為分析及預測》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫

1、'-'."■?'巧-■?i:..:"^...V/,—.A■'、*....,,、..,*、'Ifs^",'JII.;tI^'■知■."^^一;::-rr.::..A‘■.''‘''一、’、:■:...:'--.''..,'....v,.W'巧*二山t,4‘x—v’‘’?.密級:無;分類號;知;護\'I.."-■乂-,:.8*';1011.?>:.單位代碼*UDC.:.,.巧與熱誠'''"識

2、'.'"-'^''■':、?:'/一-;V.:m.:辱:X(是IVSSJ):^:^、、‘.始.'-'.萃..v挪.;.>:;;;寒礙皆:詞耀嘴山西師范大學猿熱‘?'’護'、.J.V:x,糸扣..;繁墓誠研究生碩±學位論文舊麵"''■■"?::人n:''■‘,’":,-■:一、V."J.hv\《巧把.;心'■盡鮮"■V.—,NX-*i.一■.”\、.八乂'--.命'.、Vt'I‘、‘.新浪微博用戶行為分析及預測t奸;再

3、巧占奈苗沁;^:'''.‘..".—..V娘神盤至批飾將'.’或‘>./'..'祭‘獻-如站心一,嫂..Kr,,、,.:<'?■適:-.、^茂..公蜂指導教師結名邢進生教授山西師范大學數(shù)學與計其機科學學院"爭?蕊f宗、一皆,:方V巧騷C/申請學位級別理學碩壬^專業(yè)名稱計算機科學與整圣__.;:.污也L;,-■?If'I.-VJ,I''^r ̄-''::w,,.鳥:、.的;’-巧.,一-V'.U。,論文提交日期20化年3月20日論文答辯日期2016年S月

4、24曰't-'-.?一;^:一:*-'一、‘'.荷'貧'^?知一>戶如'一,.1'J.、、\??-"'.’;;吟堂化聘予單你山西師范大學學位授予日期2016年月日-.、'V*‘.5-于’嚴-,r山''立^.‘‘,,‘:—?。椋榈V‘.^知答豁零員會主席安秋生教授己--心/、...卻社‘:一.'苗去八"、‘評閱人徐欠化教授智敏教授"迸'可:..并一"‘|'.’、.—’;V...;vK;V為。;.,玲:丫謀;;*^膽-V,為巧、:滬

5、…i記?,:、、了瓜.;‘,.巧;-;i歡,;作.:巧'線:^帶^。每^苗.繁貧’’..'.,扣考茄'‘.''>門節(jié)A護V.結:戶;:.礦賊‘,'-;‘/...').-V-.i,——■.V.,L..?*.摘要論文題目:新浪微博用戶行為分析及預測專業(yè):計算機科學與技術碩士生:解軍簽名:__________指導教師:邢進生教授簽名:__________摘要在線社交網(wǎng)絡已成為信息時代人們溝通和交流的一個主要平臺,微博在社交網(wǎng)絡中占有重要的地位,已經(jīng)成為社交網(wǎng)絡中重要的媒體之一。

6、新浪微博作為國內最大微博平臺,對新浪微博用戶在線行為分析及預測,直接的支撐著社會輿論導向,企業(yè)微博營銷活動,因此微博用戶行為的研究為企業(yè)和政府部門的決策提供了重要參考。為此主要完成了以下工作:首先,分析了中文文本特征詞提取的理論和方法,包括切詞問題、主干詞的提取、權值的設置、特征詞的理論和DF、MI、CHI、TFIDF、信息增益方法;研究了文本分類算法模型和不足,包括KNN算法、類中心向量算法、貝葉斯算法、邏輯回歸算法。其次,從微博訓練集整體角度進行了統(tǒng)計分析,得到?jīng)]有用戶行為的微博與具有用戶行為的微博比例因子,具有完整用戶行為的微

7、博數(shù)與具有用戶行為的微博數(shù)比例因子;用戶行為與微博數(shù)量關系符合冪律分布;同一個用戶行為符合“點贊>評價>轉發(fā)”的規(guī)律;用戶轉發(fā)、評價及點贊行為都具有較高的聚類系數(shù)和較小的平均距離,每個用戶的每種用戶行為都存在一個中心點。依據(jù)微博的特點使用模糊集與信息增益算法相結合抽取不同用戶行為的特征詞;根據(jù)每個用戶創(chuàng)建微博的時間進行了聚類分析,得到了每個用戶撰寫微博的時間與微博用戶行為之間的關系。最后,把類中心向量算法與模糊集相結合,形成了新的類中心向量算法;針對傳統(tǒng)的KNN算法K值的不易確定性,使用類別集合代替?zhèn)鹘y(tǒng)的求距離的方法對KNN進行了改

8、進,并與新類中心向量算法相結合,實現(xiàn)了用戶行為的預測?!娟P鍵詞】KNN微博TFIDF信息增益【論文類型】應用研究IAbstractTitle:SinaMicroblogUserBehaviorAnalysisandPrediction

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。