基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用

基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用

ID:33682659

大小:4.16 MB

頁數(shù):56頁

時(shí)間:2019-02-28

基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用_第1頁
基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用_第2頁
基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用_第3頁
基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用_第4頁
基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用_第5頁
資源描述:

《基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、湖南大學(xué)碩士學(xué)位論文基于Android平臺(tái)的微博系統(tǒng)研究與應(yīng)用姓名:王承志申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):軟件工程指導(dǎo)教師:李浩鳴;紀(jì)世章20120607基于Android平臺(tái)的微博系統(tǒng)研究與應(yīng)用摘要微博中圈子很重要,在圈子中,大家對(duì)彼此的關(guān)注度強(qiáng)于圈子外,產(chǎn)生的話題相關(guān)性也比圈子外高。圈子的構(gòu)建技術(shù)與個(gè)性化推薦息息相關(guān)。個(gè)性化推薦的友好程度決定了用戶對(duì)微博的直接體驗(yàn)。個(gè)性化推薦中采用得最廣泛的方法是聚類分析。然而傳統(tǒng)的長文本聚類算法未能考慮微博數(shù)據(jù)稀疏性的特點(diǎn),普通的短文本聚類算法又未能結(jié)合微博數(shù)據(jù)自身的特點(diǎn)。針對(duì)微博數(shù)據(jù)的特點(diǎn),本文提出了一種微博向量構(gòu)建方法,該方法考

2、慮微博的話題與文本內(nèi)容,采用向量空間模型,分別從話題和微博文本計(jì)算其相似度。在計(jì)算微博文本相似度時(shí)對(duì)相似度計(jì)算公式進(jìn)行了調(diào)整,當(dāng)詞語位于話題中時(shí)其重要程度大幅提升。最后,對(duì)話題相似度和微博文本相似度進(jìn)行歸一化處理,得到兩條微博的相似度。在相似度計(jì)算的基礎(chǔ)上,本文提出了一種微博聚類算法。該算法基于標(biāo)簽詞匯發(fā)現(xiàn)技術(shù),通過標(biāo)簽詞匯,不斷的將微博數(shù)據(jù)集劃分為不同的簇,使得一個(gè)簇包含標(biāo)簽詞匯,另一個(gè)簇完全不包含標(biāo)簽詞匯。反復(fù)運(yùn)用迭代分割法,得到最終的聚類結(jié)果。本文采用NLPIR微博內(nèi)容語料庫中的部分?jǐn)?shù)據(jù)對(duì)MBCA算法進(jìn)行測(cè)試,以FScore值為評(píng)估標(biāo)準(zhǔn),與開源聚類工具包CL

3、UTO中的其他聚類算法進(jìn)行了對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,MBCA算法的性能優(yōu)于其他短文本聚類算法。在上述工作的基礎(chǔ)上,基于Android平臺(tái),采用MBCA聚類算法設(shè)計(jì)和實(shí)現(xiàn)了一款簡單的微博系統(tǒng)。軟件在基于Android平臺(tái)的各個(gè)版本的模擬器以及ME525等真機(jī)上運(yùn)行狀況良好,推薦列表合適,證明了軟件設(shè)計(jì)良好,同時(shí)也驗(yàn)證了MBCA算法的合理性。關(guān)鍵詞:微博系統(tǒng);個(gè)性化推薦;聚類分析;Android開發(fā)ⅡAbstractMicrobloggingisveryimportantincircles,incircles,weareeachother’sattention,the

4、topicgeneratedthecorrelationisrelatiVelyhigh.Circleoftheconstructiontechnologyandpersonalizedrecommendationarecloselyrelated.Personalizedrecommendationfriendlydeterminesthedirectexperienceoftheusersonthemicroblog西ng.Personalizedrecommendationusingthemostwidelyusedmethodistoclusteranal

5、ysis.However,thetraditionallongtextclusteringalgorithmfailstoconsiderthemicrobloggingdatasparsitycharacteristicsoftheordinaryshort—textclusteringalgorithmhasfailedtocombinethecharacteristicsofthemicrobloggingdata,suchastopic—related.Microbloggingf色atureofthedata,thispaperproposesamlcr

6、oblogglngVectorconstructionmethod,considerthetopicofmicrobloggingandmicrobloggingtextcontent,calculatingtheirsimilaritybasedonVectorspacemodel,respectlVely,tromthetextofthetopicandmicroblogging.Microbloggingtextsimilaritycomputingthesimilaritvformulahasbeenadjusted,whenthemicrobloggin

7、gcontainswordsrelatedtothetopic,thewordsdramatically.Finally,thenormalizedtopicsimilarityandmicrobloggingtextsimilarity,similarityofthetwomicroblogging·Theshortversionofthemicrobloggingf.eatureofthedata,thispaperpresentsamicrobloggingclusteringalgorithm.DiscoVeryalgorithmonthebasisofs

8、imila

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。