資源描述:
《基于android平臺(tái)微博系統(tǒng)的研究和應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、湖南大學(xué)碩士學(xué)位論文基于Android平臺(tái)的微博系統(tǒng)研究與應(yīng)用姓名:王承志申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):軟件工程指導(dǎo)教師:李浩鳴;紀(jì)世章20120607基于Android平臺(tái)的微博系統(tǒng)研究與應(yīng)用摘要微博中圈子很重要,在圈子中,大家對(duì)彼此的關(guān)注度強(qiáng)于圈子外,產(chǎn)生的話題相關(guān)性也比圈子外高。圈子的構(gòu)建技術(shù)與個(gè)性化推薦息息相關(guān)。個(gè)性化推薦的友好程度決定了用戶對(duì)微博的直接體驗(yàn)。個(gè)性化推薦中采用得最廣泛的方法是聚類分析。然而傳統(tǒng)的長文本聚類算法未能考慮微博數(shù)據(jù)稀疏性的特點(diǎn),普通的短文本聚類算法又未能結(jié)合微博數(shù)據(jù)自身的特點(diǎn)。針對(duì)微博數(shù)據(jù)的特點(diǎn),本文提出了一種微博向量構(gòu)建方法,該方法考
2、慮微博的話題與文本內(nèi)容,采用向量空間模型,分別從話題和微博文本計(jì)算其相似度。在計(jì)算微博文本相似度時(shí)對(duì)相似度計(jì)算公式進(jìn)行了調(diào)整,當(dāng)詞語位于話題中時(shí)其重要程度大幅提升。最后,對(duì)話題相似度和微博文本相似度進(jìn)行歸一化處理,得到兩條微博的相似度。在相似度計(jì)算的基礎(chǔ)上,本文提出了一種微博聚類算法。該算法基于標(biāo)簽詞匯發(fā)現(xiàn)技術(shù),通過標(biāo)簽詞匯,不斷的將微博數(shù)據(jù)集劃分為不同的簇,使得一個(gè)簇包含標(biāo)簽詞匯,另一個(gè)簇完全不包含標(biāo)簽詞匯。反復(fù)運(yùn)用迭代分割法,得到最終的聚類結(jié)果。本文采用NLPIR微博內(nèi)容語料庫中的部分?jǐn)?shù)據(jù)對(duì)MBCA算法進(jìn)行測(cè)試,以FScore值為評(píng)估標(biāo)準(zhǔn),與開源聚類工具包CL
3、UTO中的其他聚類算法進(jìn)行了對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,MBCA算法的性能優(yōu)于其他短文本聚類算法。在上述工作的基礎(chǔ)上,基于Android平臺(tái),采用MBCA聚類算法設(shè)計(jì)和實(shí)現(xiàn)了一款簡單的微博系統(tǒng)。軟件在基于Android平臺(tái)的各個(gè)版本的模擬器以及ME525等真機(jī)上運(yùn)行狀況良好,推薦列表合適,證明了軟件設(shè)計(jì)良好,同時(shí)也驗(yàn)證了MBCA算法的合理性。關(guān)鍵詞:微博系統(tǒng);個(gè)性化推薦;聚類分析;Android開發(fā)ⅡAbstractMicrobloggingisveryimportantincircles,incircles,weareeachother’sattention,the
4、topicgeneratedthecorrelationisrelatiVelyhigh.Circleoftheconstructiontechnologyandpersonalizedrecommendationarecloselyrelated.Personalizedrecommendationfriendlydeterminesthedirectexperienceoftheusersonthemicroblog西ng.Personalizedrecommendationusingthemostwidelyusedmethodistoclusteranal
5、ysis.However,thetraditionallongtextclusteringalgorithmfailstoconsiderthemicrobloggingdatasparsitycharacteristicsoftheordinaryshort—textclusteringalgorithmhasfailedtocombinethecharacteristicsofthemicrobloggingdata,suchastopic—related.Microbloggingf色atureofthedata,thispaperproposesamlcr
6、oblogglngVectorconstructionmethod,considerthetopicofmicrobloggingandmicrobloggingtextcontent,calculatingtheirsimilaritybasedonVectorspacemodel,respectlVely,tromthetextofthetopicandmicroblogging.Microbloggingtextsimilaritycomputingthesimilaritvformulahasbeenadjusted,whenthemicrobloggin
7、gcontainswordsrelatedtothetopic,thewordsdramatically.Finally,thenormalizedtopicsimilarityandmicrobloggingtextsimilarity,similarityofthetwomicroblogging·Theshortversionofthemicrobloggingf.eatureofthedata,thispaperpresentsamicrobloggingclusteringalgorithm.DiscoVeryalgorithmonthebasisofs
8、imila