資源描述:
《微博數(shù)據(jù)挖掘研究綜述》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、微博數(shù)據(jù)挖掘研究綜述丁兆云賈焰周斌國(guó)防科學(xué)技術(shù)大學(xué)信息系統(tǒng)與管理學(xué)院國(guó)防科學(xué)技術(shù)大學(xué)信息系統(tǒng)工程重點(diǎn)實(shí)驗(yàn)室國(guó)防科學(xué)技術(shù)大學(xué)摘要:隨著近兒年微博的快速發(fā)展與普及,微博憑借平臺(tái)的開(kāi)放性、終端擴(kuò)展性、內(nèi)容簡(jiǎn)潔性和低門(mén)檻等特性,在網(wǎng)民中快速滲透,己發(fā)展成一個(gè)重要的社會(huì)化媒體,微博成為網(wǎng)民獲取新聞時(shí)事、人際交往、自我表達(dá)、社會(huì)分享以及社會(huì)參與的重要媒介以及社會(huì)公共輿論的重要平臺(tái),對(duì)國(guó)家安全和社會(huì)發(fā)展產(chǎn)生了深遠(yuǎn)的影響.微博是人類在虛擬網(wǎng)絡(luò)世界生活的抽象概括和延伸,與一般信息網(wǎng)絡(luò)不同,微博本身具有大規(guī)模、噪音數(shù)
2、據(jù)多樣性、快速傳播演化性、非線性、社會(huì)媒體性以及多關(guān)系等特征,因此其在分析方法和挖掘目標(biāo)上都與傳統(tǒng)信息系統(tǒng)具有很大差別,在相關(guān)技術(shù)的研究上也帶來(lái)了更大的挑戰(zhàn)?針對(duì)微博的新特性,研究了微博近幾年的相關(guān)研究現(xiàn)狀,同時(shí)分析了Twitter數(shù)據(jù)集特征,且總結(jié)了未來(lái)研究面臨的挑戰(zhàn).關(guān)鍵詞:微博;數(shù)據(jù)挖掘;文本挖掘;社會(huì)網(wǎng)絡(luò);社會(huì)媒體;作者簡(jiǎn)介:丁兆云zyding@nudt.edu.on作者簡(jiǎn)介:JiaYan,borninI960.ProfessorandPhDsupervisor.Ilermainresea
3、rchinterestsincludedataminingandinformationsecurity(jiayan@nudt.edu.cn).作者簡(jiǎn)介:ZhouBin,bornin1971.Professor.Hismainresearchinterestsineludetextminingandinformeitionsecurity(binzhou@nudt?edu.cn).收稿日期:2013-01-21基金:國(guó)家“九七三”重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃基金項(xiàng)目(2013CB329601,2013CB
4、329602)SurveyofDataMiningforMicroblogsDingZhaoyunJiaYauZhouBinCollegeofInformstionSystemsandManagement,NationalUniversityofDefenseTechnology;SchoolofComputer,NationalUniversityofDefenseTechnology;Abstract:Thepastfewyearstherapiddevelopmentandpopulariz
5、ationofmicroblogshavealreadybeenwitnessed.Duetotheiropermess,terminalexpansion,contentsimplicity,lowthresholdandsoon,microblogsdeeplyaffectourdailylifebyprovidinganimportantplatformforpeopletopublishcomments,transforminformationandacquireknowledge,ton
6、amejustafew.Thoughbearingsuchadvantages,microblogsmaycauseseriousimpactsonthenationalsecurityandsocialdevelopmentiftheyareoutofcontrol.Therefore,theresearchonmicroblogsisquitevaluablefromboththeoreticalandpracticalperspective,especiallyinthisageoftheI
7、nternet.Analyzingandminingmicroblogsalsobringsgreatchallenges.Ascanbeseen,microblogscanbetreatedasagenoralizationandextensionofhumanlifeinthevirtualnetworkworld.However,differentfromtraditionalinformationnetworks,microblogshavetheiruniquecharacteristi
8、cs,includingnoisydatadiversity,socialmedia,multirelations,therapidspreadandevolutionary,nonlinearity,largescalabi1ityandetc.Suchdifferencesbringforthgreatchallengesinanalyzingandminingthemicroblogs.Inthispaper,wesurveythedataminingformicroblog