資源描述:
《結合節(jié)點結構與內(nèi)容相似度的復雜網(wǎng)絡社團發(fā)現(xiàn)方法研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、結合節(jié)點結構與內(nèi)容相似度的復雜網(wǎng)絡社團發(fā)現(xiàn)方法研究Researchoncommunitydiscoverymethodbasedonnodestructureandcontentsimilarityincomplexnetworks學科專業(yè):計算機科學與技術作者姓名:羅國華指導教師:金弟副教授天津大學計算機科學與技術學院二零一七年十二月萬方數(shù)據(jù)2萬方數(shù)據(jù)萬方數(shù)據(jù)4萬方數(shù)據(jù)摘要在當前多學科交叉的研究熱點中:復雜網(wǎng)絡的研究受到了越來越廣泛的關注,在計算機科學、物理學、生物學和社會及管理學等領域都產(chǎn)生了重大的
2、意義和深遠的影響。社團發(fā)現(xiàn)是復雜網(wǎng)絡研究中十分重要的研究方向。社團發(fā)現(xiàn)對于加強對復雜網(wǎng)絡的結構理解、功能分析和行為預測具有重要的理論意義及實用價值,已被廣泛應用于恐怖組織識別、推薦預測、搜索引擎開發(fā)和網(wǎng)絡輿情監(jiān)控等諸多領域。如何快速、準確的發(fā)現(xiàn)復雜網(wǎng)絡中的社團(社團發(fā)現(xiàn))仍然是一個關鍵問題。已有社團發(fā)現(xiàn)方法主要是針對網(wǎng)絡拓撲結構,且難于處理大規(guī)模網(wǎng)絡。近年來雖然也有了不僅通過引入文本內(nèi)容提升社團發(fā)現(xiàn)質(zhì)量,且適用于大規(guī)模網(wǎng)絡聚類問題的社團發(fā)現(xiàn)方法。然而這些方法算法維度較高,故難于精確刻畫結點的內(nèi)容表征,且
3、計算量較大。因此,研發(fā)聚類精度高、算法執(zhí)行效率好、并且適用于大規(guī)模復雜網(wǎng)絡的社團發(fā)現(xiàn)方法成為如今的研究熱點。基于此,本文主要的研究對象為復雜網(wǎng)絡中的社團發(fā)現(xiàn)方法,做了兩個方面的工作:1)復雜網(wǎng)絡可以抽象為一個具有復雜連接關系和結構的可演化圖。針對以往比較直觀的圖的社團識別分析及劃分,我們提出可有效處理結點內(nèi)容的高斯混合模型(GMM),更好的融合了復雜網(wǎng)絡上的節(jié)點結構和內(nèi)容信息的相似度,將復雜網(wǎng)絡圖進行采樣構造成一個簡化圖,最后圖聚類。由于該法可采用不同參數(shù)擬合高斯混合模型中的數(shù)據(jù)點,故具有更好的可擴展性
4、。2)由于圖聚類的時間復雜度相對比較高,且高維度的復雜網(wǎng)絡數(shù)據(jù)基本上都可以轉換成矩陣的形式進行處理,因此我們又提出了結合節(jié)點結構和內(nèi)容信息相似度的模塊化的非負矩陣分解(NMF)模型,以匹配擬合原復雜網(wǎng)絡,從而得到最優(yōu)化的節(jié)點的網(wǎng)絡精確表示,最后使用K-means聚類算法進行聚類。該方法簡明且易于操作,同時具有對社團屬性關系的可解釋性,故能更準確地表示節(jié)點與社團之間的關系。本文我們提出的這兩個結合節(jié)點結構與內(nèi)容相似度的社團發(fā)現(xiàn)新方法,在真實網(wǎng)絡上進行實驗驗證,維度計算性能和準確度明顯優(yōu)于已有方法,從而進一
5、步提升了社團發(fā)現(xiàn)的精度和效率。關鍵詞:復雜網(wǎng)絡,社團發(fā)現(xiàn),高斯混合模型,非負矩陣分解,內(nèi)容分析I萬方數(shù)據(jù)萬方數(shù)據(jù)ABSTRACTInthecurrentmultidisciplinaryresearchhotspot:Theresearchofcomplexnetworkshasdrawnmoreandmoreattention,whichhasgreatsignificanceandfar-reachinginfluenceinthefieldsofcomputerscience,physics,bi
6、ology,socialscienceandmanagementscience.Communitydiscoveryisaveryimportantresearchdirectionincomplexnetworkresearch.Tostrengthentheunderstandingofthestructureofcommunitydetectionincomplexnetworks,functionanalysisandbehaviorpredictionhasimportanttheoretic
7、alsignificanceandpracticalvalue,hasbeenwidelyusedintheidentificationofterroristorganization,recommendedprediction,searchengineandnetworkpublicopinionmonitoringandmanyotherfields.Howtoquickly,accuratelyfindthecomplexnetworkcommunity(communitydiscovery)iss
8、tillakeyproblem.Theexistingcommunitydiscoverymethodismainlybasedonthenetworktopology,itisdifficulttodealwithlarge-scalenetwork.Inrecentyears,thoughthereisalsoacommunitydiscoverymethodthatnotonlyimprovesthequalityofcommunit