資源描述:
《社交網(wǎng)絡(luò)中智慧搜索的研究綜述》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、社交網(wǎng)絡(luò)中智慧搜索的研究綜述在線社交X絡(luò)數(shù)據(jù)具有豐富價值,并蘊含著大量智慧,下面是小編搜集的一篇探究社交X絡(luò)中智慧搜索應(yīng)用的論文范文,供大家閱讀借鑒?! ?、引言 在線社交X絡(luò)是一種在信息X絡(luò)上由社會個體集合及個體之間的連接關(guān)系構(gòu)成的社會性結(jié)構(gòu)?! ≡诰€社交X絡(luò)可分為4類:1)即時消息類應(yīng)用,是一種提供在線實時通信的平臺,如、等;2)在線社交類應(yīng)用,是一種提供在線社交關(guān)系的平臺,如臉譜X、人人X等;3)微博類應(yīng)用,是一種提供雙向發(fā)布短信息的平臺,如Tmultiplechannels),綜合、關(guān)聯(lián)多通道、多(不同社
2、交X絡(luò))的社交X絡(luò)數(shù)據(jù)和信息,進行統(tǒng)一的知識發(fā)掘和推演;3)安全可信(securityprivacyandtrust),在線社交X絡(luò)搜索結(jié)果的安全可信的,并且支持隱私保護;4)智慧解答(intelligentsolution),搜索的結(jié)果是基于在線社交X絡(luò)數(shù)據(jù)和信息,經(jīng)過發(fā)掘、推理和計算而得到的一組有序智慧解答?! ?、相關(guān)工作 在線社交X絡(luò)智慧搜索涉及的相關(guān)理論和技術(shù)包括:搜索引擎技術(shù)、在線社交X絡(luò)分析、復(fù)雜對象關(guān)系建模、意圖理解與匹配及知識構(gòu)建與推演等。 當前的搜索引擎技術(shù)主要包括互聯(lián)X搜索引擎和在線社交X
3、絡(luò)搜索。主要的互聯(lián)X搜索引擎包括全文搜索、元搜索引擎和垂直搜索引擎等。在互聯(lián)X搜索引擎中,為優(yōu)化搜索結(jié)果,通常采用倒排索引技術(shù)對X頁信息進行索引,并采用排序算法對搜索結(jié)果進行等級排名,典型的算法包括PageRank[1]和HITS[2]等;為提高搜索結(jié)果的關(guān)聯(lián)性,Google、百度、搜狗等引入知識圖譜技術(shù);為實現(xiàn)搜索信息的高效存儲管理,各互聯(lián)X廠商紛紛提出了解決方案,如Google的Bigtable[3],Amazon的Dynamo[4]、Yahoo的PNUTS[5]等。在在線社交X絡(luò)搜索方面,360推出的我的搜索
4、,引入微博、等社交因素的影響,并在搜索結(jié)果中進行展示。臉譜X推出的社會搜索引擎GraphSearch,用戶可在社交X絡(luò)中對好友、照片、地點等進行搜索。微軟推出的人立方關(guān)系搜索,自動地計算每一個人名與關(guān)鍵詞的距離,并可展示人的社會化關(guān)系?! ≡诰€社交X絡(luò)分析為社交X絡(luò)中知識的獲取和推演提供了相應(yīng)的方法。主要的社交X絡(luò)分析包括話題發(fā)現(xiàn)與演化、虛擬社區(qū)發(fā)現(xiàn)與演化、信息傳播以及影響力分析等。話題發(fā)現(xiàn)與演化能有效支撐X絡(luò)時代的信息決策。代表性工作包括:Blei[6] 提出的隱含狄利克雷分布的LDA模型、Lin等[7]提出的
5、潛在擴散路徑方法、美國馬里蘭大學研究的詞項間共現(xiàn)頻率反映語義關(guān)聯(lián)原理的方法[8].虛擬社區(qū)發(fā)現(xiàn)與演化有助于發(fā)現(xiàn)社交X絡(luò)中的拓撲結(jié)構(gòu)信息。代表性工作包括:Nean等[9]提出的模塊性方法、Chakrabarti等[10]提出的社區(qū)演化模型、Mucha等[11]提出的多層X絡(luò)社區(qū)發(fā)現(xiàn)、Tang等[12]研究的多模態(tài)X絡(luò)社區(qū)發(fā)現(xiàn)等。社交信息傳播機制有助于對社會X絡(luò)的認識。代表性工作包括:Gruhl等[13]基于SIRS傳染病模型、Han等提出的高斯條件隨機場模型、Antulov-Fantulin等[14]提出的統(tǒng)計推理框
6、架溯源方法。影響力分析能發(fā)現(xiàn)社交X絡(luò)中高影響力用戶和影響強度。代表性工作包括:Ellison等[15]研究了在線社交關(guān)系對現(xiàn)實社交關(guān)系的群體互動影響;ultiGraph模型[21]等。PropertyGraph在節(jié)點和邊上可以存在任意數(shù)量的鍵值對表示屬性或標簽,因而其表達能力很強。RDF用三元組SPO(subject,property,object)來描述實體之間的關(guān)系,是當前表示實體以及其關(guān)系的一種常見模式。 MultiGraph模型可在2個實體之間保留多條邊以表示多種關(guān)系。近來年,許多研究將時空信息融入到復(fù)雜
7、對象關(guān)系的建模中。微軟亞洲研究院分別從用戶、地理位置和事件3個層面對基于位置的地理社交X絡(luò)進行了研究,發(fā)現(xiàn)單純社會X絡(luò)中個體之間無法表現(xiàn)的關(guān)系[22].Shekhar[23]將時空因素考慮到在線社交X絡(luò)數(shù)據(jù)分析中,提出一種時間聚集的圖模型?! ∮脩粢鈭D理解與匹配是搜索中的關(guān)鍵技術(shù)。在用戶意圖理解方面,adhu等[24]利用語義X工具和技術(shù)提供分層模塊的方法解決搜索引擎對語義內(nèi)容的理解。在意圖匹配方面,主要包括文本模型和圖模型。基于文本模型的意圖匹配通過將以關(guān)鍵詞查詢檢索的方式來把用戶的意圖進行語義轉(zhuǎn)換和目標文檔的匹
8、配,并獲取相關(guān)度排序?;趫D模型的意圖匹配通過圖搜索來實現(xiàn)搜索意圖與搜索空間中目標項的查找和匹配,主要包括[25]:關(guān)鍵詞圖搜索技術(shù)、子圖匹配技術(shù)和近似圖匹配技術(shù)等?! ≈R是實現(xiàn)智慧搜索的關(guān)鍵。當前,知識構(gòu)建較多地從知識圖譜構(gòu)建角度加以展開,以互聯(lián)XX頁為的典型知識圖譜包括Knoulti-graph)等模型方法,通過模型的組合以及擴展等方法,并通過整合現(xiàn)有