資源描述:
《基于圖聚類的虛假評論人群組檢測算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、'單顚麵:;^ilF分類號IBM編號碩±學(xué)位論文題目i斗廟襲I詞I穩(wěn)巧趁乂譯魏趙別J遂卻I妍究生姓名雜夭為(JZ。//屆斗4無秋奔碟武專業(yè))導(dǎo)師姓名王琢\論文完成日期三。樂4■片萄-\?、少欠V.藻i化妻Shenya打LionUniversitgggy分類號:TP311密級:UDC:004編號:工學(xué)碩士學(xué)位論文基于圖聚類的虛假評論人群組檢測算法研究碩士研究生:宋大為指導(dǎo)教師:王琢副教授學(xué)科、專業(yè):計算機(jī)軟件與理論沈陽理
2、工大學(xué)2016年3月分類號:TP311密級:UDC:004編號:工學(xué)碩士學(xué)位論文基于圖聚類的虛假評論人群組檢測算法研究碩士研究生:宋大為指導(dǎo)教師:王琢副教授學(xué)位級別:工學(xué)碩士學(xué)科、專業(yè):計算機(jī)軟件與理論所在單位:沈陽理工大學(xué)論文提交日期:2015年12月8日論文答辯日期:2016年3月8日學(xué)位授予單位:沈陽理工大學(xué)ClassificationIndex:TP311U.D.C:004AThesisfortheDegreeofM.EngStudyofReviewerSpammerGroupDetecti
3、onBasedonGraphClusteringCandidate:SongDaweiSupervisor:Prof.WangZhuoAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerSoftwareandTheoryDateofSubmission:December8,2015DateofExamination:March8,2016University:ShenyangLigongUniversity沈陽理工大學(xué)碩±
4、學(xué)位論文原創(chuàng)性聲明:,是在導(dǎo)師的指導(dǎo)下本人鄭重聲明本論文的所有工作,由作者本人獨立完成的。有關(guān)觀點、方法、數(shù)據(jù)和文獻(xiàn)的引用己在文中指出,并與參考文獻(xiàn)相對應(yīng),。除文中已注明引用的內(nèi)容外本論文不包含任何其他個人或集體己經(jīng)公開發(fā)表的作品成果。對本文的研究做出重要貢獻(xiàn)的個人和集體,均己在文中[^^明滿方式標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。作者(簽字);某巧日期:2〇年日/3月/<|學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解沈陽理工大學(xué)有關(guān)保留、使用學(xué)
5、位論文的規(guī)定,即;沈陽理工大學(xué)有權(quán)保留并向國家有關(guān)部口或機(jī)構(gòu)送交學(xué)位論文的復(fù)印件和磁盤,允許論文被查閱和借閱。本人授權(quán)沈陽理工大學(xué)可將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可[^采用影印、縮印或其它復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位論文作者簽名:;^\夫^指導(dǎo)教師簽名日期:如日期:與摘要隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)已經(jīng)融入了我們生活中的方方面面。評論系統(tǒng)是以此為背景發(fā)展起來的一個新興產(chǎn)物,其廣泛應(yīng)用于各大社交網(wǎng)站
6、,電子商務(wù)平臺,以及論壇,貼吧等互聯(lián)網(wǎng)應(yīng)用中。尤其在電子商務(wù)領(lǐng)域,由于網(wǎng)絡(luò)的虛擬性以及用戶對所購買的產(chǎn)品無法直觀的去感受等原因,評論系統(tǒng)中其他用戶對于產(chǎn)品的評論是其他顧客在選購產(chǎn)品時重要的參考依據(jù)。很多不良商家出于個人利益的原因,雇傭虛假評論人對其銷售的產(chǎn)品進(jìn)行夸大性的評論,或者雇傭虛假評論人對其競爭對手進(jìn)行詆毀性的評論。虛假評論問題的出現(xiàn),大大推進(jìn)了針對此方面的研究。國內(nèi)外諸多研究人員針對此問題從不同角度,采用不同方法對此問題進(jìn)行了諸多研究。本文針對此問題提出了一個基于圖聚類思想的虛假評論人群組檢
7、測算法。本文認(rèn)為僅從單個評論人的角度來發(fā)現(xiàn)虛假評論人其準(zhǔn)確性以及效率是相當(dāng)?shù)偷?。只要虛假評論人在其評論過程中刻意模仿正常評論人的行為或者進(jìn)行群組的虛假評論,則此類評論人則不易發(fā)現(xiàn)。本文提出的算法善于發(fā)現(xiàn)隱藏較深的虛假評論人和合作傾向的虛假評論人群組。本文針對評論人之間的相似度提出了從屬性和結(jié)構(gòu)兩方面考慮的相似度計算公式,并且認(rèn)為真正的虛假評論人群組應(yīng)該是組內(nèi)聯(lián)系緊密的一個小團(tuán)體,故在虛假評論人群組建立的時候利用雙連通技術(shù)對其組內(nèi)緊密度進(jìn)行了嚴(yán)格的約束。在后續(xù)聚類階段采用模糊圖分割技術(shù),針對圖分割技術(shù)
8、在圖聚類中的諸多問題結(jié)合我們的應(yīng)用場景對其進(jìn)行了解決。在最終的實驗環(huán)節(jié),本文針對虛假評論人群組檢測的特性,提出了若干針對虛假評論人群組的人工評估特征,并利用這些特征對算法中的結(jié)果進(jìn)行了人工的檢驗。同時在相同數(shù)據(jù)集下從本文算法計算出的結(jié)果中抽取500個虛假評論人群組與其他算法計算出的500名虛假評論人群組進(jìn)行準(zhǔn)確率方面的比較,進(jìn)而驗證我們算法在準(zhǔn)確率方面的優(yōu)勢。關(guān)鍵詞:圖聚類;最小割;雙連通;虛假評論人群組檢測AbstractWiththedevelopmentofIn