資源描述:
《基于產(chǎn)品評(píng)論的垃圾評(píng)論者檢測(cè)方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、萬(wàn)方數(shù)據(jù)碩士學(xué)位論文基于產(chǎn)品評(píng)論的垃圾評(píng)論者檢測(cè)方法DetectingSpamReviewersBasedonProductReviews學(xué)號(hào):2幽嬰完成日期:星Q!壘!!壘!墨大連理工大學(xué)DalianUniversityofTechnology萬(wàn)方數(shù)據(jù)IIIIIIIllIUlY2728526’_____——大連理工大學(xué)學(xué)位論文獨(dú)創(chuàng)性聲明作者鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下進(jìn)行研究工作所取得的成果。盡我所知,除文中已經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個(gè)人或集體已經(jīng)發(fā)表的研究成果,也不包含其他已申請(qǐng)學(xué)位或其他用途使
2、用過(guò)的成果。與我一同工作的同志對(duì)本研究所做的貢獻(xiàn)均已在論文中做了明確的說(shuō)明并表示了謝意。若有不實(shí)之處,本人愿意承擔(dān)相關(guān)法律責(zé)任。學(xué)位論文題目:基王莊昌遷詮煎絲拯遷詮耋檢測(cè)左洼作者簽名:二翠遜L吼型年上月羔日萬(wàn)方數(shù)據(jù)大連理工大學(xué)碩士學(xué)位論文摘要最近幾年,網(wǎng)上很多的文本信息愈來(lái)愈成為產(chǎn)品,服務(wù)或事件等有價(jià)值的觀點(diǎn)信息源。而且現(xiàn)在已有很多的研究工作者開(kāi)始從事比如產(chǎn)品評(píng)論,論壇熱帖以及微博等觀點(diǎn)信息源的情感分析方面的研究。在研究的早期階段,人們大多將研究重心放在依賴于自然語(yǔ)言處理和數(shù)據(jù)挖掘技術(shù)的觀點(diǎn)抽取及情感分類問(wèn)題上,但是~個(gè)不容忽視的問(wèn)題是垃圾
3、評(píng)論(或虛假評(píng)論、不可信評(píng)論)會(huì)給研究工作造成極大的危害,因此如何在大量的評(píng)論當(dāng)中識(shí)別出那些垃圾評(píng)論及垃圾評(píng)論者是情感分析研究的前提,同時(shí)也是一個(gè)巨大的挑戰(zhàn)。在這個(gè)互聯(lián)網(wǎng)極為發(fā)達(dá)的社會(huì),越來(lái)越多的人們會(huì)選擇從網(wǎng)絡(luò)中獲取所需的信息,且很多人們?cè)敢馔ㄟ^(guò)網(wǎng)絡(luò)分享、交流他們對(duì)于某種事物的看法和所持的態(tài)度。其中最典型的便是網(wǎng)絡(luò)購(gòu)物,而這些電商平臺(tái)上的在線評(píng)論提供了大量有價(jià)值的包括產(chǎn)品和服務(wù)的信息,然而這也給某些產(chǎn)品制造商或經(jīng)銷商帶來(lái)了對(duì)評(píng)論作弊的利益驅(qū)動(dòng),他們會(huì)雇傭那些作弊者撰寫(xiě)垃圾評(píng)論來(lái)誤導(dǎo)消費(fèi)者做出錯(cuò)誤的選擇,從而提高自己的市場(chǎng)份額,增加自己的利
4、潤(rùn)。本文所研究的對(duì)象主要是基于電商平臺(tái)的產(chǎn)品評(píng)論和商店評(píng)論。首先本文對(duì)垃圾評(píng)論(者)檢測(cè)的研究現(xiàn)狀進(jìn)行了總結(jié),詳細(xì)分析了本文所用的數(shù)據(jù)集及相關(guān)算法,并提出了一種創(chuàng)新的垃圾評(píng)論者檢測(cè)多重邊圖模型,模型通過(guò)對(duì)那些針對(duì)同一商品進(jìn)行評(píng)論的評(píng)論者所持的態(tài)度,將這些評(píng)論者之間的關(guān)系抽象為支持邊和反對(duì)邊,然后在迭代計(jì)算過(guò)程中融入評(píng)論者特征。本文提出的算法借鑒了TrustRank的某些思想但是卻又不盡相同。最后通過(guò)實(shí)驗(yàn)對(duì)我們的模型和算法進(jìn)行了驗(yàn)證,評(píng)測(cè)結(jié)果表明,我們的算法能夠用較低的時(shí)間復(fù)雜度,達(dá)到一個(gè)較高的準(zhǔn)確率,這較之前的算法有了較大的提升。綜上所述,
5、我們的算法能夠有效的進(jìn)行垃圾評(píng)論者檢測(cè),尤其是那些參與群體作弊行為比較多的垃圾評(píng)論者,這些評(píng)論者的危害也是最大的。關(guān)鍵詞:情感分析;垃圾評(píng)論者;圖模型萬(wàn)方數(shù)據(jù)基于產(chǎn)品評(píng)論的垃圾評(píng)論者檢測(cè)方法DetectingSpamReviewersBasedonProductReviewsAbstractRecently,EvaluativetextsontheWebhavebecomeavaluablesourceofopinionsonproducts,services,events,individuals,etc.Recently,manyrese
6、archershavestudiedsuchopuuonsourcesasproductreviews,forumposts,andblogs.However,existingresearchhasbeenfocusedonclassificationandsummarizationofopinionsusingnaturallanguageprocessinganddataminingtechniques.AnimportantissuethathasbeenneglectedSOfarisoplmonspamortrustworthin
7、essofonlineopinions.Hence,howtoidentifythosespamreviewsmalargenumberofreviewsandminingsparereviewersiSthepreconditionofsentimentanalysisresearch,andthenabigchallenge.TheWebhasdramaticallychangedthewaythatpeopleexpressthemselvesandinteractwithothers.TheyCannowpostreviewsofp
8、roductsatmerchantsitesandexpresstheirvieWSandinteractwithothersviablogsandforums.Oneexamp