基于DBN模型的電子商務(wù)虛假評論識別

基于DBN模型的電子商務(wù)虛假評論識別

ID:17854246

大小:2.70 MB

頁數(shù):87頁

時間:2018-09-07

基于DBN模型的電子商務(wù)虛假評論識別_第1頁
基于DBN模型的電子商務(wù)虛假評論識別_第2頁
基于DBN模型的電子商務(wù)虛假評論識別_第3頁
基于DBN模型的電子商務(wù)虛假評論識別_第4頁
基于DBN模型的電子商務(wù)虛假評論識別_第5頁
資源描述:

《基于DBN模型的電子商務(wù)虛假評論識別》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、133610378分類號:F7.學(xué)校代碼:密級:j傲射鉉表f?ANHUIUNIVERSITYOFFINANCE&ECONOMICS碩士學(xué)位論文基于DBN模型的電子商務(wù)虛假評論識別作者姓名:唐義杰學(xué)號:3201603351學(xué)位類別:專業(yè)碩士學(xué)科專業(yè):應(yīng)用統(tǒng)計-研究方向:經(jīng)濟(jì)統(tǒng)計導(dǎo)師姓名及職稱:李超副教授二?—八年六月Schoolcode:10378Security:Classification:F713.36Theidentificationofelectroniccommercefalsecommentsb

2、asedonDBNmodelStudentID:3201603351Name:TangYijieDegreecategory:ProfessionalMasterTheprofessionalname:AppliedStatisticsResearchdirection:MacroeconomicStatisticsTutor’sname:LiChaoJune,2018學(xué)位論文獨(dú)創(chuàng)性聲明本人鄭重聲明:本人所呈交的學(xué)位論文,是在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究所取得的成果。除文中己經(jīng)注明引用的內(nèi)容外,本論文不含任何其他個人或集體己經(jīng)發(fā)表或撰寫的作品,也不包含為獲得安徽財經(jīng)大學(xué)或其他教

3、育機(jī)構(gòu)的學(xué)位或證書所使用過的材料。對本文的研宂做出重要貢獻(xiàn)的個人和集體,均己在文中標(biāo)明并表示了謝意。本聲明的法律后果由本人承擔(dān)。論文作者(簽名):月’曰U束I7f學(xué)位論文使用授權(quán)書本論文作者完全了解學(xué)校關(guān)于保存、使用學(xué)位論文的管理辦法及規(guī)定,即學(xué)校有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)安徽財經(jīng)大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入學(xué)校有關(guān)數(shù)據(jù)庫和授權(quán)學(xué)校研究生處與中國知網(wǎng)和萬方數(shù)據(jù)簽訂收錄協(xié)議及收錄并由作者本人享有、承擔(dān)相應(yīng)。的權(quán)利和義務(wù),也可以采用影印、縮印或掃描等復(fù)制手段保存或匯編本學(xué)位論文

4、注:保密學(xué)位論文,在解密后適用于本授權(quán)書。作者簽名年月曰/純<|基于DBN模型的電子商務(wù)虛假評論識別摘要近年來隨著我國電子商務(wù)產(chǎn)業(yè)的快速發(fā)展,人們對于網(wǎng)上購物的依賴程度也越來越大。年輕消費(fèi)者對于消費(fèi)的習(xí)慣和認(rèn)識早已不再是單純的線下購物,現(xiàn)如今線上購物已經(jīng)成為大多數(shù)年輕人購物的首選方式,他們享受著這種便捷的購物體驗。然而,我國現(xiàn)階段電子商務(wù)市場發(fā)展仍存在一些嚴(yán)重的問題,如由于電子商務(wù)市場本身的特點(diǎn)導(dǎo)致其進(jìn)入門檻低,大量商鋪良莠不齊;店家與消費(fèi)者信息不對稱導(dǎo)致的交易爭端亦屢有發(fā)生;交易過程的時間空間相隔絕導(dǎo)致信息獲取不全面;物流和商流隔絕導(dǎo)致整個交易涉及多個行業(yè)利于舞弊等。當(dāng)前,與我

5、國電子商務(wù)蓬勃發(fā)展相對應(yīng)的是與之相匹配的網(wǎng)絡(luò)交易誠信體制并未完全建立和完善。這就導(dǎo)致了一些不法商家利用電子商務(wù)市場的這一特點(diǎn)大量刷單,從而提高自己的店鋪信用分和自己商品的銷售量的行為發(fā)生。這些虛假信息嚴(yán)重影響了人們的購買決策,給社會和市場帶來的是極其惡劣的影響。虛假交易特別是虛假好評的識別有利于消費(fèi)者個人提高自我識別能力,節(jié)約成本;有利于維護(hù)和規(guī)范化電子商務(wù)行業(yè)健康發(fā)展。本文在對國內(nèi)外一系列網(wǎng)絡(luò)交易虛假評論識別研究成果的整理和梳理的基礎(chǔ)上,分析了商家刷單從產(chǎn)生到具體實施的整個過程和交易特點(diǎn)。并依據(jù)這些特點(diǎn),首先利用分布式爬蟲技術(shù)獲取的大量產(chǎn)品評論,并就手中預(yù)先掌握的部分刷客信息作對比;其

6、次從大量商品評論中挖掘出刷單數(shù)據(jù)并對數(shù)據(jù)集進(jìn)行了標(biāo)注;然后以產(chǎn)品評論的特征集作為切入點(diǎn),使用了基于深度學(xué)習(xí)的深度置信網(wǎng)絡(luò)算法分析和識別電商交易結(jié)果即商品評論的可信程度;最后通過驗證模型的準(zhǔn)確性并對比其他淺層機(jī)器學(xué)習(xí)算法,發(fā)現(xiàn)深度置信網(wǎng)絡(luò)對于評論數(shù)據(jù)的識別準(zhǔn)確率顯著高于其他淺層機(jī)器學(xué)習(xí)算法,并根據(jù)模型識別的結(jié)果分析了正常消費(fèi)者的評論特征。本文的主要貢獻(xiàn)在于:(1)以商品評論數(shù)據(jù)為突破口,挖掘消費(fèi)者商品評論的語言特征。以評論數(shù)據(jù)作為突破口,可以有效刻畫消費(fèi)者評論數(shù)據(jù)的語言特點(diǎn),并期望從中發(fā)現(xiàn)正常消費(fèi)者在評論商品時的語言特征。(2)基于深度置信網(wǎng)絡(luò)算法,能夠有效識別電子商務(wù)虛假評論。以往研究多

7、使用計算機(jī)模擬虛假評論的發(fā)生,本文使用了基于python的爬蟲技術(shù)獲取海量真實用戶評論數(shù)據(jù),并運(yùn)用深度置信網(wǎng)絡(luò)算法識別刷單評論。關(guān)鍵詞:虛假評論;爬蟲技術(shù);情感分析;深度置信網(wǎng)絡(luò)1基于DBN模型的電子商務(wù)虛假評論識別ABSTRACTInrecentyears,withtherapiddevelopmentofChina'se-commerceindustry,people'sdependenceononlineshoppingisa

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。