資源描述:
《基于DBN模型的電子商務(wù)虛假評論識別》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、133610378分類號:F7.學校代碼:密級:j傲射鉉表f?ANHUIUNIVERSITYOFFINANCE&ECONOMICS碩士學位論文基于DBN模型的電子商務(wù)虛假評論識別作者姓名:唐義杰學號:3201603351學位類別:專業(yè)碩士學科專業(yè):應(yīng)用統(tǒng)計-研究方向:經(jīng)濟統(tǒng)計導師姓名及職稱:李超副教授二?—八年六月Schoolcode:10378Security:Classification:F713.36Theidentificationofelectroniccommercefalsecomment
2、sbasedonDBNmodelStudentID:3201603351Name:TangYijieDegreecategory:ProfessionalMasterTheprofessionalname:AppliedStatisticsResearchdirection:MacroeconomicStatisticsTutor’sname:LiChaoJune,2018學位論文獨創(chuàng)性聲明本人鄭重聲明:本人所呈交的學位論文,是在導師的指導下,獨立進行研究所取得的成果。除文中己經(jīng)注明引用的內(nèi)容外,本論文不含任何其他個人或集體己經(jīng)發(fā)表或撰寫的作品,也不包含為獲得安徽財經(jīng)大學
3、或其他教育機構(gòu)的學位或證書所使用過的材料。對本文的研宂做出重要貢獻的個人和集體,均己在文中標明并表示了謝意。本聲明的法律后果由本人承擔。論文作者(簽名):月’曰U束I7f學位論文使用授權(quán)書本論文作者完全了解學校關(guān)于保存、使用學位論文的管理辦法及規(guī)定,即學校有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權(quán)安徽財經(jīng)大學可以將本學位論文的全部或部分內(nèi)容編入學校有關(guān)數(shù)據(jù)庫和授權(quán)學校研究生處與中國知網(wǎng)和萬方數(shù)據(jù)簽訂收錄協(xié)議及收錄并由作者本人享有、承擔相應(yīng)。的權(quán)利和義務(wù),也可以采用影印、縮印或掃描等復制手段保存或匯
4、編本學位論文注:保密學位論文,在解密后適用于本授權(quán)書。作者簽名年月曰/純<|基于DBN模型的電子商務(wù)虛假評論識別摘要近年來隨著我國電子商務(wù)產(chǎn)業(yè)的快速發(fā)展,人們對于網(wǎng)上購物的依賴程度也越來越大。年輕消費者對于消費的習慣和認識早已不再是單純的線下購物,現(xiàn)如今線上購物已經(jīng)成為大多數(shù)年輕人購物的首選方式,他們享受著這種便捷的購物體驗。然而,我國現(xiàn)階段電子商務(wù)市場發(fā)展仍存在一些嚴重的問題,如由于電子商務(wù)市場本身的特點導致其進入門檻低,大量商鋪良莠不齊;店家與消費者信息不對稱導致的交易爭端亦屢有發(fā)生;交易過程的時間空間相隔絕導致信息獲取不全面;物流和商流隔絕導致整個交易涉及多個行業(yè)利于舞
5、弊等。當前,與我國電子商務(wù)蓬勃發(fā)展相對應(yīng)的是與之相匹配的網(wǎng)絡(luò)交易誠信體制并未完全建立和完善。這就導致了一些不法商家利用電子商務(wù)市場的這一特點大量刷單,從而提高自己的店鋪信用分和自己商品的銷售量的行為發(fā)生。這些虛假信息嚴重影響了人們的購買決策,給社會和市場帶來的是極其惡劣的影響。虛假交易特別是虛假好評的識別有利于消費者個人提高自我識別能力,節(jié)約成本;有利于維護和規(guī)范化電子商務(wù)行業(yè)健康發(fā)展。本文在對國內(nèi)外一系列網(wǎng)絡(luò)交易虛假評論識別研究成果的整理和梳理的基礎(chǔ)上,分析了商家刷單從產(chǎn)生到具體實施的整個過程和交易特點。并依據(jù)這些特點,首先利用分布式爬蟲技術(shù)獲取的大量產(chǎn)品評論,并就手中預先掌握的部
6、分刷客信息作對比;其次從大量商品評論中挖掘出刷單數(shù)據(jù)并對數(shù)據(jù)集進行了標注;然后以產(chǎn)品評論的特征集作為切入點,使用了基于深度學習的深度置信網(wǎng)絡(luò)算法分析和識別電商交易結(jié)果即商品評論的可信程度;最后通過驗證模型的準確性并對比其他淺層機器學習算法,發(fā)現(xiàn)深度置信網(wǎng)絡(luò)對于評論數(shù)據(jù)的識別準確率顯著高于其他淺層機器學習算法,并根據(jù)模型識別的結(jié)果分析了正常消費者的評論特征。本文的主要貢獻在于:(1)以商品評論數(shù)據(jù)為突破口,挖掘消費者商品評論的語言特征。以評論數(shù)據(jù)作為突破口,可以有效刻畫消費者評論數(shù)據(jù)的語言特點,并期望從中發(fā)現(xiàn)正常消費者在評論商品時的語言特征。(2)基于深度置信網(wǎng)絡(luò)算法,能夠有效識別電子
7、商務(wù)虛假評論。以往研究多使用計算機模擬虛假評論的發(fā)生,本文使用了基于python的爬蟲技術(shù)獲取海量真實用戶評論數(shù)據(jù),并運用深度置信網(wǎng)絡(luò)算法識別刷單評論。關(guān)鍵詞:虛假評論;爬蟲技術(shù);情感分析;深度置信網(wǎng)絡(luò)1基于DBN模型的電子商務(wù)虛假評論識別ABSTRACTInrecentyears,withtherapiddevelopmentofChina'se-commerceindustry,people'sdependenceononlineshoppingisa