網(wǎng)絡(luò)民航事件虛假評論的識別研究

網(wǎng)絡(luò)民航事件虛假評論的識別研究

ID:28195397

大?。?8.00 KB

頁數(shù):5頁

時間:2018-12-08

網(wǎng)絡(luò)民航事件虛假評論的識別研究_第1頁
網(wǎng)絡(luò)民航事件虛假評論的識別研究_第2頁
網(wǎng)絡(luò)民航事件虛假評論的識別研究_第3頁
網(wǎng)絡(luò)民航事件虛假評論的識別研究_第4頁
網(wǎng)絡(luò)民航事件虛假評論的識別研究_第5頁
資源描述:

《網(wǎng)絡(luò)民航事件虛假評論的識別研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫。

1、為了確?!敖虒W點數(shù)字教育資源全覆蓋”項目設(shè)備正常使用,我校做到安裝、教師培訓同步進行。設(shè)備安裝到位后,中心校組織各學點管理人員統(tǒng)一到縣教師進修學校進行培訓,熟悉系統(tǒng)的使用和維護。網(wǎng)絡(luò)民航事件虛假評論的識別研究  摘要:互聯(lián)網(wǎng)的開放性使得當前對于互聯(lián)網(wǎng)上用戶的評論內(nèi)容沒有質(zhì)量控制機制,用戶發(fā)表的內(nèi)容中存在大量虛假評論,如何識別這些虛假評論信息成為重要問題。運用信息增益,支持向量機等方法對民航事件的評論進行特征提取和分類,識別虛假評論。通過對比四種不同的核函數(shù),本文選定基于RBF核函數(shù)的SVM分類器進行虛假信息的分類識別,其F-measur

2、e值為90%,具有較優(yōu)的分類效果。  關(guān)鍵詞:虛假評論;信息增益;支持向量機;特征提??;核函數(shù)  Abstract:Forthereasonofinternet’sopenness,usersareallowedtocommentfreelywithoutqualitycontrolsystem,thepublishedcontentincludesmanyfalsereviews.Howtoidentifythesefakecommentsbecomeanimportantissue.BasedonInformationGainand

3、SVM,thisresearchidentifythefalsereviewsthroughfeatureextractionandclassification.Bycomparingfourkernelfunctions,RBFkernelfunctionofSVMclassifierisselectedfortheidentificationofthefalseinformation.TheF-measurevalueis90%,withqualifiedclassificationresults.  Keywords:falser

4、eview;informationgain;為了充分發(fā)揮“教學點數(shù)字教育資源全覆蓋”項目設(shè)備的作用,我們不僅把資源運用于課堂教學,還利用系統(tǒng)的特色欄目開展課外活動,對學生進行安全教育、健康教育、反邪教教育等豐富學生的課余文化生活。為了確保“教學點數(shù)字教育資源全覆蓋”項目設(shè)備正常使用,我校做到安裝、教師培訓同步進行。設(shè)備安裝到位后,中心校組織各學點管理人員統(tǒng)一到縣教師進修學校進行培訓,熟悉系統(tǒng)的使用和維護。supportvectormachine;featureextraction;KernelFunction  0引言  隨著Web廣泛

5、使用以及用戶深入?yún)⑴c,出現(xiàn)社會熱門事件后,用戶會通過網(wǎng)絡(luò)發(fā)表事件相關(guān)評論,但由于用戶評論時的隨意性,導致其中必然包含不實信息。自XX年起,虛假信息識別這一課題受到關(guān)注。國外研究成果已獲一定進展,而國內(nèi)研究仍處于探索時期,同時虛假信息識別大多數(shù)研究卻只是集中于電子商務產(chǎn)品、互聯(lián)網(wǎng)銷售等新式專用領(lǐng)域,而關(guān)于民航事件評論中的虛假信息識別研究卻仍亟待起步?;谌缟媳尘靶枨?,針對如何從海量民航事件評論信息中識別出虛假評論,本文將展開詳盡論與闡析?! ”疚囊悦窈绞录u論信息為研究對象,提出評論描述上述特征,并采用信息增益方法對各個特征計算權(quán)重,再使

6、用支持向量機的4種核函數(shù)模型分別對訓練集評論進行訓練,得出四種分類器,對比性能后殼優(yōu)選基于RBF函數(shù)的分類器,能夠?qū)φ鎸嵲u論和虛假評論進行更佳分類,從而高效、準確地識別出民航事件評論信息中的虛假評論?! ?虛假評論識別模型  虛假評論識別模型中展示了識別虛假評論的步驟及流程。模型構(gòu)建表示如圖1如下?! ∧P蛨D中主要方法介紹如下:為了充分發(fā)揮“教學點數(shù)字教育資源全覆蓋”項目設(shè)備的作用,我們不僅把資源運用于課堂教學,還利用系統(tǒng)的特色欄目開展課外活動,對學生進行安全教育、健康教育、反邪教教育等豐富學生的課余文化生活。為了確?!敖虒W點數(shù)字教育資

7、源全覆蓋”項目設(shè)備正常使用,我校做到安裝、教師培訓同步進行。設(shè)備安裝到位后,中心校組織各學點管理人員統(tǒng)一到縣教師進修學校進行培訓,熟悉系統(tǒng)的使用和維護。  虛假特征的確定  本文通過支持向量機模型對貼吧、微博用戶關(guān)于民航事件的評論進行虛假評論識別,在這一過程中,特征的選取會直接影響到模型的識別效果。通過對評論的分析研究,本文分別從評論者、評論本身、評論內(nèi)容3個方面進行虛假評論特征的選擇,特征如下:  1)以評論者為中心的特征  評論者是否匿名:本文關(guān)注的事件樣本是受到國內(nèi)乃至國際廣泛關(guān)注的民航重大事件,多數(shù)情況下,非匿名評論比匿名評論真

8、實性強,可信度更高。其中,蓄意誤導價值觀,或具有反社會傾向的評論者,以引導輿論,擾亂社會為目的,通常會隱藏身份,選擇匿名的可能性較大?! ?)以評論本身為中心的特征  評論是否重復出現(xiàn):普通評論者發(fā)表評論目

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。