資源描述:
《網(wǎng)絡(luò)民航事件虛假評論的識別研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫。
1、為了確?!敖虒W點數(shù)字教育資源全覆蓋”項目設(shè)備正常使用,我校做到安裝、教師培訓同步進行。設(shè)備安裝到位后,中心校組織各學點管理人員統(tǒng)一到縣教師進修學校進行培訓,熟悉系統(tǒng)的使用和維護。網(wǎng)絡(luò)民航事件虛假評論的識別研究 摘要:互聯(lián)網(wǎng)的開放性使得當前對于互聯(lián)網(wǎng)上用戶的評論內(nèi)容沒有質(zhì)量控制機制,用戶發(fā)表的內(nèi)容中存在大量虛假評論,如何識別這些虛假評論信息成為重要問題。運用信息增益,支持向量機等方法對民航事件的評論進行特征提取和分類,識別虛假評論。通過對比四種不同的核函數(shù),本文選定基于RBF核函數(shù)的SVM分類器進行虛假信息的分類識別,其F-measur
2、e值為90%,具有較優(yōu)的分類效果。 關(guān)鍵詞:虛假評論;信息增益;支持向量機;特征提??;核函數(shù) Abstract:Forthereasonofinternet’sopenness,usersareallowedtocommentfreelywithoutqualitycontrolsystem,thepublishedcontentincludesmanyfalsereviews.Howtoidentifythesefakecommentsbecomeanimportantissue.BasedonInformationGainand
3、SVM,thisresearchidentifythefalsereviewsthroughfeatureextractionandclassification.Bycomparingfourkernelfunctions,RBFkernelfunctionofSVMclassifierisselectedfortheidentificationofthefalseinformation.TheF-measurevalueis90%,withqualifiedclassificationresults. Keywords:falser
4、eview;informationgain;為了充分發(fā)揮“教學點數(shù)字教育資源全覆蓋”項目設(shè)備的作用,我們不僅把資源運用于課堂教學,還利用系統(tǒng)的特色欄目開展課外活動,對學生進行安全教育、健康教育、反邪教教育等豐富學生的課余文化生活。為了確保“教學點數(shù)字教育資源全覆蓋”項目設(shè)備正常使用,我校做到安裝、教師培訓同步進行。設(shè)備安裝到位后,中心校組織各學點管理人員統(tǒng)一到縣教師進修學校進行培訓,熟悉系統(tǒng)的使用和維護。supportvectormachine;featureextraction;KernelFunction 0引言 隨著Web廣泛
5、使用以及用戶深入?yún)⑴c,出現(xiàn)社會熱門事件后,用戶會通過網(wǎng)絡(luò)發(fā)表事件相關(guān)評論,但由于用戶評論時的隨意性,導致其中必然包含不實信息。自XX年起,虛假信息識別這一課題受到關(guān)注。國外研究成果已獲一定進展,而國內(nèi)研究仍處于探索時期,同時虛假信息識別大多數(shù)研究卻只是集中于電子商務產(chǎn)品、互聯(lián)網(wǎng)銷售等新式專用領(lǐng)域,而關(guān)于民航事件評論中的虛假信息識別研究卻仍亟待起步?;谌缟媳尘靶枨?,針對如何從海量民航事件評論信息中識別出虛假評論,本文將展開詳盡論與闡析?! ”疚囊悦窈绞录u論信息為研究對象,提出評論描述上述特征,并采用信息增益方法對各個特征計算權(quán)重,再使
6、用支持向量機的4種核函數(shù)模型分別對訓練集評論進行訓練,得出四種分類器,對比性能后殼優(yōu)選基于RBF函數(shù)的分類器,能夠?qū)φ鎸嵲u論和虛假評論進行更佳分類,從而高效、準確地識別出民航事件評論信息中的虛假評論?! ?虛假評論識別模型 虛假評論識別模型中展示了識別虛假評論的步驟及流程。模型構(gòu)建表示如圖1如下?! ∧P蛨D中主要方法介紹如下:為了充分發(fā)揮“教學點數(shù)字教育資源全覆蓋”項目設(shè)備的作用,我們不僅把資源運用于課堂教學,還利用系統(tǒng)的特色欄目開展課外活動,對學生進行安全教育、健康教育、反邪教教育等豐富學生的課余文化生活。為了確?!敖虒W點數(shù)字教育資
7、源全覆蓋”項目設(shè)備正常使用,我校做到安裝、教師培訓同步進行。設(shè)備安裝到位后,中心校組織各學點管理人員統(tǒng)一到縣教師進修學校進行培訓,熟悉系統(tǒng)的使用和維護。 虛假特征的確定 本文通過支持向量機模型對貼吧、微博用戶關(guān)于民航事件的評論進行虛假評論識別,在這一過程中,特征的選取會直接影響到模型的識別效果。通過對評論的分析研究,本文分別從評論者、評論本身、評論內(nèi)容3個方面進行虛假評論特征的選擇,特征如下: 1)以評論者為中心的特征 評論者是否匿名:本文關(guān)注的事件樣本是受到國內(nèi)乃至國際廣泛關(guān)注的民航重大事件,多數(shù)情況下,非匿名評論比匿名評論真
8、實性強,可信度更高。其中,蓄意誤導價值觀,或具有反社會傾向的評論者,以引導輿論,擾亂社會為目的,通常會隱藏身份,選擇匿名的可能性較大?! ?)以評論本身為中心的特征 評論是否重復出現(xiàn):普通評論者發(fā)表評論目