新聞報道文本的情感傾向性研究

新聞報道文本的情感傾向性研究

ID:5344350

大?。?19.47 KB

頁數(shù):3頁

時間:2017-12-08

新聞報道文本的情感傾向性研究_第1頁
新聞報道文本的情感傾向性研究_第2頁
新聞報道文本的情感傾向性研究_第3頁
資源描述:

《新聞報道文本的情感傾向性研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、第36卷第15期計算機(jī)工程2010年8月VoL36No.1sComputerEngineeringAugust2010·博士論文·文章編號:1000-3428(2010)i;02-_0—麗———西■新聞報道文本的情感傾向性研究昝紅英,郭明,柴玉梅,吳云芳(1.鄭州大學(xué)信息工程學(xué)院,鄭州450001;2.北京大學(xué)計算語言學(xué)研究所,北京100871)摘要:將機(jī)器學(xué)習(xí)中的經(jīng)典分類方法與規(guī)則方法相結(jié)合,用以分析新聞?wù)Z音文本的情感傾向,并判斷其強(qiáng)弱。通過支持向量機(jī)分類器來研究特征選擇方法及特征權(quán)重計算方法的組合對實(shí)驗(yàn)結(jié)果的影響。在實(shí)驗(yàn)過程中發(fā)現(xiàn)適當(dāng)?shù)慕Y(jié)合規(guī)則后,實(shí)驗(yàn)結(jié)果在不同程度上都有了提

2、高,在KNN和Bayes分類器上做了對比實(shí)驗(yàn),結(jié)果證實(shí)該方法的普適性。關(guān)健詞:機(jī)器學(xué)習(xí);特征選擇;特征權(quán)重;支持向量機(jī)Research0nNewsReportr】]extSentimentTendencyZANHong—ying,GUOMing。,CHAIYu-mei,WUYun.fang(1.CollegeofInformationandEngineering,ZhengzhouUniversity,Zhengzhou450001;2.InstituteofComputationalLinguistics,PekingUniversity,Beijing100871)[Abst

3、ract]Thispaperusesmachinelearningtechniquescombinedwiththerulestosolvesentimentclassificationofnewstext,andresearchesafectionoffeatureselectionandfeatureweightsbasedonSupportVectorMachine(SVM)classifier.Experimentsshowthatcombinedwiththerules,experimentalresultisimprovedInordertotestuniversal

4、ityofthecombinedmethod,moreexperimentsbasedonKNNandBayesclassifieraredone.ResultsshowthatcombinedmethoddoesbetterthannotcombinedOlqeS.[Keywords]machinelearning;featureselection;featureweight;SupportVectorMachine(SVM)1概述征句,分析評論句的語義極性和極性強(qiáng)度。文獻(xiàn)【5】研究多種在較長一段時期內(nèi),情感一直位于認(rèn)知科學(xué)研究者的視分類器在中文情感分類中的表現(xiàn),并且針對不同詞

5、性的詞做線之外。直到20世紀(jì)末期,情感作為認(rèn)知過程重要組成部分特征來測試詞性在不同類別文本(如影視、教育、房產(chǎn)、電腦、的身份才得到了學(xué)術(shù)界的普遍認(rèn)同。手機(jī))的情感分類中的重要性。文獻(xiàn)[6】使用樸素貝葉斯和最大隨著互聯(lián)網(wǎng)的發(fā)展而迅猛地發(fā)展著,大量的文本充斥著熵方法進(jìn)行新聞及評論語料的情感分類研究,通過實(shí)驗(yàn)認(rèn)為網(wǎng)絡(luò)。數(shù)量已大大超出了手工能夠處理的極限。因此,對文二值作為特征項(xiàng)權(quán)重正確率較好,但不足之處就是未用SVM本的自動分析處理成為一項(xiàng)重要的工作。文本的情感分析成分類器。為自然語言處理的研究熱點(diǎn)。3文本情感分析模型本文主要研究如何利用機(jī)器學(xué)習(xí)的方法結(jié)合規(guī)則的方法本文結(jié)合使用統(tǒng)計的方

6、法和簡單的規(guī)則方法來對新聞?wù)Z來對新聞文本的正負(fù)極性及其強(qiáng)弱進(jìn)行分類。相比于文本,料進(jìn)行情感分類,采用結(jié)合規(guī)則的方法是基于以下考慮:比如BLOG的文本,新聞文本有其自身的特點(diǎn),本文就是抓(1)規(guī)則包含一些語意信息,這是統(tǒng)計所不具備的,且本住新聞文本的這些特點(diǎn)來抽取規(guī)則,并利用這些規(guī)則結(jié)合機(jī)文人工提取的規(guī)則又經(jīng)過統(tǒng)計方法的篩選以提高規(guī)則覆蓋語器學(xué)習(xí)的方法進(jìn)行分類。料的正確率。2相關(guān)研究(2)統(tǒng)計方法可以整體衡量訓(xùn)練語料中詞語出現(xiàn)的頻度現(xiàn)階段對文本情感的研究總體可分為2類:及分布等一些統(tǒng)計信息,并且能評價這些詞語對分類的貢獻(xiàn)(1)利用語言自身的特點(diǎn),總結(jié)出一套規(guī)則,并利用這套大小。規(guī)則

7、來分析文本的情感”J。本文用規(guī)則的方法對測試語料進(jìn)行第1次分類,分出規(guī)(2)利用統(tǒng)計學(xué)的方法,對文本中出現(xiàn)的詞進(jìn)行統(tǒng)計得出則能夠覆蓋的語料。第2次再將剩下的測試語料用統(tǒng)計的方統(tǒng)計信息來進(jìn)行情感分析。J。法進(jìn)行分類來提高分類效果。許多研究者從詞、短語、句子,到篇章等多個角度來進(jìn)基金項(xiàng)目:國家“863”計劃基金資助項(xiàng)目(2007AA01Z198);國家行探索。例如文獻(xiàn)[2IN用點(diǎn)對互信息(PMI)來對詞的語義傾自然科學(xué)基金資助項(xiàng)目(60970083);國家社會科學(xué)基金資助項(xiàng)目向進(jìn)行判

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。