中文新聞文本傾向性的分析研究

中文新聞文本傾向性的分析研究

ID:32258776

大?。?.14 MB

頁數(shù):66頁

時間:2019-02-02

中文新聞文本傾向性的分析研究_第1頁
中文新聞文本傾向性的分析研究_第2頁
中文新聞文本傾向性的分析研究_第3頁
中文新聞文本傾向性的分析研究_第4頁
中文新聞文本傾向性的分析研究_第5頁
資源描述:

《中文新聞文本傾向性的分析研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、萬方數(shù)據(jù)學(xué)位論文版權(quán)使用授權(quán)書I黜粵科本人完全了解北京信息科技大學(xué)關(guān)于收集、保存、使用學(xué)位論文的規(guī)定,按照學(xué)校要求提交學(xué)位論文的印刷本和電子版本。學(xué)校有權(quán)保留學(xué)位論文并向中國科學(xué)技術(shù)信息研究所等國家主管部門或其指定機構(gòu)送交論文的電子版和紙質(zhì)版,允許論文被查閱和借閱,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。學(xué)校有權(quán)適當(dāng)復(fù)制、公布論文的全部或部分內(nèi)容。學(xué)校有權(quán)將本人的學(xué)位論文加入《中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫》和編入《中國知識資源總庫》。學(xué)位論文作者簽名:如e舜,月>R口公開口保密(——年——月)(保密的學(xué)位論文在解密后應(yīng)遵藤諱矽擴年鄉(xiāng)月fD曰洲肆,

2、月2日萬方數(shù)據(jù)碩士學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文題目為《中文新聞文本傾向性分析研究》學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下,進行研究工作所取得的成果。盡我所知,除了文中特別加以標注的內(nèi)容外,本學(xué)位論文的研究成果不包含任何他人創(chuàng)作的、已公開發(fā)表或者沒有公開發(fā)表的作品的內(nèi)容。對本論文所涉及的研究工作做出貢獻的其他個人和集體,均已在文中以明確方式標明并表示了謝意。本學(xué)位論文原創(chuàng)性聲明的法律責(zé)任由本人承擔(dān)。作者簽字:斑諱2力e琿凋瑁分類號:TP391單位代碼:11232萬方數(shù)據(jù)摘要信息技術(shù)的發(fā)展,為新聞的傳播帶來了極大便利,但同時也將越來越多的新聞傾向性披露在公眾的

3、面前,直接或間接地影響了新聞的輿論導(dǎo)向,對輿情監(jiān)測提出了新的挑戰(zhàn)。準確高效的新聞傾向性分析有助于公眾了解最新社會動態(tài),獲悉時事熱點;也有助于監(jiān)管部門及時了解輿論輿情的最新發(fā)展和走勢,積極有效地采取應(yīng)對措施,減少負面新聞在網(wǎng)絡(luò)中的傳播,合理地引導(dǎo)公眾的關(guān)注視線,共創(chuàng)和諧網(wǎng)絡(luò)文化環(huán)境。新聞文本中情感表達較為隱晦,涉及內(nèi)容更是方方面面,加上目前尚缺乏行之有效的篇章級分析理論與工具,給新聞文本的傾向性分析帶來了不便??紤]到并不是所有新聞句子都包含情感傾向,而且有的句子與新聞內(nèi)容關(guān)聯(lián)不大,因此直接對整篇新聞文本進行傾向分析可能有失偏頗。利用新聞文本的結(jié)構(gòu)特點,本文首先構(gòu)建

4、了多特征融合的主題句抽取模型,然后討論了新聞句子傾向性的分析方法,最后將二者結(jié)合完成新聞文本傾向性分析的任務(wù)。另外,針對一些新聞事實為負面的突發(fā)性新聞形成的專題,探討了新聞專題階段性摘要的生成。本文的研究工作主要包括以下幾個方面:(1)提出了多特征融合的新聞主題句抽取模型。深入研究了新聞文本中高頻詞的發(fā)現(xiàn)算法,并根據(jù)高頻詞出現(xiàn)位置的不同,分析了新聞高頻詞特征對新聞句子重要性的加權(quán);詳細探討了新聞標題特征對新聞內(nèi)容表達的作用,定量計算了新聞標題與新聞句子的相似程度;根據(jù)新聞的“倒金字塔”式的文本結(jié)構(gòu),分析了新聞的句子位置特征:收集整理了新聞中具有情感導(dǎo)向的傾向性線

5、索詞,用于挖掘新聞中可能存在的傾向旬。最后根據(jù)上述四種特征,完成多特征融合的主題句抽取模型的構(gòu)建。(2)討論了新聞句子的傾向性分析方法。一是基于情感詞典的分析方法,構(gòu)建了一部21175個普通情感詞匯和1438個新聞情感詞匯組成的情感詞典,并收集了新聞引述性詞匯,然后根據(jù)三種詞匯的優(yōu)先級不同設(shè)計了基于情感詞典的新聞句子傾向性分析方法,該方法與第(1)部分的新聞主題句抽取模型相結(jié)合,在cOAE2014的相應(yīng)評測任務(wù)上取得了較好的成績。二是機器學(xué)習(xí)的方法,分析比較了情感詞特征、unigr鋤特征以及二者結(jié)合的方法。三是對第一種和第二種方法的改進,采用情感詞典+u11ig

6、r鋤特征相結(jié)合的句子傾向性分析方法,用于對新聞主觀句進行情感分類。(3)探討了新聞文本的傾向性分析方法。對新聞文本傾向性分析的過程進行了規(guī)范化描述,將其分解為新聞主題句的抽取和新聞句子的傾向性分析兩個子任務(wù),并探討了該做法的可行性,然后借助新聞主題句抽取模型和情感詞典+unigram特征的句子傾向性分析方法,完成了新聞文本傾向性分析的任務(wù)。萬方數(shù)據(jù)摘要(4)提出了新聞專題階段性摘要的生成算法。針對一些事實為負面傾向的突發(fā)性新聞形成的專題,分析了話題的形成、延續(xù)、消亡與階段性摘要內(nèi)容的對應(yīng)關(guān)系,利用話題檢測與追蹤技術(shù)詳細介紹了基于時『白J流的話題雙向聚類和話題交集

7、的再聚類算法,以此生成新聞專題的階段性摘要,并通過實驗說明了該算法具有較好的召回率。關(guān)鍵詞:新聞文本傾向性;主題旬抽?。恍侣劸渥觾A向性;階段性摘要萬方數(shù)據(jù)ABSTRACTWiththedeVelopmentofinfonnationtecllllology'greatconveniencehasbeenbrou曲tfornewscommunication.Moreandmorenewspolaritiesareexposedtothepublicatthes鋤etime,、—hichwouldinnuencethepublicopiniondirectlyori

8、ndirectlyand

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。