資源描述:
《網(wǎng)絡(luò)輿情研判技術(shù)的研究進(jìn)展》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、第30卷第12期情報科學(xué)Vol.30,No.122012年12月December,2012·綜述·網(wǎng)絡(luò)輿情研判技術(shù)的研究進(jìn)展郝曉玲(上海財經(jīng)大學(xué)信息管理與工程學(xué)院,上海200433)摘要:本文從網(wǎng)絡(luò)輿情研判的基本流程出發(fā),從輿情研判所涉及的關(guān)鍵技術(shù):主題特征抽取技術(shù)、情感分析技術(shù)、熱點發(fā)現(xiàn)算法、輿情研判模型、輿情演化分析技術(shù)等方面對已有研究文獻(xiàn)進(jìn)行歸納,旨在發(fā)現(xiàn)該領(lǐng)域中有待解決的技術(shù)難點,以期為未來深入研究奠定基礎(chǔ)。關(guān)鍵詞:網(wǎng)絡(luò)輿情研判;用戶興趣模型;熱點發(fā)現(xiàn);情感分析;主題特征抽取中圖分類號:G250.2文獻(xiàn)標(biāo)識碼:A文章編號
2、:1007-7634(2012)12-1901-06StudyofKeyTechnologiesinJudgeofOnlinePeople’sOpinionsHAOXiao-ling(SchoolofInformationManagementandEngineering,ShanghaiUniversityofFinanceandEconomics,Shanghai200433,China)Abstract:Thispaperbeginsfrombasisprocessofonlinepublicopinion,andsumma
3、rizesandreviewsex?istingliteratureinthefollowingaspects:interestmodelofuser,extractionandstructureofthemeproper?ties,sentimentanalysis,algorithmsofhotspotdetection,andjudgemodelofpublicopinion,andpointsoutthekeyissuesneedtoberesolved,withanaimtolayafoundationforfutur
4、estudies.Keywords:judgeonpublicopinion;interestmodelofusers;hotspotdetection;sentimentanalysis;extrac?tionofthemeproperties輿情是社會輿情在互聯(lián)網(wǎng)空間的映射,也成為政府1引言治國理政、了解社情民意,以及公共危機(jī)事件的信息收集、分析和預(yù)警的重要研究領(lǐng)域,通過輿情研判可隨著網(wǎng)絡(luò)論壇數(shù)量的日益增多,網(wǎng)絡(luò)社區(qū)技術(shù)以有效地對事件做出回歸分析和前景預(yù)測,從而提的飛速發(fā)展,以及形式多樣的網(wǎng)絡(luò)交流工具的廣泛升處理能力和應(yīng)對能
5、力。因此,輿情研判相關(guān)研究應(yīng)用,互聯(lián)網(wǎng)成為輿情傳播的重要渠道,而互聯(lián)網(wǎng)已經(jīng)引起政府部門以及學(xué)術(shù)領(lǐng)域的高度關(guān)注?!傲炎兪健笨焖賯鞑サ奶匦砸彩沟脗€人情緒和意見被迅速放大?;ヂ?lián)網(wǎng)已成為各階層利益表達(dá)、情感宣2網(wǎng)絡(luò)輿情研判的關(guān)鍵技術(shù)泄、思想碰撞的輿論渠道。通過新聞跟帖、論壇、博客、即時通訊工具、搜索引擎等途徑表現(xiàn)出的網(wǎng)絡(luò)輿隨著網(wǎng)絡(luò)信息量的不斷增大,以及目前危機(jī)事情的熱點成為聚焦網(wǎng)民情緒、意見和行為形象的窗件管理等的需求不斷增加,網(wǎng)絡(luò)輿情研究日益得到口,也成為折射現(xiàn)實社會輿論和民情的鏡像。網(wǎng)絡(luò)關(guān)注。網(wǎng)絡(luò)輿情研判是較為復(fù)雜的一項系統(tǒng)工程,收
6、稿日期:2011-11-01基金項目:教育部人文社科項目(10YJC860010);上海財經(jīng)大學(xué)“211三期”項目資助作者簡介:郝曉玲(1975-),女,山東人,副教授,主要從事IT治理、網(wǎng)絡(luò)輿情研究.1902情報科學(xué)30卷【7】涉及到多種信息渠道和多個信息采集與分析環(huán)節(jié),Hulten提出基于文本的聚類,即文本的關(guān)鍵詞作【4】以及多種技術(shù)和方法,同時也有賴于輿情應(yīng)用人員為文本的特征。陳炯,張永奎提出基于詞聚類的的經(jīng)驗判斷。目前,多數(shù)應(yīng)用于政府輿情監(jiān)管部門中文文本主題抽取方法,該方法利用相關(guān)度對詞的的系統(tǒng)仍然不能滿足用戶需求。本文
7、通過將在國內(nèi)共現(xiàn)進(jìn)行分析,建立詞之間語義關(guān)聯(lián),并生成代表某【8】外期刊和會議上發(fā)表的文獻(xiàn)和資料進(jìn)行集中歸納和一主題概念的用種子詞表示的詞類。李建鋒等提總結(jié),旨在發(fā)現(xiàn)該領(lǐng)域中有待解決的技術(shù)難點,以期出基于聚類-遺傳算法相結(jié)合的文摘提取方法,通為未來深入研究奠定基礎(chǔ)。過聚類算法計算文本各種聚類的可能性,利用遺傳網(wǎng)絡(luò)輿情研判是對網(wǎng)絡(luò)媒體上的輿情進(jìn)行價值算法全局尋優(yōu)的特點對聚類結(jié)果進(jìn)行計算、組合得【9】和趨向判斷的過程,其基本流程是:首先是根據(jù)輿情到最優(yōu)的文本主題。蘇喻等結(jié)合基于劃分的聚類的工作需求對網(wǎng)絡(luò)媒體上的信息進(jìn)行采集,并對主算法
8、和基于密度的聚類算法的優(yōu)點,提出了基于密要話題進(jìn)行主題的識別與抽取,然后在對主題進(jìn)行度的聚類算法DBCKNN。算法利用了k近鄰和離群語義、情感和統(tǒng)計分析的基礎(chǔ)上生成相關(guān)的熱點,再度等概念,能夠迅速確定數(shù)據(jù)集中每類的中心及其聚焦于熱點話題基于用戶的評價準(zhǔn)則進(jìn)行研判