資源描述:
《論文--基于微博評論的情感分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于情感詞典的微博評論情感分析理工學(xué)院計科一、實驗題目基于微博評論的情感分析二、實驗?zāi)康挠肑ava實現(xiàn)對微博評論數(shù)據(jù)的分詞和情感分析。得到評論的情感傾向是積極、消極還是中性以及情感傾向度。以此作為算法研究微博評論的基礎(chǔ)。三、實驗環(huán)境操作系統(tǒng)版本:WINDOWS7主要硬件:CPU,內(nèi)存,顯示器實驗平臺:JavaEclipse四、實驗步驟1、Java環(huán)境配置先安裝jdk選擇【新建系統(tǒng)變量】--彈出“新建系統(tǒng)變量”對話框,在“變量名”文本框輸入“JAVA_HOME”,在“變量值”文本框輸入JDK的安裝路徑在“系統(tǒng)變量”選項區(qū)域中查看CLASSPATH變量在文本框起始位置添加“.;%JAVA_
2、HOME%libdt.jar;%JAVA_HOME%libtools.jar;”。在“系統(tǒng)變量”選項區(qū)域中查看PATH變量,在文本框起始位置添加“%JAVA_HOME%bin;%JAVA_HOME%jrebin;”2、驗證環(huán)境變量是否配置成功:如果出現(xiàn)下面界面說明你已經(jīng)配置好了!你的電腦就可以運行java程序了。3、導(dǎo)入目的文件點擊finish導(dǎo)入完成,可運行程序。五、功能和代碼實現(xiàn)功能實現(xiàn):算法分為四個方面來實現(xiàn),爬蟲獲取微博評論、分詞、情感定位和情感聚合。通過算法可以實現(xiàn)對于微博評論的分詞和人們的情感傾向分析。是積極消極還是中性的態(tài)度以及情感的傾向度。中文分詞和去除停
3、用詞測試文件得到情感傾向度情感定位微博評論爬蟲情感聚合項目模塊設(shè)計代碼實現(xiàn):本人在項目組中負(fù)責(zé)情感定位的部分和代碼,本部分代碼的主要功能是給不同情感詞進行人工標(biāo)記。具體代碼如下:publicclasssentiment{SetposWordSet,negWordSet,negVodSet,vod1Set,vod2Set,vod3Set,vod4Set,vod5Set,vod6Set;//不同情感詞的詞庫StringBuffersensTxt;floattolSens=0;//各個極性短語的強度floatdocSens=0;//句子平均的強度,inti=1;intw=1;
4、intq=1;publicstaticvoidmain(String[]args)throwsException{fengCijd=newfengCi("./DATA/tt.txt","./DATA/ttFC.txt","UTF8");jd.getFengci();//開始sentimentsentimenta=newsentiment();a.readDoc("./DATA/ttFC.txt","./DATA/ttPrediction.txt");}publicvoidreadDoc(Stringpath,StringsenPath)throwsIOException{Filedoc
5、=newFile(path);StringsigleDoc=null;String[]stringList;dic();StringBufferreadParse,ParseSen;BufferedReaderdocBf=newBufferedReader(newInputStreamReader(newFileInputStream(doc),"gb2312"));while((sigleDoc=docBf.readLine())!=null){readParse=newStringBuffer();ParseSen=newStringBuffer();readParse.appen
6、d("<");//后加7、
8、negWordSet.contains(stringList[i])
9、
10、negVodSet.contains(stringList[i])
11、
12、vod1Set.contains(stringList[i])
13、
14、vod2Set.contai
15、ns(stringList[i])
16、
17、vod3Set.contains(stringList[i])
18、
19、vod4Set.contains(stringList[i])
20、
21、vod5Set.contains(stringList[i])
22、
23、vod6Set.contains(stringList[i])){if(readParse.lastIndexOf(">")>readParse.lastIndexOf("<")){//輸出>的位置,從0開始re