網(wǎng)上股評(píng)論文:基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究

網(wǎng)上股評(píng)論文:基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究

ID:33135862

大?。?5.30 KB

頁(yè)數(shù):3頁(yè)

時(shí)間:2019-02-21

網(wǎng)上股評(píng)論文:基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究_第1頁(yè)
網(wǎng)上股評(píng)論文:基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究_第2頁(yè)
網(wǎng)上股評(píng)論文:基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究_第3頁(yè)
資源描述:

《網(wǎng)上股評(píng)論文:基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、衿膀芆薃裊腿蒈衿螁膈薀蟻?lái)蹦i芀袇羆膇莂蝕袂膆蒅裊螈芅薇蚈肇芄芇蒁羃芃葿蚆罿節(jié)薁蕿裊節(jié)芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈羋螁螇莇莀薄肆莆薂蝿肂莆蚄螞羈蒞莄袈襖羈蒆蝕螀羀蕿袆肈罿羋蠆羄聿莁襖袀肈蒃蚇螆肇蚅蒀膅肆蒞螅肁肅蕆薈羇肄薀螄袃肅艿薆蝿肅莂螂肇膂蒄薅羃膁薆螀衿膀芆薃裊腿蒈衿螁膈薀蟻?lái)蹦i芀袇羆膇莂蝕袂膆蒅裊螈芅薇蚈肇芄芇蒁羃芃葿蚆罿節(jié)薁蕿裊節(jié)芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈羋螁螇莇莀薄肆莆薂蝿肂莆蚄螞羈蒞莄袈襖羈蒆蝕螀羀蕿袆肈罿羋蠆羄聿莁襖袀肈蒃蚇螆肇蚅蒀膅肆蒞螅肁肅蕆薈羇肄薀螄袃肅艿薆蝿肅莂螂肇膂蒄薅羃膁薆螀衿膀芆薃裊腿蒈衿螁膈薀蟻?lái)蹦i芀袇羆膇莂蝕袂膆蒅裊螈芅薇蚈肇芄芇蒁羃芃葿蚆罿節(jié)薁蕿裊

2、節(jié)芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈羋螁螇莇莀薄肆莆薂蝿肂莆蚄螞羈蒞莄袈襖羈蒆蝕螀羀蕿袆肈罿羋蠆羄聿莁襖袀肈蒃蚇螆肇蚅蒀膅肆蒞螅肁肅蕆薈羇肄薀螄袃肅艿薆蝿肅莂螂肇膂蒄薅羃膁薆螀衿膀芆薃裊腿蒈衿螁膈薀蟻?lái)蹦i芀袇羆膇莂蝕袂膆蒅裊螈芅薇蚈肇芄芇蒁羃芃葿蚆罿節(jié)薁蕿裊節(jié)芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈羋螁螇莇莀薄肆網(wǎng)上股評(píng)論文:基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究【中文摘要】每天眾多的財(cái)經(jīng)網(wǎng)站會(huì)發(fā)布股票信息,這些信息數(shù)據(jù)量巨大、存在大量冗余和容易混淆的數(shù)據(jù),一般的用戶需要花費(fèi)很多時(shí)間才能獲得自己想要的股評(píng)信息。本文從國(guó)內(nèi)互聯(lián)網(wǎng)股評(píng)及網(wǎng)上信息抽取技術(shù)的分析入手,對(duì)網(wǎng)上股評(píng)信息的提取進(jìn)行研究,具體工作如下:

3、(1)采用網(wǎng)絡(luò)蜘蛛的信息抽取技術(shù)實(shí)現(xiàn)了對(duì)網(wǎng)頁(yè)上的信息提取。在網(wǎng)頁(yè)中先定位到用戶所需信息的鏈接的URL,并把這些URL放入等待抓取的隊(duì)列中;然后依次下載每個(gè)URL對(duì)應(yīng)的網(wǎng)頁(yè),對(duì)其HTML文檔進(jìn)行結(jié)構(gòu)化分析,從中查找股票信息。(2)建立股評(píng)特征信息的詞庫(kù)。首先,根據(jù)對(duì)財(cái)經(jīng)網(wǎng)站上的大量股評(píng)信息進(jìn)行特征分析,找出既頻繁出現(xiàn)、又能表示股票趨勢(shì)的特征詞匯。其次,由于所研究的股評(píng)信息具有前半句常為描述股票特征、后半句給出操作建議的結(jié)構(gòu),所以,對(duì)股評(píng)信息的前半句的分析得到描述股評(píng)的多特征詞匯,有時(shí)表示為一個(gè)特征,有時(shí)需要用結(jié)合兩個(gè)特征詞描述,綜合分析后可將這些特征詞匯后建立特征詞庫(kù)、結(jié)合詞庫(kù);對(duì)股評(píng)信息

4、的后半句分析得到的建議詞匯可組成建議詞庫(kù)。最后,對(duì)特征詞庫(kù)、結(jié)合詞庫(kù)、建議詞庫(kù)三個(gè)詞庫(kù)中的特征詞匯進(jìn)行總結(jié)。(3)利用所建立的特征詞庫(kù)對(duì)股評(píng)信息進(jìn)行解析。首先從特征詞庫(kù)中依次...【英文摘要】Manyfinancialwebsitesissuestockinformationeveryday.Thereareahugeamountofdataandalargenumberofredundantandconfuseddataonthewebsites.Theaverageusersneedtospendmuchtimetogetexpectedinformationaboutstockco

5、mment.ThispaperanalyseddomesticstockcommentontheInternetandthethetechnologyofinformationextraction,andmakethestudyofextractingstockcommentfromInternet.Thestudiedworkwasasfollows:(1)Achieveextractinginformationfromthewebpagebased...【關(guān)鍵詞】網(wǎng)上股評(píng)語(yǔ)義網(wǎng)絡(luò)蜘蛛信息提取股評(píng)特征【英文關(guān)鍵詞】stockcommentintheinternetsemanticweb

6、spiderextractionofinformationfeatureofstockcomment【目錄】基于語(yǔ)義的網(wǎng)上股評(píng)信息的提取研究摘要4-5Abstract5-6第1章緒論9-181.1課題研究的目的和意義9-101.2國(guó)內(nèi)外研究現(xiàn)狀10-161.2.1國(guó)內(nèi)互聯(lián)網(wǎng)股評(píng)現(xiàn)狀101.2.2網(wǎng)上信息抽取技術(shù)現(xiàn)狀10-151.2.3語(yǔ)義的研究現(xiàn)狀15-161.3本文研究?jī)?nèi)容與結(jié)構(gòu)16-18第2章網(wǎng)上股評(píng)信息的提取18-322.1網(wǎng)上股評(píng)信息的定義及內(nèi)容18-202.2網(wǎng)上股評(píng)信息的存儲(chǔ)格式20-232.3網(wǎng)上股評(píng)信息的提取原則23-252.4信息抽取結(jié)果的衡量指標(biāo)252.5基于DOM的

7、網(wǎng)上股評(píng)信息提取25-322.5.1動(dòng)態(tài)HTML文檔對(duì)象模型26-272.5.2信息提取過(guò)程27-282.5.3提取模式28-32第3章股評(píng)特征信息提取32-443.1網(wǎng)上股評(píng)特征信息分析32-403.1.1從股評(píng)信息中提取特征詞32-393.1.2從股評(píng)信息中提取出建議詞39-403.2網(wǎng)上股評(píng)特征信息的歸類(lèi)40-413.3股評(píng)特征信息提取41-44第4章股評(píng)信息提取模塊的設(shè)計(jì)與實(shí)現(xiàn)44-544.1模塊的開(kāi)發(fā)平臺(tái)444.2模塊設(shè)計(jì)

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。