基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf

基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf

ID:57924619

大小:2.94 MB

頁數(shù):11頁

時間:2020-04-14

基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf_第1頁
基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf_第2頁
基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf_第3頁
基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf_第4頁
基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf_第5頁
資源描述:

《基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、研究與開發(fā)基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法琚春華,鄒江波(1.浙江工商大學信息學院杭州310018;2.浙江工商大學現(xiàn)代商貿(mào)研究中心杭州310000)摘要:對分類器之間的差異性進行了研究,提出了一種基于信息熵差異性度量的增量集成分類算法,將信息熵差異性度量方法融人到基分類器選擇過程中,通過對訓練數(shù)據(jù)集的基分類結(jié)果的信息熵差異度計算,采用循環(huán)迭代優(yōu)化的選擇方法,以熵差異性最優(yōu)化為約束目標,動態(tài)調(diào)整基分類器個數(shù),實現(xiàn)了分類準確穩(wěn)定,減少了系統(tǒng)開銷。通過實驗比對,證明了算法在數(shù)據(jù)流處理時比其他算法具

2、有更小的開銷和較強的適應(yīng)性。關(guān)鍵詞:集成分類器;差異性度量;信息熵;增量集成;數(shù)據(jù)流doi:10.11959/j.issn.1000—0801.2015014AnIncrementalClassificationAlgorithmforDataStreamBasedonInformationEntropyDiversityMeasureJuChunhua,_.ZouJiangbo,f1.SchoolofComputerScience&InformationEngineering,Hangzhou31001

3、8,China;2.CenterforStudiesofModemBusiness,ZhejiangGongshangUniversity,Hangzhou310018,China)Abstract:Thediversitybetweenclassifierswasstudiedandanincrementalclassificationalgorithmfordatastreambasedoninformationentropydiversitymeasurewasproposed,themethodo

4、finformationentropydiversitymeasurewasintegratedintotheselectionprocessofbaseclassifiers,theinformationentropydiversityofbaseclassifierwhichtrainedfromtrainingdatawascalculated,bymeansofcycliciterativeasoptimizationmethodandentropydiversityasoptimizationc

5、onstrainedgoal,thenumbersofbaseclassifierswasdynamicadjustedthatimprovedtheclassificationaccuracyandstabilitytoreducesystemcosts.Theexperimentsprovethatthealgorithmhaslesscostandstrongadaptabilitycomparewithotherdatastreamalgorithmwhenprocessingdatastream

6、.Keywords:ensembleclassifier,diversitymeasure,entropyofinformation,incrementalensemble,datastream等靜態(tài)數(shù)據(jù)集與動態(tài)數(shù)據(jù)流挖掘分析領(lǐng)域,尤其是運用集1引言成學習思想對數(shù)據(jù)流動態(tài)分類的研究已成為目前熱點之一。自Hansen和Salamon于1990年首次提出神經(jīng)網(wǎng)絡(luò)集參考文獻【l】提出了將Boosting算法應(yīng)用于數(shù)據(jù)流分成的概念以來.集成學習方法被國內(nèi)外許多學者應(yīng)用于文類過程中,通過對數(shù)據(jù)樣本動態(tài)分配權(quán)重,實現(xiàn)

7、了具有自本分類、語音識別、地震波分析、通信網(wǎng)絡(luò)、網(wǎng)上交易日志適應(yīng)數(shù)據(jù)流動態(tài)變化和噪聲數(shù)據(jù)流的集成分類挖掘方法。收稿日期:2014—09—13;修回日期:2014一l1一o4基金項目:國家科技支撐計劃基金資助項目(No.2012BAI34B01.5),浙江省自然科學基金資助項目(No.LY14F020002),教育部人文社會科學重點研究基地基金資助項目(No.14JJD630011)FoundationItems:TheNationalKeyTechnologyR&DProgram(No.2012BAI34

8、B01—5),TheNaturalScienceFoundationofZhejiangProvinceofChina(No.LY14F020002),TheKeyMinistryofEducation,HumanitiesandSocialSciencesProject(No.14JJD630011)_考鏘參考文獻f21提出了通過動態(tài)修改多分類器中決策權(quán)值參是針對數(shù)據(jù)流挖掘,本文基于分類器中信息熵差異性度數(shù),增強對數(shù)據(jù)流突變

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。