資源描述:
《基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、研究與開發(fā)基于信息熵差異性度量的數(shù)據(jù)流增量集成分類算法琚春華,鄒江波(1.浙江工商大學信息學院杭州310018;2.浙江工商大學現(xiàn)代商貿(mào)研究中心杭州310000)摘要:對分類器之間的差異性進行了研究,提出了一種基于信息熵差異性度量的增量集成分類算法,將信息熵差異性度量方法融人到基分類器選擇過程中,通過對訓練數(shù)據(jù)集的基分類結(jié)果的信息熵差異度計算,采用循環(huán)迭代優(yōu)化的選擇方法,以熵差異性最優(yōu)化為約束目標,動態(tài)調(diào)整基分類器個數(shù),實現(xiàn)了分類準確穩(wěn)定,減少了系統(tǒng)開銷。通過實驗比對,證明了算法在數(shù)據(jù)流處理時比其他算法具
2、有更小的開銷和較強的適應(yīng)性。關(guān)鍵詞:集成分類器;差異性度量;信息熵;增量集成;數(shù)據(jù)流doi:10.11959/j.issn.1000—0801.2015014AnIncrementalClassificationAlgorithmforDataStreamBasedonInformationEntropyDiversityMeasureJuChunhua,_.ZouJiangbo,f1.SchoolofComputerScience&InformationEngineering,Hangzhou31001
3、8,China;2.CenterforStudiesofModemBusiness,ZhejiangGongshangUniversity,Hangzhou310018,China)Abstract:Thediversitybetweenclassifierswasstudiedandanincrementalclassificationalgorithmfordatastreambasedoninformationentropydiversitymeasurewasproposed,themethodo
4、finformationentropydiversitymeasurewasintegratedintotheselectionprocessofbaseclassifiers,theinformationentropydiversityofbaseclassifierwhichtrainedfromtrainingdatawascalculated,bymeansofcycliciterativeasoptimizationmethodandentropydiversityasoptimizationc
5、onstrainedgoal,thenumbersofbaseclassifierswasdynamicadjustedthatimprovedtheclassificationaccuracyandstabilitytoreducesystemcosts.Theexperimentsprovethatthealgorithmhaslesscostandstrongadaptabilitycomparewithotherdatastreamalgorithmwhenprocessingdatastream
6、.Keywords:ensembleclassifier,diversitymeasure,entropyofinformation,incrementalensemble,datastream等靜態(tài)數(shù)據(jù)集與動態(tài)數(shù)據(jù)流挖掘分析領(lǐng)域,尤其是運用集1引言成學習思想對數(shù)據(jù)流動態(tài)分類的研究已成為目前熱點之一。自Hansen和Salamon于1990年首次提出神經(jīng)網(wǎng)絡(luò)集參考文獻【l】提出了將Boosting算法應(yīng)用于數(shù)據(jù)流分成的概念以來.集成學習方法被國內(nèi)外許多學者應(yīng)用于文類過程中,通過對數(shù)據(jù)樣本動態(tài)分配權(quán)重,實現(xiàn)
7、了具有自本分類、語音識別、地震波分析、通信網(wǎng)絡(luò)、網(wǎng)上交易日志適應(yīng)數(shù)據(jù)流動態(tài)變化和噪聲數(shù)據(jù)流的集成分類挖掘方法。收稿日期:2014—09—13;修回日期:2014一l1一o4基金項目:國家科技支撐計劃基金資助項目(No.2012BAI34B01.5),浙江省自然科學基金資助項目(No.LY14F020002),教育部人文社會科學重點研究基地基金資助項目(No.14JJD630011)FoundationItems:TheNationalKeyTechnologyR&DProgram(No.2012BAI34
8、B01—5),TheNaturalScienceFoundationofZhejiangProvinceofChina(No.LY14F020002),TheKeyMinistryofEducation,HumanitiesandSocialSciencesProject(No.14JJD630011)_考鏘參考文獻f21提出了通過動態(tài)修改多分類器中決策權(quán)值參是針對數(shù)據(jù)流挖掘,本文基于分類器中信息熵差異性度數(shù),增強對數(shù)據(jù)流突變