資源描述:
《數(shù)據(jù)挖掘中的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)模型優(yōu)化研究與應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、長(zhǎng)沙交通學(xué)院碩士學(xué)位論文數(shù)據(jù)挖掘中的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)模型優(yōu)化研究與應(yīng)用姓名:羅海蛟申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:傅明;史長(zhǎng)瓊20030501摘要近年柬,數(shù)據(jù)挖掘引起了信息產(chǎn)業(yè)界的極大關(guān)注,其主要原因是存在大量數(shù)掘,可以『l‘泛使用,并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí)。數(shù)據(jù)挖掘是信息技術(shù)自然演化的結(jié)果。目日d數(shù)據(jù)挖掘技術(shù)已成為機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)系統(tǒng)、人工智能等領(lǐng)域內(nèi)熱門的研究方向。貝葉斯【Bayesian)網(wǎng)絡(luò)近年成為數(shù)據(jù)挖掘引人注目的研究方向。與數(shù)據(jù)挖掘其它方法相比,貝葉斯網(wǎng)絡(luò)的優(yōu)點(diǎn)是可以綜合先驗(yàn)信息和樣本信息,這在樣本難得
2、H寸特另IJ有用:可以發(fā)現(xiàn)數(shù)據(jù)之間的因果關(guān)系,適合于處理不完整數(shù)據(jù)集,這是其它模型難以做到的。貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)也就是要找出一個(gè)能夠最真實(shí)反映現(xiàn)有數(shù)據(jù)集巾各數(shù)據(jù)變量相互之間的依賴關(guān)系的貝葉斯網(wǎng)絡(luò)模型。本文提出了一個(gè)貝葉斯網(wǎng)絡(luò)學(xué)習(xí)模型的優(yōu)化策略,即概念層次+(MIAC方法+JieCheng&DavidBell算法)+BC算法,對(duì)在不完整數(shù)據(jù)集和存在連續(xù)屬性的情況下貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)做了些小小的研究工作(在本文中著重研究了貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方面)。在第三章中,將面向?qū)傩詺w納中的概念層次方法B1入到學(xué)習(xí)模型中,通過(guò)大量文獻(xiàn)閱讀,將文獻(xiàn)中的AGHC算法和AGP
3、C算法引入到本文中,經(jīng)比較分析,選取了效率更好的AGPC算法作為我們的自動(dòng)分層算法,為貝葉斯網(wǎng)絡(luò)學(xué)習(xí)用于連續(xù)屬性數(shù)據(jù)的提供了一點(diǎn)可供借鑒的小經(jīng)驗(yàn)?;谙嚓P(guān)性分析的BN學(xué)習(xí)算法和基于記分搜索的BN學(xué)習(xí)算法各有其優(yōu)缺點(diǎn),本文將兩者結(jié)合,即采用JieCheng&DavidBell算法學(xué)習(xí)BN結(jié)構(gòu)和BC算法用于不完整數(shù)據(jù)下的BN參數(shù)學(xué)習(xí)。本文對(duì)JieCheng&DavidBell算法進(jìn)行了局部的小優(yōu)化,使之效率更高,并借鑒BC算法思想提}}_j了一種互信息近似計(jì)算的方法(MIAC,MutualInformationApproximateComputatio
4、n),其可用于基于相關(guān)性分析的算法,對(duì)在不完整數(shù)據(jù)集下學(xué)習(xí)貝葉斯網(wǎng)絡(luò)結(jié)陶還是有一些實(shí)用意義;最后通過(guò)基于本文的一個(gè)課題,給出了貝葉斯網(wǎng)絡(luò)學(xué)習(xí)在一個(gè)EPAD系統(tǒng)中的應(yīng)用。關(guān)鍵詞:數(shù)據(jù)挖掘,概念層次,面向?qū)傩詺w納,貝葉斯網(wǎng)絡(luò)Abstract111emajorreasonthatdatamininghasattractedagreatdealofattentionintheinformationindustryinrecentyearsisduetothewideavailabilityofhugeamountsofdataandtlleimminent
5、needforturningsuchdataintoilse如linformationandknowledge.Dataminingcallbeviewedasaresultofthenaturalevolutionofinformationtechnology.Nowdataminingtechniqueshavebeenakeytopicintheareasofstatistics,machinelearning,databasesystems,artificialintelligenceetc.Bayesiannetworkapproache
6、shavebecomeallimportantresearchdirectioninDatamining.Comparedwithotherapproachesusedfordatamining,Bayesiannetworkscallcombinepriorknowledgewithobserveddata.whichisveryimportantwhen,dataisscarceorveryexpensive.Moreover,BayesiannenNorksCalldiscovercausalrelationshipsamongdataand
7、handleincompletedataset,whichothermethodsCannotdo.LearningofBayesiannetworkistofindoutanetworkmodelthatbestrepresentsthedependentrelationshipsofthevariablesinadataset.Inthispaper,allimprovedmodeloflearningofBayesiannetworkshasbeenproposed,namelyconcepthierarchies+(MIACmethod+J
8、ieCheng&DavidBellaalgorithm)+BCalgorithmwhichRelativelyfineso