資源描述:
《基于領(lǐng)域知識的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、合肥工業(yè)大學(xué)碩士學(xué)位論文基于領(lǐng)域知識的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)研究姓名:莫富強(qiáng)申請學(xué)位級別:碩士專業(yè):計算機(jī)軟件與理論指導(dǎo)教師:王浩20080401基于領(lǐng)域知識的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)研究摘要貝葉斯網(wǎng)是圖形表示和概率知識的有機(jī)結(jié)合,它揭示了領(lǐng)域?qū)ο蟮膬?nèi)在聯(lián)系,是復(fù)雜全概率分布的緊湊表達(dá)方式。其堅實的理論基礎(chǔ),知識結(jié)構(gòu)的自然表述,靈活的推理能力以及方便的決策機(jī)制使其應(yīng)用范圍越來越廣泛。通常具有少數(shù)節(jié)點的網(wǎng)絡(luò)由專家構(gòu)建是準(zhǔn)確和高效的,但是當(dāng)節(jié)點規(guī)模大幅度增加時,由專家構(gòu)建網(wǎng)絡(luò)是既費時又費力的,而實踐中一般難以獲取大量的數(shù)據(jù),即使擁有足夠的
2、數(shù)據(jù),但沒有領(lǐng)域知識的指導(dǎo),學(xué)習(xí)算法也難以收斂到正確的網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)。鑒于此,本文嘗試在貝葉斯網(wǎng)絡(luò)學(xué)習(xí)算法中引入領(lǐng)域知識,以提高算法的學(xué)習(xí)精度和執(zhí)行效率。本文的主要內(nèi)容如下:(1)貝葉斯網(wǎng)絡(luò)的概述。全面介紹和分析了貝葉斯網(wǎng)絡(luò)的研究背景、研究現(xiàn)狀和研究趨勢:貝葉斯網(wǎng)絡(luò)的基本原理;貝葉斯網(wǎng)絡(luò)的典型學(xué)習(xí)算法。(2)EM算法是動態(tài)貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的一種主要方法,收斂速度慢,算法執(zhí)行效率低是其主要缺點。本文通過將大規(guī)模時序數(shù)據(jù)集劃分為較小的數(shù)據(jù)塊,并通過塊間的循環(huán)迭代,增量式地更新似然函數(shù)和網(wǎng)絡(luò)參數(shù),對傳統(tǒng)的EM算法進(jìn)行
3、了改進(jìn)。實驗表明改進(jìn)的DA.EM算法在保證結(jié)果精度的前提下,在時間性能上有較大的提高。(3)SEM算法雖可用于具有缺省數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí),卻需要用大的iJtI練樣本集來改善算法本身存在的一些缺陷,如:學(xué)習(xí)精度不夠高、算法收斂速度慢和容易陷入局部最優(yōu)。而現(xiàn)實中,很難搜集到足夠多的訓(xùn)練樣本。本文提出結(jié)構(gòu)學(xué)習(xí)改進(jìn)算法KB.SEM,將專家知識以禁忌表的形式融入SEM算法中,以約束算法的搜索空間,達(dá)到提高SEM算法精度的目的。實驗表明,KB.SEM算法能夠顯著提高SEM算法的執(zhí)行效率,并在一定程度上改善算法的時間性能,
4、克服算法的局部最優(yōu),避免主觀偏見和數(shù)據(jù)噪音給學(xué)習(xí)結(jié)果帶來的片面性,產(chǎn)生一個對專家有高接受度的網(wǎng)絡(luò)。關(guān)鍵詞:貝葉斯網(wǎng)絡(luò),領(lǐng)域知識,參數(shù)學(xué)習(xí),結(jié)構(gòu)學(xué)習(xí),D.S證據(jù)理論TheResearchofBayesianNetworksLearningBasedonDomainKnowledgeABSTRACTBayesiannetworkisthedirectlygraphicrepresentation,itvividlydescribethecorrespondingfieldthing’Sdegreeofrelative.T
5、heBayesiannetworkcanreasonandpredictsomething,anditisamainmethoddealingwithuncertainfact.Usuallyexpertscanconstructafittingnetworkaccordingtotheirknowledge,however,constructingnetworkistime··consumingandlabor--consumingforcomplicatednetworks.Ifanexpertwascarele
6、ss,hewillconstructawrongnetwork.Wecannotacquireenoughdatabyobservationintheworld.Althoughenoughdadaisobtained,wecouldn’tmakethelearningalgorithmconvergetothecorrectBayesiannetworkwithoutdomainknowledge.Becauseofthemethodconsideredabove。domainknowledgeiSintroduc
7、edinthelearningalgorithminthisdissertationinordertoimprovetheprecisionandthespeedeffectively.Themaincontentsofthisdissertationareasfollows:(1)ThisdissertationmakesasurveyabouttheresearchonBayesiannetworks,includingthebackground,thecurrentresearchstateanddevelop
8、menttrendofBayesiannetworks,thebasicprincipleofBayesiannetworks,theintroductionandanalysisoftheclassicalgorithmsforinferringandlearningofBayesiannetworks.(2)TheEMalgorithmis