資源描述:
《貝葉斯網(wǎng)絡(luò)與樸素貝葉斯》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、貝葉斯網(wǎng)絡(luò)與樸素貝葉斯張嶷2010-022021/6/101知識管理與數(shù)據(jù)分析實驗室一、貝葉斯法則問題如何判定一個人是好人還是壞人?2021/6/10知識管理與數(shù)據(jù)分析實驗室2好人總做一些好事?……壞人總做一些壞事?……人的主觀認識一、貝葉斯法則引言當你無法準確的知悉一個事物的本質(zhì)時,你可以依靠與事物特定本質(zhì)相關(guān)的事件出現(xiàn)的次數(shù)來判斷其本質(zhì)屬性的概率。如果你看到一個人總是做一些好事,那這個人就越可能是一個好人。數(shù)學語言表達就是:支持某項屬性的事件發(fā)生得越多,則該屬性成立的可能性就愈大貝葉斯法則2021/6/10知識管理與數(shù)據(jù)分析實驗室3一、貝葉斯法則起源貝葉斯法則來源于
2、英國數(shù)學家貝葉斯(ThomasBayes)在1763年發(fā)表的著作《論有關(guān)機遇問題的求解》。2021/6/10知識管理與數(shù)據(jù)分析實驗室4貝葉斯法則最初是一種用于概率論基礎(chǔ)理論的歸納推理方法,但隨后被一些統(tǒng)計學學者發(fā)展為一種系統(tǒng)的統(tǒng)計推斷方法,運用到統(tǒng)計決策、統(tǒng)計推斷、統(tǒng)計估算等諸多領(lǐng)域。一、貝葉斯法則貝葉斯公式貝葉斯公式定義一假定某個過程有若干可能的前提條件,則表示人們事先對前提條件Xi出現(xiàn)的可能性大小的估計,即先驗概率。定義二假定某個過程得到了結(jié)果A,則表示在出現(xiàn)結(jié)果A的前提下,對前提條件Xi出現(xiàn)的可能性大小的估計,即后驗概率。2021/6/10知識管理與數(shù)據(jù)分析實驗室
3、5一、貝葉斯法則算例全壟斷市場條件下,只有一家企業(yè)M提供產(chǎn)品和服務(wù)。企業(yè)K考慮是否進入該市場。同時,企業(yè)M為阻止K進入該市場采取了相應的投資行為,而K能否進入該市場完全取決于M為阻止其進入所花費的成本大小。假設(shè)K并不知道原壟斷者M是屬于高阻撓成本類型還是低阻撓成本類型,但能確定,如果M屬于高阻撓成本類型,K進入市場時M進行阻撓的概率是20%;如果M屬于低阻撓成本類型,K進入市場時M進行阻撓的概率是100%?,F(xiàn)設(shè)K認為M屬于高阻撓成本企業(yè)的概率為70%,而在K進入市場后,M確實進行了商業(yè)阻撓。試以企業(yè)K的角度,判斷企業(yè)M為高阻撓成本類型的概率。2021/6/10知識管理與
4、數(shù)據(jù)分析實驗室6一、貝葉斯法則算例利用貝葉斯公式建模:前提條件:設(shè)M是高阻撓成本類型為X1,低阻撓成本類型為X2;結(jié)果:M對K進行阻撓為A;所求概率即為在已知結(jié)果A的情況下,推斷條件為X1的后驗概率;已知為0.2,為1,P(X1)為0.7,P(X2)為0.3。2021/6/10知識管理與數(shù)據(jù)分析實驗室7一、貝葉斯法則算例即,根據(jù)實際市場的運作情況,企業(yè)K可判斷企業(yè)M為高阻撓成本類型的概率為0.32,換句話說,企業(yè)M更可能屬于低阻撓成本類型。2021/6/10知識管理與數(shù)據(jù)分析實驗室8根據(jù)貝葉斯公式可計算:二、貝葉斯網(wǎng)絡(luò)引言貝葉斯網(wǎng)絡(luò)又稱為信度網(wǎng)絡(luò),是基于概率推理的圖形化
5、網(wǎng)絡(luò)。它是貝葉斯法則的擴展,而貝葉斯公式則是這個概率網(wǎng)絡(luò)的基礎(chǔ)。貝葉斯網(wǎng)絡(luò)適用于表達和分析不確定性和概率性事件,應用于有條件地依賴多種控制因素的決策過程,可以從不完全、不精確或不確定的知識或信息中做出推理。2021/6/10知識管理與數(shù)據(jù)分析實驗室9二、貝葉斯網(wǎng)絡(luò)引言貝葉斯網(wǎng)絡(luò)由JudeaPearl于1988年提出,最初主要用于處理人工智能中的不確定信息。隨后,逐步成為處理不確定性信息技術(shù)的主流,并在文本分類、字母識別、經(jīng)濟預測、醫(yī)療診斷、工業(yè)控制等領(lǐng)域得到了廣泛的應用。目前,貝葉斯網(wǎng)絡(luò)是不確定知識表達和推理領(lǐng)域最有效的理論模型之一。2021/6/10知識管理與數(shù)據(jù)分析
6、實驗室10二、貝葉斯網(wǎng)絡(luò)定義符號B(D,G)表示一個貝葉斯網(wǎng)絡(luò),包括兩個部分:一個有向無環(huán)圖(DirectedAcyclicGraph,DAG)。它由代表變量的節(jié)點及連接這些節(jié)點的有向邊構(gòu)成。其中,節(jié)點代表隨機變量,可以是任何問題的抽象,如:測試值、觀測現(xiàn)象、意見征詢等;節(jié)點間的有向邊代表了節(jié)點間的互相關(guān)系(由父節(jié)點指向其后代節(jié)點)。2021/6/10知識管理與數(shù)據(jù)分析實驗室11ABC二、貝葉斯網(wǎng)絡(luò)定義一個節(jié)點與節(jié)點之間的條件概率表(ConditionalProbabilityTable,CPT)。如果節(jié)點沒有任何父節(jié)點,則該節(jié)點概率為其先驗概率。否則,該節(jié)點概率為其在
7、父節(jié)點條件下的后驗概率。2021/6/10知識管理與數(shù)據(jù)分析實驗室12實際類型ABCDA0.80.10.050.05B0.20.650.10.05C0.250.10.600.05D0.050.10.150.7目標類型二、貝葉斯網(wǎng)絡(luò)定義數(shù)學定義:貝葉斯網(wǎng)絡(luò)B(D,P),D表示一個有向無環(huán)圖,是條件概率分布的集合,其中是D中節(jié)點Xi的父節(jié)點集合。在一個貝葉斯網(wǎng)絡(luò)中,節(jié)點集合,則其聯(lián)合概率分布P(X)是此貝葉斯網(wǎng)絡(luò)中所有條件分布的乘積:2021/6/10知識管理與數(shù)據(jù)分析實驗室13二、貝葉斯網(wǎng)絡(luò)定義這是一個最簡單的包含3個節(jié)點的貝葉斯網(wǎng)絡(luò)。其中