資源描述:
《《貝葉斯統(tǒng)計》ppt課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、MCMC方法一、貝葉斯統(tǒng)計的框架分析困難:后驗分布是復(fù)雜的、高維的分布解決方法:馬爾可夫鏈蒙特卡羅(MCMC)方法后驗分布先驗信息似然函數(shù)目前,MCMC已經(jīng)成為一種處理復(fù)雜統(tǒng)計問題的特別流行的工具,尤其在經(jīng)常需要復(fù)雜的高維積分運算的貝葉斯分析領(lǐng)域更是如此。在那里,高維積分運算主要是用來求取普通方法無法得到的后驗分布密度。如果合理的定義和實施,MCMC總能得到一條或幾條收斂的馬爾可夫鏈,該馬爾可夫鏈的極限分布就是所需的后驗分布二、MCMC方法(一)預(yù)備知識二、MCMC方法二、MCMC方法(二)基本思想二、MCMC方法(三)常用MCMC算法Gibbs抽樣(吉布斯
2、采樣算法)二、MCMC方法二、MCMC方法立即更新的Gibbs抽樣每次迭帶的時候的一些元素已經(jīng)被跟新了,如果在更新其他的元素時不使用這些更新后的元素會造成一定程度的浪費。事實上,Gibbs抽樣可通過在每一步都利用近似得到的其他元素的值來獲得更好的效果。這種方法改進(jìn)了練的混合,換句話說,鏈能更加迅速,更加詳盡的搜索目標(biāo)分布的支撐空間。立即更新的Gibbs抽樣描述如下:(1)選擇初始值。(2)逐個生成。(3)增加m,返回第(2)步。二、MCMC方法Metropolis-Hastings抽樣二、MCMC方法二、MCMC方法二、MCMC方法二、MCMC方法三、MCM
3、C方法的收斂性診斷要多久鏈才可以不依賴于其初始值以及需要多久該鏈能完全挖掘目標(biāo)分布函數(shù)支撐的信息。在一個序列中觀測值之間要隔多遠(yuǎn)才可以看作是近似獨立的。該鏈?zhǔn)欠窠七_(dá)到其平穩(wěn)分布。觀察樣本路徑觀察自相關(guān)性圖方差比收斂性診斷診斷方法(1)觀察樣本路徑產(chǎn)生多條馬爾可夫鏈,觀察樣本路徑(對多個初始值產(chǎn)生多個馬爾可夫鏈)樣本路徑是一個描述迭代數(shù)對應(yīng)的實現(xiàn)圖。樣本路徑有時也稱為歷史圖。如果鏈的混合不是很好,那么在很多次迭代中它會取相同或者相近的數(shù)值。一個好的鏈能夠快速地遠(yuǎn)離初始值,無論以何值開始。歷史迭代圖不收斂收斂(2)觀察自相關(guān)性圖自相關(guān)性圖用于描述序列在不同迭代
4、延遲下的相關(guān)性,延遲i的自相關(guān)性是指相距i步的兩迭代之間的相關(guān)性。具有較差的性質(zhì)的鏈隨著迭代延遲的增加會表現(xiàn)出較慢的自相關(guān)衰弱。四、WinBUGS軟件包四、WinBUGS軟件包BayesBayes統(tǒng)計推斷Bayes統(tǒng)計推斷概述參數(shù)的Bayes點估計Bayes區(qū)間估計Bayes假設(shè)檢驗一Bayes統(tǒng)計推斷概述所研究的問題有一個確定的總體,其總體分布未知或部分未知,通過從該總體中抽取的樣本(觀測數(shù)據(jù))作出與未知分布有關(guān)的某種結(jié)論。目的:利用問題的基本假定及包含在觀測數(shù)據(jù)中的信息,作出盡量精確和可靠的結(jié)論。一Bayes統(tǒng)計推斷概述Bayes推斷二參數(shù)的Bayes點
5、估計樣本分布f(x
6、θ)中未知參數(shù)為θ;其中x=(x1,x2,…,xn)T;設(shè)θ的先驗分布為π(θ)。有Bayes公式,θ的后驗分布:這個后驗分布h(θ
7、x)是進(jìn)行θ的Bayes點估計的出發(fā)點。二參數(shù)的Bayes點估計(1)最大后驗估計設(shè)θ∈Θ,使后驗分布h(θ
8、x)達(dá)到最大值的點稱為θ的最大后驗估計,即:二參數(shù)的Bayes點估計(2)后驗均值估計(后驗期望估計)后驗分布h(θ
9、x)的均值稱為θ的后驗均值估計(或后驗期望估計),記為,即:二參數(shù)的Bayes點估計(3)后驗中位數(shù)估計若是后驗分布h(θ
10、x)的中位數(shù),則稱為θ的后驗中位數(shù)估計。即若則后驗分布中位
11、數(shù)估計二參數(shù)的Bayes點估計以上三種估計統(tǒng)稱θ的Bayes估計,記為或簡記為。它們皆是樣本觀察值x=(x1,x2,…,xn)T的函數(shù),即在一般場合下,這三種估計是不同的,當(dāng)后驗分布h(θ
12、x)對稱時,這三種估計是相等的。三Bayes區(qū)間估計經(jīng)典區(qū)間估計參數(shù)θ是未知常數(shù)(非隨機(jī)變量),其置信度為1-α的區(qū)間估計[θL,θU]滿足理解為進(jìn)行了大量重復(fù)試驗,隨機(jī)區(qū)間[θL,θU]包含常數(shù)θ的概率為1-α(θL,Θu樣本x的函數(shù),是隨機(jī)變量)。三Bayes區(qū)間估計經(jīng)典統(tǒng)計學(xué)中,對給定的樣本容量n,若進(jìn)行多次反復(fù)的抽樣,得到了眾多個不同的區(qū)間,其中每個區(qū)間,要么包含
13、θ的真值,要么不包含θ的真值。三Bayes區(qū)間估計Bayes區(qū)間估計參數(shù)θ是隨機(jī)變量,其后驗分布h(θ
14、x)(x是樣本觀測值),θ的可信度為1-α的區(qū)間估計滿足即在得到樣本觀測值x的條件下,隨機(jī)變量θ落入?yún)^(qū)間[θL,θU]的概率是1-α(θL,θU)樣本觀測值x的函數(shù),是確定的量)。三Bayes區(qū)間估計經(jīng)典統(tǒng)計學(xué)認(rèn)為,參數(shù)可以有一個取值范圍,但本身不具有隨機(jī)性,因此未知參數(shù)不是一個隨機(jī)變量,僅是一個未知數(shù)而已。這是經(jīng)典統(tǒng)計方法與Bayes統(tǒng)計方法的根本區(qū)別之一。三Bayes區(qū)間估計Beyas等尾可信區(qū)間θL=后驗分布h(θ
15、x)的α/2分位數(shù);θU=1-α/
16、2分位數(shù)。等尾可信區(qū)間常被采用,但不是最優(yōu)的,最優(yōu)可