資源描述:
《完全信息靜態(tài)博弈與納什均衡解》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、第四章完全信息動態(tài)博弈及其均衡解1.完全且完美信息動態(tài)博弈完全信息博弈指的是參與者的收益是共同知識。完全且完美信息動態(tài)博弈指的是:博弈中的每一步中參與人都知道這一步之前博弈進行的整個過程。因此,我完全且完美信息動態(tài)博弈的特點:(1)行動是順序發(fā)生的;(2)下一步行動選擇之前所有以前的行動都可以被觀察到;(3)每一可能的行動組合下的參與人的收益都是公共知識。而不完美信息博弈指的是,在某一步參與人不知道以往博弈所進行的歷史或者沒有觀察到以往的所有行動。例4.1.我們來考慮這樣一個動態(tài)博弈:假定甲在開采一個價值4萬元的金礦時需要1萬元資金,乙有1萬元資金。甲向乙借錢來開金礦。在這個博弈的第一階
2、段,甲向乙承諾:如果乙借錢給他的話,那么他就會將采到的金子與乙對半分成,即(2,3)——乙得到2萬元的金子,同時收回自己的1萬元投資。對于甲的承諾,乙如果不借錢給甲的話,那么博弈到此為止,雙方收益為(0,1)。如果乙借錢給甲的話,那么博弈進入第二個階段。在第二階段中,若甲遵守他的承諾,分給乙一半的金子,這樣兩人的收益為(2,3),其中1萬元為投資成本?!糐P3〗然而,若甲違背自己的承諾,博弈就會進入到第三個階段:如果乙同甲打官司,那么由于打官司費時費力,兩個人的收益為(0,1);若乙不打官司,那么兩個人的收益就為(5,0)。參見圖1。乙甲借不借甲乙分不分(0,1)乙乙(2,3)打官司不
3、打官司(1,2)(5,0)圖1.借錢博弈的博弈樹2.逆向歸納法與子博弈納什均衡解逆向歸納法(Backwardinduction)又稱逆推法,是指這樣一種動態(tài)博弈求解方法:從博弈的最后一步開始,計算最后一步的參與人的最優(yōu)行動,逐步逆推到博弈開始時進行第一步的參與人的最優(yōu)行動,從而確定每個參與人的最優(yōu)行動。在動態(tài)博弈中逆向歸納法能夠進行的前提:參與人是理性的——任何一步參與人都選擇最優(yōu)策略;理性是公共知識——參與人選擇最優(yōu)策略是其他人所能夠預測的。在完全且完美信息動態(tài)博弈中逆向歸納法能夠求得子博弈精煉納什解。..乙甲借╳不借甲乙分╳不分(0,1)乙乙(2,3)打官司╳不打官司(1,2)(5,
4、0)圖2.借錢博弈的逆向歸納法的求解過程在例4.1中這樣一個動態(tài)博弈,用逆向歸納法,我們就可以推知,如果甲做出“不分”的選擇,那么乙一定會選擇“打”官司。因為對于乙而言,打官司的收益為1,不打官司的收益是0,所以,作為一個理性人,乙一定會選擇打官司。而如果甲知道在“不分”的情況下乙必定選擇“打官司”,那么甲就一定會選擇“分”一半的金子給乙,因為對甲而言,“分”的收益是2,“不分”的收益是0。所以,甲的承諾是可置信的。而對于乙來說,他會選擇“借”,因為“借”的收益是3,“不借”的收益是1。因此,該博弈最終的子博弈精煉納什均衡點就是(2,3)。例4.2.斯坦克爾伯模型。兩個廠商壟斷某個市場
5、,其中廠商1處于支配地位,它先行動,然后從屬企業(yè)2后行動。假定市場需求函數(shù)為p=a-Q。廠商的單位產(chǎn)品的成本c。這些是企業(yè)1和2的公共知識。問:廠商1和2是如何決定的它們的生產(chǎn)產(chǎn)量的。假定廠商1和2所決定的產(chǎn)量分別為q1,q2。我們用逆向歸納法來求解。企業(yè)2后行動,對于企業(yè)1的任何行動,即任意給定的產(chǎn)量,企業(yè)2確定產(chǎn)量以使利潤最大,即使L2=p×q2-c×q2最大。假定企業(yè)1決定的產(chǎn)量為q1,因為:L2=p×q2-c×q2=(a-q1-q2)×q2-c×q2由dL2/dq2=0:q1-2q2=a-c(1)即:q2=(q1-a+c)/2企業(yè)1先行動,它能夠預知企業(yè)2的最優(yōu)化行為,即在它的最
6、優(yōu)產(chǎn)量q1..給定的情況下,企業(yè)將按照q2=(q1-a+c)/2進行決策。這樣,企業(yè)的利潤函數(shù)為:L1=p×q1-c×q1=(a-q1-q2)×q1-c×q1=(a-q1-q2)×q1-c×q1而q2是q1如下的函數(shù):q2=(q1-a+c)/2由dL1/dq1=0:q1*=(a-c)/2于是,q2*=(a-c)/4因此,((a-c)/2,(a-c)/4)為逆向歸納法解。該解被稱為子博弈精煉納什均衡解。此時總產(chǎn)量為q2=3(a-c)/4,價格為(a+3c)/4企業(yè)1的利潤L1=(a-c)2/8企業(yè)2的利潤為L2=(a-c)2/16請讀者與古諾均衡解進行比較。3.動態(tài)博弈中的威脅與承諾為了實
7、現(xiàn)最大利益,使博弈在博弈參與人所希望的策略組合上實現(xiàn),在他人作出行動之前的每一步參與人都會向對方可能做出某種威脅或承諾,希望對方做出或者不做出某個行動。而通過逆向歸納法我們能夠區(qū)別動態(tài)博弈中威脅或承諾是否可信。例4.1:甲向乙承諾:借錢給我,我賺錢后將分給你。甲的承諾是可信的。乙威脅甲:若你不分給我,我將起訴你。乙的威脅也是可信的。之所以發(fā)生威脅與承諾的言語現(xiàn)象,是因為輪到他人行動的時候,參與人只能通過言語而影響他人的行動從而實現(xiàn)自