資源描述:
《完全信息靜態(tài)博弈納什均衡解》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、第四章完全信息動(dòng)態(tài)博弈及其均衡解1.完全且完美信息動(dòng)態(tài)博弈完全信息博弈指的是參與者的收益是共同知識(shí)。完全且完美信息動(dòng)態(tài)博弈指的是:博弈中的每一步中參與人都知道這一步之前博弈進(jìn)行的整個(gè)過(guò)程。因此,我完全且完美信息動(dòng)態(tài)博弈的特點(diǎn):(1)行動(dòng)是順序發(fā)生的;(2)下一步行動(dòng)選擇之前所有以前的行動(dòng)都可以被觀察到;(3)每一可能的行動(dòng)組合下的參與人的收益都是公共知識(shí)。而不完美信息博弈指的是,在某一步參與人不知道以往博弈所進(jìn)行的歷史或者沒(méi)有觀察到以往的所有行動(dòng)。例4.1.我們來(lái)考慮這樣一個(gè)動(dòng)態(tài)博弈:假定甲在開(kāi)采一個(gè)價(jià)值4萬(wàn)元的金礦時(shí)需要1萬(wàn)元資金,乙有1萬(wàn)元資金。甲向乙借
2、錢(qián)來(lái)開(kāi)金礦。在這個(gè)博弈的第一階段,甲向乙承諾:如果乙借錢(qián)給他的話(huà),那么他就會(huì)將采到的金子與乙對(duì)半分成,即(2,3)——乙得到2萬(wàn)元的金子,同時(shí)收回自己的1萬(wàn)元投資。對(duì)于甲的承諾,乙如果不借錢(qián)給甲的話(huà),那么博弈到此為止,雙方收益為(0,1)。如果乙借錢(qián)給甲的話(huà),那么博弈進(jìn)入第二個(gè)階段。在第二階段中,若甲遵守他的承諾,分給乙一半的金子,這樣兩人的收益為(2,3),其中1萬(wàn)元為投資成本。〖JP3〗然而,若甲違背自己的承諾,博弈就會(huì)進(jìn)入到第三個(gè)階段:如果乙同甲打官司,那么由于打官司費(fèi)時(shí)費(fèi)力,兩個(gè)人的收益為(0,1);若乙不打官司,那么兩個(gè)人的收益就為(5,0)。參見(jiàn)
3、圖1。乙甲借不借甲乙分不分(0,1)乙乙(2,3)打官司不打官司(1,2)(5,0)圖1.借錢(qián)博弈的博弈樹(shù)2.逆向歸納法與子博弈納什均衡解逆向歸納法(Backwardinduction)又稱(chēng)逆推法,是指這樣一種動(dòng)態(tài)博弈求解方法:從博弈的最后一步開(kāi)始,計(jì)算最后一步的參與人的最優(yōu)行動(dòng),逐步逆推到博弈開(kāi)始時(shí)進(jìn)行第一步的參與人的最優(yōu)行動(dòng),從而確定每個(gè)參與人的最優(yōu)行動(dòng)。在動(dòng)態(tài)博弈中逆向歸納法能夠進(jìn)行的前提:參與人是理性的——任何一步參與人都選擇最優(yōu)策略;理性是公共知識(shí)——參與人選擇最優(yōu)策略是其他人所能夠預(yù)測(cè)的。資料在完全且完美信息動(dòng)態(tài)博弈中逆向歸納法能夠求得子博弈精
4、煉納什解。乙甲借╳不借甲乙分╳不分(0,1)乙乙(2,3)打官司╳不打官司(1,2)(5,0)圖2.借錢(qián)博弈的逆向歸納法的求解過(guò)程在例4.1中這樣一個(gè)動(dòng)態(tài)博弈,用逆向歸納法,我們就可以推知,如果甲做出“不分”的選擇,那么乙一定會(huì)選擇“打”官司。因?yàn)閷?duì)于乙而言,打官司的收益為1,不打官司的收益是0,所以,作為一個(gè)理性人,乙一定會(huì)選擇打官司。而如果甲知道在“不分”的情況下乙必定選擇“打官司”,那么甲就一定會(huì)選擇“分”一半的金子給乙,因?yàn)閷?duì)甲而言,“分”的收益是2,“不分”的收益是0。所以,甲的承諾是可置信的。而對(duì)于乙來(lái)說(shuō),他會(huì)選擇“借”,因?yàn)椤敖琛钡氖找媸?,“
5、不借”的收益是1。因此,該博弈最終的子博弈精煉納什均衡點(diǎn)就是(2,3)。例4.2.斯坦克爾伯模型。兩個(gè)廠(chǎng)商壟斷某個(gè)市場(chǎng),其中廠(chǎng)商1處于支配地位,它先行動(dòng),然后從屬企業(yè)2后行動(dòng)。假定市場(chǎng)需求函數(shù)為p=a-Q。廠(chǎng)商的單位產(chǎn)品的成本c。這些是企業(yè)1和2的公共知識(shí)。問(wèn):廠(chǎng)商1和2是如何決定的它們的生產(chǎn)產(chǎn)量的。假定廠(chǎng)商1和2所決定的產(chǎn)量分別為q1,q2。我們用逆向歸納法來(lái)求解。企業(yè)2后行動(dòng),對(duì)于企業(yè)1的任何行動(dòng),即任意給定的產(chǎn)量,企業(yè)2確定產(chǎn)量以使利潤(rùn)最大,即使L2=p×q2-c×q2最大。假定企業(yè)1決定的產(chǎn)量為q1,因?yàn)椋篖2=p×q2-c×q2=(a-q1-q2
6、)×q2-c×q2由dL2/dq2=0:q1-2q2=a-c(1)即:q2=(q1-a+c)/2資料企業(yè)1先行動(dòng),它能夠預(yù)知企業(yè)2的最優(yōu)化行為,即在它的最優(yōu)產(chǎn)量q1給定的情況下,企業(yè)將按照q2=(q1-a+c)/2進(jìn)行決策。這樣,企業(yè)的利潤(rùn)函數(shù)為:L1=p×q1-c×q1=(a-q1-q2)×q1-c×q1=(a-q1-q2)×q1-c×q1而q2是q1如下的函數(shù):q2=(q1-a+c)/2由dL1/dq1=0:q1*=(a-c)/2于是,q2*=(a-c)/4因此,((a-c)/2,(a-c)/4)為逆向歸納法解。該解被稱(chēng)為子博弈精煉納什均衡解。此時(shí)總產(chǎn)量
7、為q2=3(a-c)/4,價(jià)格為(a+3c)/4企業(yè)1的利潤(rùn)L1=(a-c)2/8企業(yè)2的利潤(rùn)為L(zhǎng)2=(a-c)2/16請(qǐng)讀者與古諾均衡解進(jìn)行比較。3.動(dòng)態(tài)博弈中的威脅與承諾為了實(shí)現(xiàn)最大利益,使博弈在博弈參與人所希望的策略組合上實(shí)現(xiàn),在他人作出行動(dòng)之前的每一步參與人都會(huì)向?qū)Ψ娇赡茏龀瞿撤N威脅或承諾,希望對(duì)方做出或者不做出某個(gè)行動(dòng)。而通過(guò)逆向歸納法我們能夠區(qū)別動(dòng)態(tài)博弈中威脅或承諾是否可信。例4.1:甲向乙承諾:借錢(qián)給我,我賺錢(qián)后將分給你。甲的承諾是可信的。乙威脅甲:若你不分給我,我將起訴你。乙的威脅也是可信的。之所以發(fā)生威脅與承諾的言語(yǔ)現(xiàn)象,是因?yàn)檩喌剿诵袆?dòng)
8、的時(shí)候,參與人只能通過(guò)言語(yǔ)而影響他人的行動(dòng)從而實(shí)現(xiàn)自