資源描述:
《第29章 博弈論的應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第29章博弈論的應(yīng)用本章主要研究博弈論中的4個(gè)非常重要的問題:合作問題、競爭問題、共存問題和承諾問題。一、博弈論分析的重要工具1、最優(yōu)反應(yīng)曲線在兩個(gè)人的博弈中,假如存在一個(gè)納什均衡,這個(gè)納什均衡可以如下表示:假設(shè)參與人A的選擇為r1,r2,…,rr,參與人B的選擇為c1,c2,…,cc。對于參與人A的每一個(gè)選擇r,bc(r)表示參與人B的最優(yōu)反應(yīng)。相應(yīng)地,對于參與人B的每一個(gè)選擇r,br(c)表示參與人A的最優(yōu)反應(yīng)。納什均衡為:c*=bc(r),r*=br(c)——反應(yīng)函數(shù)即:每個(gè)人的選擇正好是對方對自己預(yù)期的選擇—
2、—“相互一致”。根據(jù)以上函數(shù)可以得到反應(yīng)曲線。2、混合策略在以下收益矩陣,我們令參與人A選擇“上”的概率為r,選擇“下”的概率為1-r,同樣,我們令參與人B選擇“左”的概率為c,選擇“右”的概率為1-c。當(dāng)r和c等于0時(shí),相應(yīng)的策略為純策略。根據(jù)收益矩陣和參與人選擇的概率,可以得到參與人的期望收益。同學(xué)A同學(xué)B上下左右2,10,00,01,2根據(jù)上表,參與人A的期望收益為:2rc+(1-r)(1-c)。即:2rc+1-r-c+rc。如果r增加了△r,A的收益變化為:2c△r-△r+c△r=(3c-1)△r。即如果3c
3、>1時(shí),A將增加r,如果3c<1,A將減少r,如果3c=1時(shí),他對于任意的0≤r≤1無差異。組合概率參與人A的收益上,左rc2下,左(1-r)c0上,右r(1-c)0下,右(1-r)(1-c)1根據(jù)同樣的方法,得到參與人B的期望受益:cr+2(1-c)(1-r)。當(dāng)c增加△c時(shí),B的收益變化為:(3r-2)△c。因此,當(dāng)r>2/3時(shí),B增加c將增加收益;當(dāng)r<2/3時(shí),B將減少c;當(dāng)r=2/3時(shí),他對于任意的0≤c≤1無差異。利用以上兩個(gè)結(jié)論可以繪制參與人的最優(yōu)反映曲線。如果參與人B選擇c=0,那么參與人A將減少r,
4、使r盡可能小,所以r=0。因此,參與人A使r=0就是對c=0的最優(yōu)反應(yīng)。并且,r=0一直都是A的最優(yōu)反應(yīng),直至c=1/3。當(dāng)c=1/3,0≤r≤1都是A的最優(yōu)反應(yīng)。對于所有的c>1/3,行參與人的最優(yōu)反應(yīng)是r=1。?0?c1/3r1?1?A的反映曲線?2/3?B的反映曲線???三個(gè)紫色的點(diǎn)為納什均衡,兩個(gè)為純策略均衡。二、合作博弈又稱協(xié)調(diào)博弈,在這類博弈中,當(dāng)參與人能夠協(xié)調(diào)他們之間的策略時(shí),他們的收益就會最大。關(guān)鍵是如何創(chuàng)建這種協(xié)調(diào)機(jī)制。1、性別戰(zhàn)假設(shè)有一個(gè)男孩和一個(gè)女孩約會看電影,但他們事先沒有約好看哪一部電影,而
5、且都忘了對方的電話號碼,所以沒有辦法協(xié)調(diào)他們的約會,只能猜測對方喜歡看那一部電影。男孩想看最新推出的動(dòng)作片,女孩喜歡看文藝片,但他們都寧愿看同一部電影也不愿意放棄約會。協(xié)調(diào)博弈的特征:參與人在協(xié)調(diào)行動(dòng)時(shí)獲得的收益要大于單獨(dú)行動(dòng)時(shí)的收益。性別戰(zhàn)的納什均衡在以下的收益矩陣中,可以用上一節(jié)中的反應(yīng)曲線來求解納什均衡。根據(jù)上節(jié)的結(jié)論,存在三個(gè)納什均衡:上方都選擇動(dòng)作片或文藝片,或者雙方分別按2/3的概率選擇各自偏好的影片。究竟哪種均衡會發(fā)生,要依據(jù)特殊情況而定。當(dāng)參與人完全有理由相信,其中的一個(gè)均衡相對于其他的均衡更“自然”
6、,這個(gè)均衡將是最終的選擇點(diǎn),被稱為博弈的聚點(diǎn)。男孩女孩動(dòng)作片文藝片動(dòng)作片文藝片2,10,00,01,22、囚徒困境在該博弈中,坦白是一個(gè)占優(yōu)策略,但雙方都抵賴(協(xié)調(diào))是更好的選擇。協(xié)調(diào)能夠使囚徒獲得最大化的收益。解決囚徒困境的方法之一是無限重復(fù)博弈。參與人通過將來的行動(dòng)來獎(jiǎng)勵(lì)合作和懲罰不合作。另一種方式是締結(jié)合約(協(xié)調(diào))。雙方可以簽訂一份合同,如果一方違約,他將支付罰金或接受其他某種方式的懲罰。但這要依賴于能夠強(qiáng)制執(zhí)行這種合同的法律體制的存在。3、保證博弈類似囚徒困境,例如美國和蘇聯(lián)之間的軍備競賽。兩個(gè)國家都可以選擇
7、生產(chǎn)核導(dǎo)彈,也可以選擇都不生產(chǎn)。其收益矩陣如下圖。該圖顯示:存在兩個(gè)納什均衡(不生產(chǎn),不生產(chǎn))和(生產(chǎn),生產(chǎn))。但是,(不生產(chǎn),不生產(chǎn))對雙方都是一個(gè)較好的選擇。美國蘇聯(lián)不生產(chǎn)生產(chǎn)不生產(chǎn)生產(chǎn)4,41,33,12,2但問題在于,任何一方都不知道對方將會做出的選擇。在承諾不生產(chǎn)以前,每一方都想得到對方不會生產(chǎn)的保證。獲得這種保證的方法之一是其中一方先采取行動(dòng),并接受公開的檢查。這可以是一種單邊的行動(dòng),但他一定要讓對方相信自己的選擇。類似:戰(zhàn)國時(shí)期,皇太子做人質(zhì)。4、斗雞博弈即電影中的汽車博弈:兩個(gè)年輕人分別從一條街的兩頭
8、,駕車筆直地是向?qū)Ψ健5谝粋€(gè)轉(zhuǎn)向的人會顏面盡失,但如果沒有人轉(zhuǎn)向,將會撞在一起。其收益矩陣如下圖:存在兩個(gè)納什均衡:(不轉(zhuǎn)向,轉(zhuǎn)向)和(轉(zhuǎn)向,不轉(zhuǎn)向)。A偏好第一個(gè),B偏好第二個(gè)。但這兩個(gè)都比撞車好。它和保證博弈有所區(qū)別,雙方做不相同的事情比做相同的事情好。年輕人A年輕人B轉(zhuǎn)向不轉(zhuǎn)向轉(zhuǎn)向不轉(zhuǎn)向0,0-1,11,1-2,-2在這個(gè)博弈中,每個(gè)參與