博弈論的應(yīng)用

博弈論的應(yīng)用

ID:42007543

大?。?42.00 KB

頁數(shù):34頁

時間:2019-09-06

博弈論的應(yīng)用_第1頁
博弈論的應(yīng)用_第2頁
博弈論的應(yīng)用_第3頁
博弈論的應(yīng)用_第4頁
博弈論的應(yīng)用_第5頁
資源描述:

《博弈論的應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、第29章博弈論的應(yīng)用本章主要研究博弈論中的4個非常重要的問題:合作問題、競爭問題、共存問題和承諾問題。一、博弈論分析的重要工具1、最優(yōu)反應(yīng)曲線在兩個人的博弈中,假如存在一個納什均衡,這個納什均衡可以如下表示:假設(shè)參與人A的選擇為r1,r2,…,rr,參與人B的選擇為c1,c2,…,cc。對于參與人A的每一個選擇r,bc(r)表示參與人B的最優(yōu)反應(yīng)。相應(yīng)地,對于參與人B的每一個選擇r,br(c)表示參與人A的最優(yōu)反應(yīng)。納什均衡為:c*=bc(r),r*=br(c)——反應(yīng)函數(shù)即:每個人的選擇正好是對方對自己預(yù)期的選擇——

2、“相互一致”。根據(jù)以上函數(shù)可以得到反應(yīng)曲線。2、混合策略在以下收益矩陣,我們令參與人A選擇“上”的概率為r,選擇“下”的概率為1-r,同樣,我們令參與人B選擇“左”的概率為c,選擇“右”的概率為1-c。當(dāng)r和c等于0時,相應(yīng)的策略為純策略。根據(jù)收益矩陣和參與人選擇的概率,可以得到參與人的期望收益。同學(xué)A同學(xué)B上下左右2,10,00,01,2根據(jù)上表,參與人A的期望收益為:2rc+(1-r)(1-c)。即:2rc+1-r-c+rc。如果r增加了△r,A的收益變化為:2c△r-△r+c△r=(3c-1)△r。即如果3c>1

3、時,A將增加r,如果3c<1,A將減少r,如果3c=1時,他對于任意的0≤r≤1無差異。組合概率參與人A的收益上,左rc2下,左(1-r)c0上,右r(1-c)0下,右(1-r)(1-c)1根據(jù)同樣的方法,得到參與人B的期望受益:cr+2(1-c)(1-r)。當(dāng)c增加△c時,B的收益變化為:(3r-2)△c。因此,當(dāng)r>2/3時,B增加c將增加收益;當(dāng)r<2/3時,B將減少c;當(dāng)r=2/3時,他對于任意的0≤c≤1無差異。利用以上兩個結(jié)論可以繪制參與人的最優(yōu)反映曲線。如果參與人B選擇c=0,那么參與人A將減少r,使r盡

4、可能小,所以r=0。因此,參與人A使r=0就是對c=0的最優(yōu)反應(yīng)。并且,r=0一直都是A的最優(yōu)反應(yīng),直至c=1/3。當(dāng)c=1/3,0≤r≤1都是A的最優(yōu)反應(yīng)。對于所有的c>1/3,行參與人的最優(yōu)反應(yīng)是r=1。?0?c1/3r1?1?A的反映曲線?2/3?B的反映曲線???三個紫色的點為納什均衡,兩個為純策略均衡。二、合作博弈又稱協(xié)調(diào)博弈,在這類博弈中,當(dāng)參與人能夠協(xié)調(diào)他們之間的策略時,他們的收益就會最大。關(guān)鍵是如何創(chuàng)建這種協(xié)調(diào)機制。1、性別戰(zhàn)假設(shè)有一個男孩和一個女孩約會看電影,但他們事先沒有約好看哪一部電影,而且都忘了

5、對方的電話號碼,所以沒有辦法協(xié)調(diào)他們的約會,只能猜測對方喜歡看那一部電影。男孩想看最新推出的動作片,女孩喜歡看文藝片,但他們都寧愿看同一部電影也不愿意放棄約會。協(xié)調(diào)博弈的特征:參與人在協(xié)調(diào)行動時獲得的收益要大于單獨行動時的收益。性別戰(zhàn)的納什均衡在以下的收益矩陣中,可以用上一節(jié)中的反應(yīng)曲線來求解納什均衡。根據(jù)上節(jié)的結(jié)論,存在三個納什均衡:上方都選擇動作片或文藝片,或者雙方分別按2/3的概率選擇各自偏好的影片。究竟哪種均衡會發(fā)生,要依據(jù)特殊情況而定。當(dāng)參與人完全有理由相信,其中的一個均衡相對于其他的均衡更“自然”,這個均衡

6、將是最終的選擇點,被稱為博弈的聚點。男孩女孩動作片文藝片動作片文藝片2,10,00,01,22、囚徒困境在該博弈中,坦白是一個占優(yōu)策略,但雙方都抵賴(協(xié)調(diào))是更好的選擇。協(xié)調(diào)能夠使囚徒獲得最大化的收益。解決囚徒困境的方法之一是無限重復(fù)博弈。參與人通過將來的行動來獎勵合作和懲罰不合作。另一種方式是締結(jié)合約(協(xié)調(diào))。雙方可以簽訂一份合同,如果一方違約,他將支付罰金或接受其他某種方式的懲罰。但這要依賴于能夠強制執(zhí)行這種合同的法律體制的存在。3、保證博弈類似囚徒困境,例如美國和蘇聯(lián)之間的軍備競賽。兩個國家都可以選擇生產(chǎn)核導(dǎo)彈,

7、也可以選擇都不生產(chǎn)。其收益矩陣如下圖。該圖顯示:存在兩個納什均衡(不生產(chǎn),不生產(chǎn))和(生產(chǎn),生產(chǎn))。但是,(不生產(chǎn),不生產(chǎn))對雙方都是一個較好的選擇。美國蘇聯(lián)不生產(chǎn)生產(chǎn)不生產(chǎn)生產(chǎn)4,41,33,12,2但問題在于,任何一方都不知道對方將會做出的選擇。在承諾不生產(chǎn)以前,每一方都想得到對方不會生產(chǎn)的保證。獲得這種保證的方法之一是其中一方先采取行動,并接受公開的檢查。這可以是一種單邊的行動,但他一定要讓對方相信自己的選擇。類似:戰(zhàn)國時期,皇太子做人質(zhì)。4、斗雞博弈即電影中的汽車博弈:兩個年輕人分別從一條街的兩頭,駕車筆直地是

8、向?qū)Ψ?。第一個轉(zhuǎn)向的人會顏面盡失,但如果沒有人轉(zhuǎn)向,將會撞在一起。其收益矩陣如下圖:存在兩個納什均衡:(不轉(zhuǎn)向,轉(zhuǎn)向)和(轉(zhuǎn)向,不轉(zhuǎn)向)。A偏好第一個,B偏好第二個。但這兩個都比撞車好。它和保證博弈有所區(qū)別,雙方做不相同的事情比做相同的事情好。年輕人A年輕人B轉(zhuǎn)向不轉(zhuǎn)向轉(zhuǎn)向不轉(zhuǎn)向0,0-1,11,1-2,-2在這個博弈中,每個參與

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。