子博弈精煉納什均衡+貝葉斯法則+信號博弈

ID：39133653

大小：605.52 KB

頁數(shù)：9頁

時間：2019-06-25

資源描述：

《子博弈精煉納什均衡+貝葉斯法則+信號博弈》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、一：子博弈精煉納什均衡在給出子博弈精煉Nash均衡的正式定義之前，我們需要先介紹“子博弈”這個概念。?子博弈（sub?game）：由一個單結(jié)信息集X開始的與所有該決策結(jié)的后續(xù)結(jié)（包括終點結(jié)）組成的，能夠自成一個博弈的原博弈的一部分。即給定“歷史”，每一個行動選擇開始至博弈結(jié)束構(gòu)成了的一個博弈，稱為原動態(tài)博弈的一個“子博弈”。子博弈可以作為一個獨立的博弈進(jìn)行分析，并且與原博弈具有相同的信息結(jié)構(gòu)。為了敘述方便，一般用表示博弈樹中開始于決策結(jié)的子博弈。??譬如圖3.5，該博弈存在3個子博弈：除了原博弈自己以外，還存在兩個子博弈圖3.6a子

2、博弈和圖3.6b子博弈。?在靜態(tài)博弈分析時，我們所說的戰(zhàn)略是指參與人聲明他將做出何種選擇，而他們往往也是按照聲明做出實際選擇的；在動態(tài)博弈中，戰(zhàn)略盡管仍然具有這種含義，但博弈在行動選擇上參與人具有選擇行動的先后順序情況下，參與人有了一種額外的選擇——事后機(jī)會主義，后動的局中人完全可以根據(jù)博弈進(jìn)行到此時對局中人最為有利的方式選擇行動，而放棄事前所聲明的戰(zhàn)略所規(guī)定的行動選擇選擇其行動。這意味著，在動態(tài)博弈中，即使參與人人按事前所聲明的戰(zhàn)略組合構(gòu)成一個納什均衡，而這些均衡戰(zhàn)略又規(guī)定了各個參與人在其所有信息集上的行動選擇，這些行動選擇也可能

3、并非參與人在對應(yīng)信息集上的最優(yōu)行動選擇。而當(dāng)博弈實際進(jìn)行到那些由納什均衡戰(zhàn)略規(guī)定的行動并非最優(yōu)行動選擇的信息集時，按照理性人假設(shè)，可以想象參與人屆時并不會按納什均衡戰(zhàn)略所規(guī)定的方式去選擇行動，而是機(jī)會主義地選擇最優(yōu)的行動。這樣，具有這種特點的納什均衡就是不可信的，即不能作為模型的預(yù)測結(jié)果，按照“精煉”納什均衡的思想，應(yīng)當(dāng)將其消掉。?定義3.1：子博弈精煉納什均衡（SPNE）：擴(kuò)展式博弈的策略組合?S*=(S1*,…,?Si*,…,?Sn*?)是一個子博弈精煉納什均衡當(dāng)且僅當(dāng)：如果它是原博弈的納什均衡；它在每一個子博弈上也都構(gòu)成納什均

4、衡。?如果一個完美信息的動態(tài)博弈中，各博弈方的策略構(gòu)成的一個策略組合滿足：在整個動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡，那么這個策略組合稱為該動態(tài)博弈的一個“子博弈完美納什均衡”。這也意味著原博弈的Nash均衡并不一定是子博弈精煉Nash均衡，除非它還對所有子博弈構(gòu)成Nash均衡。例如前文的煤電博弈，（提價，接受）和（不提價，接受）均為納什均衡，但后者并未滿足在整個動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡這一要件，因而理性的煤炭企業(yè)一定會選擇提價。博弈:一個擴(kuò)展式表示博弈的子博弈G是由一個單結(jié)信息集x開始的與所有該決策結(jié)的后續(xù)結(jié)(

5、包括終點結(jié))組成的能自成一個博弈的原博弈的一部分。對于擴(kuò)展式博弈的策略組合S*=(S1*,…,Si*,…,Sn*),如果它是原博弈的納什均衡;它在每一個子博弈上也都構(gòu)成納什均衡,則它是一個子博弈精煉納什均衡。博弈論專家常常使用“序貫理性”(Sequentialrationality)：指不論過去發(fā)生了什么，參與人應(yīng)該在博弈的每個時點上最優(yōu)化自己的策略。子博弈精煉納什均衡所要求的正是參與人應(yīng)該是序慣理性的。對于有限完美信息博弈，逆向歸納法是求解子博弈精煉納什均衡的最簡便的方法。因為有限完美信息博弈的每一個決策結(jié)都開始一個子博弈。求解方

6、法：　最后一個結(jié)點上的子博弈（納什均衡）→倒數(shù)第二個（納什均衡）→······→初始結(jié)點上的子博弈（納什均衡）。上圖摘自張維迎的《博弈論與信息經(jīng)濟(jì)學(xué)》（P7）在此圖中，我們可以看出博弈論大概分為四類，每種類別都有固定的納什均衡。這道題中所問的“如何分辨子博弈”，是求解子博弈精煉納什均衡的基礎(chǔ)。而“貝葉斯法則”是求解精煉貝葉斯均衡的基礎(chǔ)。所以，如果擴(kuò)展一下是屬于如何求解完全信息動態(tài)博弈的子博弈精煉納什均衡，以及如何求解不完全信息動態(tài)博弈的精煉貝葉斯納什均衡。在下面分開討論。一、完全信息動態(tài)的子博弈精煉納什均衡完全信息動態(tài)一般用擴(kuò)展式表

7、述。子博弈精煉納什均衡要求（1）它在原博弈上是納什均衡（2）它在每一個子博弈上都是納什均衡。所以，如何分辨一個擴(kuò)展式有幾個子博弈，關(guān)鍵在于看一個擴(kuò)展式表述的博弈中有幾個單節(jié)信息集。同時，子博弈不能切割原博弈的信息集。通過下面幾個圖來解釋：圖1在此博弈中，有三個參與者，分別是A、N（自然）、B。共有七個決策點，A有一個。N有兩個，B有四個。這七個決策點分割成七個信息集，每個信息集都只包括一個決策點。（表示，所有參與者在參與時準(zhǔn)確知道自己處于哪個決策結(jié)。）子博弈由每個決策結(jié)及其后續(xù)結(jié)構(gòu)成，所以在圖一中，共有七個子博弈。（注意：任何博弈本

8、身成為其自身的一個子博弈。）圖2圖2與圖1相同，也有三個參與者，A、N（自然）、B。不同的是，B在選擇時并不知道N的選擇，也就是說B知道A選擇了開發(fā)或者不開發(fā)，但是不知道N選擇了大還是小。因為B不知道自己處在N選擇了大還是小的決策結(jié)上

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 9



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

子博弈精煉納什均衡+貝葉斯法則+信號博弈

子博弈精煉納什均衡+貝葉斯法則+信號博弈

相關(guān)文章

相關(guān)標(biāo)簽