資源描述:
《子博弈精煉納什均衡+貝葉斯法則+信號博弈》由會員上傳分享,免費在線閱讀,更多相關內容在行業(yè)資料-天天文庫。
1、一:子博弈精煉納什均衡在給出子博弈精煉Nash均衡的正式定義之前,我們需要先介紹“子博弈”這個概念。?子博弈(sub?game):由一個單結信息集X開始的與所有該決策結的后續(xù)結(包括終點結)組成的,能夠自成一個博弈的原博弈的一部分。即給定“歷史”,每一個行動選擇開始至博弈結束構成了的一個博弈,稱為原動態(tài)博弈的一個“子博弈”。子博弈可以作為一個獨立的博弈進行分析,并且與原博弈具有相同的信息結構。為了敘述方便,一般用表示博弈樹中開始于決策結的子博弈。??譬如圖3.5,該博弈存在3個子博弈:除了原博弈自己以外,還存在兩個子博弈圖3.6a子
2、博弈和圖3.6b子博弈。?在靜態(tài)博弈分析時,我們所說的戰(zhàn)略是指參與人聲明他將做出何種選擇,而他們往往也是按照聲明做出實際選擇的;在動態(tài)博弈中,戰(zhàn)略盡管仍然具有這種含義,但博弈在行動選擇上參與人具有選擇行動的先后順序情況下,參與人有了一種額外的選擇——事后機會主義,后動的局中人完全可以根據(jù)博弈進行到此時對局中人最為有利的方式選擇行動,而放棄事前所聲明的戰(zhàn)略所規(guī)定的行動選擇選擇其行動。這意味著,在動態(tài)博弈中,即使參與人人按事前所聲明的戰(zhàn)略組合構成一個納什均衡,而這些均衡戰(zhàn)略又規(guī)定了各個參與人在其所有信息集上的行動選擇,這些行動選擇也可能
3、并非參與人在對應信息集上的最優(yōu)行動選擇。而當博弈實際進行到那些由納什均衡戰(zhàn)略規(guī)定的行動并非最優(yōu)行動選擇的信息集時,按照理性人假設,可以想象參與人屆時并不會按納什均衡戰(zhàn)略所規(guī)定的方式去選擇行動,而是機會主義地選擇最優(yōu)的行動。這樣,具有這種特點的納什均衡就是不可信的,即不能作為模型的預測結果,按照“精煉”納什均衡的思想,應當將其消掉。?定義3.1:子博弈精煉納什均衡(SPNE):擴展式博弈的策略組合?S*=(S1*,…,?Si*,…,?Sn*?)是一個子博弈精煉納什均衡當且僅當:如果它是原博弈的納什均衡;它在每一個子博弈上也都構成納什均
4、衡。?如果一個完美信息的動態(tài)博弈中,各博弈方的策略構成的一個策略組合滿足:在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個“子博弈完美納什均衡”。這也意味著原博弈的Nash均衡并不一定是子博弈精煉Nash均衡,除非它還對所有子博弈構成Nash均衡。例如前文的煤電博弈,(提價,接受)和(不提價,接受)均為納什均衡,但后者并未滿足在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡這一要件,因而理性的煤炭企業(yè)一定會選擇提價。博弈:一個擴展式表示博弈的子博弈G是由一個單結信息集x開始的與所有該決策結的后續(xù)結(
5、包括終點結)組成的能自成一個博弈的原博弈的一部分。對于擴展式博弈的策略組合S*=(S1*,…,Si*,…,Sn*),如果它是原博弈的納什均衡;它在每一個子博弈上也都構成納什均衡,則它是一個子博弈精煉納什均衡。博弈論專家常常使用“序貫理性”(Sequentialrationality):指不論過去發(fā)生了什么,參與人應該在博弈的每個時點上最優(yōu)化自己的策略。子博弈精煉納什均衡所要求的正是參與人應該是序慣理性的。對于有限完美信息博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡便的方法。因為有限完美信息博弈的每一個決策結都開始一個子博弈。求解方
6、法: 最后一個結點上的子博弈(納什均衡)→倒數(shù)第二個(納什均衡)→······→初始結點上的子博弈(納什均衡)。上圖摘自張維迎的《博弈論與信息經(jīng)濟學》(P7)在此圖中,我們可以看出博弈論大概分為四類,每種類別都有固定的納什均衡。這道題中所問的“如何分辨子博弈”,是求解子博弈精煉納什均衡的基礎。而“貝葉斯法則”是求解精煉貝葉斯均衡的基礎。所以,如果擴展一下是屬于如何求解完全信息動態(tài)博弈的子博弈精煉納什均衡,以及如何求解不完全信息動態(tài)博弈的精煉貝葉斯納什均衡。在下面分開討論。一、完全信息動態(tài)的子博弈精煉納什均衡完全信息動態(tài)一般用擴展式表
7、述。子博弈精煉納什均衡要求(1)它在原博弈上是納什均衡(2)它在每一個子博弈上都是納什均衡。所以,如何分辨一個擴展式有幾個子博弈,關鍵在于看一個擴展式表述的博弈中有幾個單節(jié)信息集。同時,子博弈不能切割原博弈的信息集。通過下面幾個圖來解釋:圖1在此博弈中,有三個參與者,分別是A、N(自然)、B。共有七個決策點,A有一個。N有兩個,B有四個。這七個決策點分割成七個信息集,每個信息集都只包括一個決策點。(表示,所有參與者在參與時準確知道自己處于哪個決策結。)子博弈由每個決策結及其后續(xù)結構成,所以在圖一中,共有七個子博弈。(注意:任何博弈本
8、身成為其自身的一個子博弈。)圖2圖2與圖1相同,也有三個參與者,A、N(自然)、B。不同的是,B在選擇時并不知道N的選擇,也就是說B知道A選擇了開發(fā)或者不開發(fā),但是不知道N選擇了大還是小。因為B不知道自己處在N選擇了大還是小的決策結上