資源描述:
《博弈論的應(yīng)用-淺析博弈論經(jīng)典模型》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、淺析博弈論經(jīng)典模型--囚徒困境模型及其啟示一、博弈論概述博弈論又名“對(duì)策論”、“賽局理論”,屬應(yīng)用數(shù)學(xué)的一個(gè)分支,表示在多決策主體之間行為具有相互作用時(shí),各主體根據(jù)所掌握信息及對(duì)自身能力的認(rèn)知,做出有利于自己的決策的一種行為理論。簡(jiǎn)單說(shuō)來(lái)就是一些個(gè)人或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過(guò)程。由于沖突、合作、競(jìng)爭(zhēng)等行為是現(xiàn)實(shí)世界中常見的現(xiàn)象,因此很多領(lǐng)域都能應(yīng)用博弈論,例如軍事領(lǐng)域、經(jīng)濟(jì)領(lǐng)域、政治外交,解決諸如戰(zhàn)術(shù)攻防、國(guó)際糾紛、定價(jià)定產(chǎn)、兼并收購(gòu)、投標(biāo)拍賣甚至動(dòng)物進(jìn)化等問(wèn)題。二、博弈論的
2、基本原理從上述定義中可以看出,一個(gè)完整的博弈一般由以下幾個(gè)要素組成:博弈的參加者,各博弈方各自選擇的全部策略或行為的集合、博弈方的得益、結(jié)果、均衡等。1、參與者指的是博弈中選擇行動(dòng)以最大化自己效用的決策主體(可以是個(gè)人,也可以是團(tuán)體)。2、行動(dòng)是指參與人在博弈進(jìn)程中輪到自己選擇時(shí)所作的某個(gè)具體決策。3、策略是指參與人選擇行動(dòng)的規(guī)則,即在博弈進(jìn)程中,什么情況下選擇什么行動(dòng)的預(yù)先安排。4、信息指的是參與人在博弈中所知道的關(guān)于自己以及其他參與人的行動(dòng)、策略及其得益函數(shù)等知識(shí)。65、得益是參與人在博弈結(jié)束后從博弈中獲得的效用,一般是所有參與人的策略或行動(dòng)的函數(shù),這是每個(gè)參與人最關(guān)心的事情。6、均
3、衡是所有參與人的最優(yōu)策略或行動(dòng)的組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動(dòng)或效用集合。上述要素中,參與人、行動(dòng)和結(jié)果統(tǒng)稱為博弈規(guī)則,博弈分析的目的是使用博弈規(guī)則來(lái)決定均衡。三、博弈的分類博弈的分類根據(jù)不同的標(biāo)準(zhǔn)也有不同的分類。根據(jù)參與人的多少,博弈可以分為二人博弈和多人博弈。根據(jù)參與人是否合作,博弈可以分為合作博弈和非合作博弈。合作博弈和非合作博弈的區(qū)別在于相互發(fā)生作用的當(dāng)事人之間有沒(méi)有一個(gè)具有約束力的協(xié)議,如果有,就是合作博弈,如果沒(méi)有,就是非合作博弈。根據(jù)各方得益的不同情況,博弈可以分為零和博弈和變和博弈。零和博弈中
4、各方利益之間是完全對(duì)立的。變和博弈有可能存在合作關(guān)系,爭(zhēng)取雙贏的局面。根據(jù)行為的時(shí)間序列性,博弈可以分為靜態(tài)博弈、動(dòng)態(tài)博弈。靜態(tài)博弈是指在博弈中,參與人同時(shí)選擇或雖非同時(shí)選擇但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈是指在博弈中,參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。根據(jù)參與人對(duì)其他參與人的了解程度,博弈可以分為完全信息博弈和不完全信息博弈。完全信息6博弈是指在博弈過(guò)程中,每一位參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。不完全信息博弈是指如果參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對(duì)所有參與人的特征、
5、策略空間及收益函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。四、納什均衡假設(shè)有n個(gè)局中人參與博弈,給定其他人策略的條件下,每個(gè)局中人選擇自己的最優(yōu)策略(個(gè)人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒(méi)有人有足夠理由打破這種均衡。納什均衡,從實(shí)質(zhì)上說(shuō),是一種非合作博弈狀態(tài)。納什均衡達(dá)成時(shí),并不意味著博弈雙方都處于不動(dòng)的狀態(tài),在順序博弈中這個(gè)均衡是在博弈者連續(xù)的動(dòng)作與反應(yīng)中達(dá)成的。納什均衡也不意味著博弈雙方達(dá)到了一個(gè)整體的最
6、優(yōu)狀態(tài),以下的囚徒困境就是一個(gè)例子。五、博弈論的經(jīng)典模型—“囚徒困境”這個(gè)博弈問(wèn)題是1950年圖克提出的,它雖然非常簡(jiǎn)單,但卻很好地反映了非合作博弈的根本特征,而且這個(gè)博弈模型正是解釋眾多經(jīng)濟(jì)現(xiàn)象,研究經(jīng)濟(jì)效率問(wèn)題的非常有效的基本模型和范式。該博弈模型提出后曾引發(fā)了大量的相關(guān)研究,對(duì)博弈論的發(fā)展起了不小的推動(dòng)作用。故事如下:警察抓住了兩個(gè)罪犯,但是警察局卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果罪犯中至少有一人供認(rèn)犯罪,就能確認(rèn)罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押,防止他們串供或結(jié)成攻守同盟,并分別跟他們講清了他們的處境和面臨的選擇:如果他們兩6人都拒不認(rèn)罪,則他們會(huì)被以
7、較輕的妨礙公務(wù)罪各判一年徒刑;如果兩人中有一人坦白認(rèn)罪,則坦白者立即釋放而另一人將重判10年徒刑;如果兩人都坦白認(rèn)罪,則他們將被各判8年監(jiān)禁。問(wèn):兩個(gè)罪犯會(huì)如何選擇(即是坦白還是抵賴)?下面可將整個(gè)博弈過(guò)程的結(jié)果用一矩陣形式表示出來(lái)。這種矩陣稱為博弈的“得益矩陣(支付矩陣)”。表3.1A與B的得益矩陣囚徒B坦白囚徒B不坦白囚徒A坦白(-8,-8)(0,-10)囚徒A不坦白(-10,0)(-1,-1)可見:(1)對(duì)于囚徒A來(lái)說(shuō),囚徒B