資源描述:
《囚徒困境研究專題》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、第五章囚徒困境研究專題一、囚徒困境為什么被關(guān)注?囚徒困境是指如下的博弈甲乙不合作合作不合作2*,2*1,4合作4,13,3之所以囚徒困境被廣泛的關(guān)注,不僅僅在于它由強(qiáng)大的解釋力,如它可以解釋企業(yè)競(jìng)爭(zhēng),應(yīng)試教育困境,集體勞動(dòng)悲劇等等,更重要的在于人們從中看到一個(gè)深刻的問(wèn)題:個(gè)體理性與集體理性的沖突。哈丁的公共地悲?。?968)如何破解?重復(fù)進(jìn)行!什么是重復(fù)博弈?重復(fù)博弈指的是參與人之間進(jìn)行多次相同的博弈,每個(gè)人所得收益為每次博弈的收益之和。注意:(1)這里的收益之和應(yīng)該考慮貼現(xiàn)率。(2)重復(fù)博弈分為有限次重復(fù)和無(wú)限次重復(fù)有限次重復(fù)囚徒困境博弈的特征
2、:(1)完全但不完美信息,(2)重復(fù)。有限次重復(fù)囚徒困境的解,每步都“不合作”為納什均衡。二、無(wú)限次重復(fù)囚徒困境中的策略兩個(gè)參與人無(wú)限次地重復(fù)囚徒困境,每個(gè)人的收益為每次博弈所獲收益之和。在這樣的博弈中因無(wú)最后一步,我們無(wú)法通過(guò)逆向歸納法來(lái)求解它。無(wú)限次重復(fù)囚徒困境博弈及其各種策略分析:觸發(fā)策略:參與人開始采取合作行動(dòng),若發(fā)現(xiàn)對(duì)方在某步采取“背叛”行動(dòng),參與人以后都采取背叛行動(dòng)。“永遠(yuǎn)合作”:在每個(gè)囚徒困境博弈中均采取“合作”策略二無(wú)論對(duì)方采取什么策略。一旦采取這個(gè)策略,對(duì)方的最優(yōu)策略是每步均采取“背叛”策略。在重復(fù)囚徒困境博弈中人們通過(guò)策略的變
3、化或偏離進(jìn)行學(xué)習(xí)的。一旦人們的合作行動(dòng)的偏離——無(wú)論這樣的偏離是有意還是無(wú)意的——得到額外的好處、對(duì)方遭受損失,同時(shí)這樣的偏移沒(méi)有被“懲罰”,人們將嘗試性的進(jìn)一步偏移。我們看到,若某個(gè)參與人在重復(fù)囚徒困境中采取永遠(yuǎn)“合作”,其結(jié)果是對(duì)方將通過(guò)一步步偏移,直至永遠(yuǎn)偏離。因此,理性人應(yīng)該知道上述這個(gè)分析的結(jié)論,他不會(huì)采取這個(gè)永遠(yuǎn)合作策略?!坝肋h(yuǎn)背叛”策略:在對(duì)方第一步采取合作并假定對(duì)方以后采取“一報(bào)還一報(bào)”的情況下,第一步或者某一步主動(dòng)采取“背叛”的收益為:U=4+2δ+2δ2+……=4+2δ/(1-δ)U’=3+3δ+3δ2+……=3+3δ/(1-
4、δ)U≥U’δ≤1/2.5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve這里,δ反映的是未來(lái)的現(xiàn)實(shí)價(jià)值,或者說(shuō)長(zhǎng)期利益與短期利益。人們?cè)诮虒W(xué)這樣的博弈以及其
5、他博弈中都會(huì)在短期利益與長(zhǎng)期利益之間進(jìn)行權(quán)衡?!耙粓?bào)還一報(bào)”策略:第一步合作,之后緊跟對(duì)方上一步策略。一個(gè)統(tǒng)一的策略模型:“n報(bào)還m報(bào)”,這里n與m取值為0到無(wú)窮大。一個(gè)成功的策略含有:“友善”:第一步“合作”?!皥?bào)復(fù)”:面對(duì)他人的“背叛”要有懲罰。“寬容”:若他人認(rèn)識(shí)到錯(cuò)誤、從“背叛”到“合作”,參與人要給他人機(jī)會(huì)。這里的“報(bào)復(fù)”與“寬容”反映的是對(duì)他人的策略變化要有相應(yīng)的變化,不同的人“報(bào)復(fù)”與“寬容”的程度能夠不同。能否通過(guò)先“背叛”而獲得高分?一旦背叛會(huì)面臨對(duì)方的懲罰,因此能否得高分取決于他人的策略。需要實(shí)驗(yàn)研究。計(jì)算機(jī)模擬。這里的策略分
6、析針對(duì)的是固定的兩個(gè)人之間進(jìn)行固定重復(fù)囚徒困境博弈。第一,如果兩個(gè)人進(jìn)行多個(gè)囚徒困境博弈,如何進(jìn)行這樣的博弈?第二,如果參與人可更換?如何進(jìn)行?三、兩個(gè)參與人之間進(jìn)行多個(gè)囚徒困境博弈。我們考慮兩個(gè)人甲和乙進(jìn)行兩個(gè)重復(fù)性的囚徒困境博弈,這兩個(gè)囚徒困境博弈的進(jìn)行存在先后。怎樣的策略才能獲得最大的收益?假定甲乙進(jìn)行兩個(gè)“不同的”重復(fù)的囚徒困境博弈A和B。要說(shuō)明的是,囚徒困境是一類博弈的模型,這里甲乙所進(jìn)行的所謂不同的囚徒困境博弈,指的是兩個(gè)這樣的博弈。此時(shí)存在很多策略,這里列出四種:第一,“極度冷酷策略”。在A囚徒困境博弈的某個(gè)階段,甲采取“合作”策略
7、,而乙采取了“不合作”策略,甲的收益降低,而乙的收益增加。甲觀察到了乙的不合作策略,甲如何行動(dòng)呢?甲可采取“冷酷策略”,即在與乙的該博弈中甲永遠(yuǎn)采取“不合作”策略。甲也可采取“一報(bào)還一報(bào)”策略,即在下一步甲也將采取“不合作”,在以后的博弈階段中,甲采取何種行動(dòng),取決于乙是否改正……然而,對(duì)于甲,這是可能的,當(dāng)乙采取了“不合作”策略,甲在該博弈的余下的階段中,將永遠(yuǎn)采取“不合作”行動(dòng),并且在與乙的“其他的囚徒困境重復(fù)博弈”中也將采取“不合作”行動(dòng)。甲此時(shí)的這種策略是極端的“冷酷”,他對(duì)乙的態(tài)度是極度的不寬容。某個(gè)參與人與他人進(jìn)行多個(gè)重復(fù)囚徒困境博弈
8、中,因?qū)Ψ皆谀硞€(gè)博弈的某個(gè)階段采取了“不合作”,他在與對(duì)方的該博弈中將永遠(yuǎn)采取“不合作”,并且在與該對(duì)方的其他囚徒困境博弈中也毫無(wú)例外地