囚徒困境研究專題

ID：19354467

大?。?0.72 KB

頁(yè)數(shù)：9頁(yè)

時(shí)間：2018-10-01

資源描述：

《囚徒困境研究專題》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、第五章囚徒困境研究專題一、囚徒困境為什么被關(guān)注？囚徒困境是指如下的博弈甲乙不合作合作不合作2*,2*1,4合作4，13,3之所以囚徒困境被廣泛的關(guān)注，不僅僅在于它由強(qiáng)大的解釋力，如它可以解釋企業(yè)競(jìng)爭(zhēng)，應(yīng)試教育困境，集體勞動(dòng)悲劇等等，更重要的在于人們從中看到一個(gè)深刻的問(wèn)題：個(gè)體理性與集體理性的沖突。哈丁的公共地悲?。?968）如何破解？重復(fù)進(jìn)行！什么是重復(fù)博弈？重復(fù)博弈指的是參與人之間進(jìn)行多次相同的博弈，每個(gè)人所得收益為每次博弈的收益之和。注意：（1）這里的收益之和應(yīng)該考慮貼現(xiàn)率。（2）重復(fù)博弈分為有限次重復(fù)和無(wú)限次重復(fù)有限次重復(fù)囚徒困境博弈的特征

2、：（1）完全但不完美信息，（2）重復(fù)。有限次重復(fù)囚徒困境的解，每步都“不合作”為納什均衡。二、無(wú)限次重復(fù)囚徒困境中的策略兩個(gè)參與人無(wú)限次地重復(fù)囚徒困境，每個(gè)人的收益為每次博弈所獲收益之和。在這樣的博弈中因無(wú)最后一步，我們無(wú)法通過(guò)逆向歸納法來(lái)求解它。無(wú)限次重復(fù)囚徒困境博弈及其各種策略分析：觸發(fā)策略：參與人開始采取合作行動(dòng)，若發(fā)現(xiàn)對(duì)方在某步采取“背叛”行動(dòng)，參與人以后都采取背叛行動(dòng)。“永遠(yuǎn)合作”：在每個(gè)囚徒困境博弈中均采取“合作”策略二無(wú)論對(duì)方采取什么策略。一旦采取這個(gè)策略，對(duì)方的最優(yōu)策略是每步均采取“背叛”策略。在重復(fù)囚徒困境博弈中人們通過(guò)策略的變

3、化或偏離進(jìn)行學(xué)習(xí)的。一旦人們的合作行動(dòng)的偏離——無(wú)論這樣的偏離是有意還是無(wú)意的——得到額外的好處、對(duì)方遭受損失，同時(shí)這樣的偏移沒(méi)有被“懲罰”，人們將嘗試性的進(jìn)一步偏移。我們看到，若某個(gè)參與人在重復(fù)囚徒困境中采取永遠(yuǎn)“合作”，其結(jié)果是對(duì)方將通過(guò)一步步偏移，直至永遠(yuǎn)偏離。因此，理性人應(yīng)該知道上述這個(gè)分析的結(jié)論，他不會(huì)采取這個(gè)永遠(yuǎn)合作策略?！坝肋h(yuǎn)背叛”策略：在對(duì)方第一步采取合作并假定對(duì)方以后采取“一報(bào)還一報(bào)”的情況下，第一步或者某一步主動(dòng)采取“背叛”的收益為：U=4+2δ+2δ2+……=4+2δ/(1-δ)U’=3+3δ+3δ2+……=3+3δ/(1-

4、δ)U≥U’δ≤1/2.5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve這里，δ反映的是未來(lái)的現(xiàn)實(shí)價(jià)值，或者說(shuō)長(zhǎng)期利益與短期利益。人們?cè)诮虒W(xué)這樣的博弈以及其

5、他博弈中都會(huì)在短期利益與長(zhǎng)期利益之間進(jìn)行權(quán)衡?！耙粓?bào)還一報(bào)”策略：第一步合作，之后緊跟對(duì)方上一步策略。一個(gè)統(tǒng)一的策略模型：“n報(bào)還m報(bào)”，這里n與m取值為0到無(wú)窮大。一個(gè)成功的策略含有：“友善”：第一步“合作”?！皥?bào)復(fù)”：面對(duì)他人的“背叛”要有懲罰。“寬容”：若他人認(rèn)識(shí)到錯(cuò)誤、從“背叛”到“合作”，參與人要給他人機(jī)會(huì)。這里的“報(bào)復(fù)”與“寬容”反映的是對(duì)他人的策略變化要有相應(yīng)的變化，不同的人“報(bào)復(fù)”與“寬容”的程度能夠不同。能否通過(guò)先“背叛”而獲得高分？一旦背叛會(huì)面臨對(duì)方的懲罰，因此能否得高分取決于他人的策略。需要實(shí)驗(yàn)研究。計(jì)算機(jī)模擬。這里的策略分

6、析針對(duì)的是固定的兩個(gè)人之間進(jìn)行固定重復(fù)囚徒困境博弈。第一，如果兩個(gè)人進(jìn)行多個(gè)囚徒困境博弈，如何進(jìn)行這樣的博弈？第二，如果參與人可更換？如何進(jìn)行？三、兩個(gè)參與人之間進(jìn)行多個(gè)囚徒困境博弈。我們考慮兩個(gè)人甲和乙進(jìn)行兩個(gè)重復(fù)性的囚徒困境博弈，這兩個(gè)囚徒困境博弈的進(jìn)行存在先后。怎樣的策略才能獲得最大的收益？假定甲乙進(jìn)行兩個(gè)“不同的”重復(fù)的囚徒困境博弈A和B。要說(shuō)明的是，囚徒困境是一類博弈的模型，這里甲乙所進(jìn)行的所謂不同的囚徒困境博弈，指的是兩個(gè)這樣的博弈。此時(shí)存在很多策略，這里列出四種：第一，“極度冷酷策略”。在A囚徒困境博弈的某個(gè)階段，甲采取“合作”策略

7、，而乙采取了“不合作”策略，甲的收益降低，而乙的收益增加。甲觀察到了乙的不合作策略，甲如何行動(dòng)呢？甲可采取“冷酷策略”，即在與乙的該博弈中甲永遠(yuǎn)采取“不合作”策略。甲也可采取“一報(bào)還一報(bào)”策略，即在下一步甲也將采取“不合作”，在以后的博弈階段中，甲采取何種行動(dòng)，取決于乙是否改正……然而，對(duì)于甲，這是可能的，當(dāng)乙采取了“不合作”策略，甲在該博弈的余下的階段中，將永遠(yuǎn)采取“不合作”行動(dòng)，并且在與乙的“其他的囚徒困境重復(fù)博弈”中也將采取“不合作”行動(dòng)。甲此時(shí)的這種策略是極端的“冷酷”，他對(duì)乙的態(tài)度是極度的不寬容。某個(gè)參與人與他人進(jìn)行多個(gè)重復(fù)囚徒困境博弈

8、中，因?qū)Ψ皆谀硞€(gè)博弈的某個(gè)階段采取了“不合作”，他在與對(duì)方的該博弈中將永遠(yuǎn)采取“不合作”，并且在與該對(duì)方的其他囚徒困境博弈中也毫無(wú)例外地

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 9



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問(wèn)題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

囚徒困境研究專題

囚徒困境研究專題

相關(guān)文章

相關(guān)標(biāo)簽