資源描述:
《占優(yōu)策略,最佳應(yīng)對(duì)課件.ppt》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、博弈論簡(jiǎn)介(1)(占優(yōu)策略,最佳應(yīng)對(duì))博弈-從一個(gè)例子開(kāi)始“復(fù)習(xí)考試”還是“準(zhǔn)備報(bào)告”?假設(shè)在截止日期前一天,你有兩件要做的事情:一是復(fù)習(xí)考試,二是準(zhǔn)備報(bào)告。你只能選擇做一項(xiàng)??荚嚦煽?jī)可以預(yù)計(jì)如果復(fù)習(xí),則考試成績(jī)92分,沒(méi)復(fù)習(xí),則80分報(bào)告需要你和你的拍檔合作完成如果你和拍檔都準(zhǔn)備報(bào)告,則每人都是100分如果只有一人準(zhǔn)備報(bào)告,則每人都是92分如果兩人都沒(méi)準(zhǔn)備報(bào)告,則每人都是84分例子:“考試-報(bào)告”博弈設(shè)你們都追求平均成績(jī)的最大化:你和搭檔都準(zhǔn)備報(bào)告,則平均成績(jī)均為(80+100)/2=90分你和搭檔都準(zhǔn)備考試,
2、則平均成績(jī)均為:(92+84)/2=88分考試成績(jī)可以預(yù)期:如果復(fù)習(xí),則考試成績(jī)92分如果沒(méi)復(fù)習(xí),則考試成績(jī)80分報(bào)告是你和你的拍檔合作完成的:如果你和拍檔都準(zhǔn)備報(bào)告,則每人100分如果只有一人準(zhǔn)備報(bào)告,則每人92分如果兩人都沒(méi)準(zhǔn)備報(bào)告,則每人84分若一方復(fù)習(xí)考試,另一方準(zhǔn)備報(bào)告:準(zhǔn)備報(bào)告的得:(80+92)/2=86分復(fù)習(xí)的得:(92+92)/2=92分那么你和你的拍檔該選擇做什么呢?(假設(shè)你和拍檔各自獨(dú)立考慮這個(gè)問(wèn)題)收益矩陣(表達(dá)博弈的一種直觀(guān)方式)你的拍檔準(zhǔn)備報(bào)告復(fù)習(xí)考試你準(zhǔn)備報(bào)告90,9086,92復(fù)習(xí)
3、考試92,8688,88其中第一個(gè)數(shù)字是“你”的收益,第二個(gè)是“拍檔”的收益(也稱(chēng)“回報(bào)”,payoff)博弈的基本要素一般情況下,博弈具有三個(gè)要素:(1)參與者(至少兩個(gè));(2)策略集:每個(gè)參與者都有一組關(guān)于如何行為的所有可能的策略組成的集合。(3)收益(回報(bào)):每個(gè)策略行為的選擇,都會(huì)使參與人得到一個(gè)收益。這個(gè)收益結(jié)果還受互動(dòng)中他人策略選擇的影響。策略組:由每個(gè)參與者出一個(gè)策略構(gòu)成的組合。給定策略組,每個(gè)參與人對(duì)應(yīng)有一個(gè)收益通常,收益的記號(hào):P1(S,T),P2(S,T)博弈行為推理的幾點(diǎn)基本假設(shè)每個(gè)參與人
4、對(duì)博弈結(jié)構(gòu)(收益矩陣)有充分了解。參與人都是理性的(rational)追求自己的收益最大化(盡量大)給定其他人的策略,若自己能通過(guò)改變當(dāng)前策略獲得更大收益,則會(huì)放棄當(dāng)前策略,換個(gè)更好的知道其他參與人也是如此決策的獨(dú)立性不商量,沒(méi)有“協(xié)議聯(lián)盟”之類(lèi)“考試-報(bào)告”博弈中的行為推理嚴(yán)格占優(yōu)策略:對(duì)一個(gè)參與人(A)來(lái)說(shuō),若存在一個(gè)策略,無(wú)論另一個(gè)參與人(B)選擇何種行為策略,該策略都是最佳選擇,則這個(gè)策略就稱(chēng)為是A的嚴(yán)格占優(yōu)策略。按照前面的假設(shè),參與人將選擇嚴(yán)格占優(yōu)策略。這個(gè)例子中,“復(fù)習(xí)考試”對(duì)雙方都是嚴(yán)格占優(yōu)策略。你
5、的拍檔準(zhǔn)備報(bào)告復(fù)習(xí)考試你準(zhǔn)備報(bào)告90,9086,92復(fù)習(xí)考試92,8688,88最佳應(yīng)對(duì)設(shè)S是參與人甲的一個(gè)策略,T是參與人乙的一個(gè)策略。在收益矩陣中的某個(gè)單元格對(duì)應(yīng)策略組(S,T)。P1(S,T):表示參與人甲從這組決策獲得的收益P2(S,T):表示參與人乙從這組決策獲得的收益最佳應(yīng)對(duì):針對(duì)參與人乙的策略T,若參與人甲采用策略S產(chǎn)生的收益大于或等于自己的任何其他策略,則稱(chēng)參與人甲的策略S是參與人乙的策略T的最佳應(yīng)對(duì)。P1(S,T)≥P1(S’,T)其中,S’是參與人甲除S外的任何其他策略。存在且不唯一嚴(yán)格最佳應(yīng)
6、對(duì)嚴(yán)格最佳應(yīng)對(duì):若S會(huì)產(chǎn)生比任何應(yīng)對(duì)策略T的其他策略都更高的收益,則稱(chēng)參與人甲的策略S是對(duì)于參與人乙的策略T的嚴(yán)格最佳應(yīng)對(duì)。P1(S,T)>P1(S’,T)其中,S’是參與人甲的所有其他策略。不一定存在,但存在則唯一占優(yōu)策略與嚴(yán)格占優(yōu)策略定義:(從最佳應(yīng)對(duì)角度給出)參與人甲的占優(yōu)策略S,是指該策略對(duì)于參與人乙的每一策略都是最佳應(yīng)對(duì)。參與人甲的嚴(yán)格占優(yōu)策略S,是指該占優(yōu)策略對(duì)于參與人乙的每一策略都是嚴(yán)格最佳應(yīng)對(duì)。注:占優(yōu)策略的概念是相對(duì)于對(duì)方所有策略而言的,而最佳應(yīng)對(duì)是針對(duì)單個(gè)策略而言。如果參與人有嚴(yán)格占優(yōu)策略,則
7、可預(yù)期他會(huì)采取該策略(與基本假設(shè)的一致性)。“營(yíng)銷(xiāo)戰(zhàn)略”博弈假設(shè)公司1,2選擇生成何種檔次(廉價(jià)或高檔次)的商品若兩家公司分別定位生產(chǎn)不同檔次的產(chǎn)品,則每家公司都會(huì)得到該商品市場(chǎng)的全部份額。公司1品牌形象更佳。因此,若這兩家公司在同一市場(chǎng)(廉價(jià)或高檔次)中競(jìng)爭(zhēng),則公司1可以得到80%的市場(chǎng),公司2只能得到20%。公司2廉價(jià)高檔公司1廉價(jià)0.48,0.120.6,0.4高檔0.4,0.60.32,0.08?可以預(yù)測(cè)此博弈的結(jié)果是即公司1采取廉價(jià)策略,公司2將會(huì)采取高檔次策略。高檔市場(chǎng)40%廉價(jià)市場(chǎng)60%簡(jiǎn)單博弈的行
8、為推理如果兩個(gè)人都有嚴(yán)格占優(yōu)策略,則可以預(yù)計(jì)他們均會(huì)采取嚴(yán)格占優(yōu)策略;如果只有一個(gè)人有嚴(yán)格占優(yōu)策略,則這個(gè)人會(huì)采取嚴(yán)格占優(yōu)策略,而另一方會(huì)采取此策略的最佳應(yīng)對(duì)。如果兩個(gè)人都沒(méi)有嚴(yán)格占優(yōu)策略呢?