重復(fù)博弈簡介ppt課件.ppt_第1頁
重復(fù)博弈簡介ppt課件.ppt_第2頁
重復(fù)博弈簡介ppt課件.ppt_第3頁
重復(fù)博弈簡介ppt課件.ppt_第4頁
重復(fù)博弈簡介ppt課件.ppt_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2020/7/28,1,2.4 重復(fù)博弈,逆向歸納法回顧,2020/7/28,2,求解步驟:,在給定參與人I的行動(dòng)的情況下,求參與人II的最優(yōu)行動(dòng),在預(yù)測到參與人II的策略的情況下,求參與人I的最優(yōu)行動(dòng),2020/7/28,3,重復(fù)博弈,序貫博弈(sequential game): 同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次的動(dòng)態(tài)博弈,重復(fù)博弈(repeated game):具有同樣結(jié)構(gòu)的博弈重復(fù)多次的博弈,其中的每次博弈稱為“階段博弈”(stage game)。,有限期界,無限期界,2020/7/28,4,有限期重復(fù)博弈和無限期重復(fù)博弈的區(qū)分,如果參與人明顯地察覺到有一個(gè)確定的最后時(shí)期,則稱為有限期重復(fù)博弈

2、更為恰當(dāng);,如果人們進(jìn)行博弈非常頻繁推移非常緩慢,那么,將該博弈描述為無限期重復(fù)博弈更為合理。,關(guān)鍵準(zhǔn)則:最后的時(shí)期是否明確地進(jìn)入了參與人的策略考慮。如果進(jìn)入了參與人的考慮范圍,那么,就是有限期重復(fù)博弈,否則是無限期重復(fù)博弈。,2020/7/28,5,囚徒困境重復(fù)博弈,階段博弈為,對每個(gè)參與人來說,行動(dòng)D嚴(yán)格優(yōu)于行動(dòng)C,所以導(dǎo)致了結(jié)果 (D,D),2020/7/28,6,主要思想:如果每個(gè)參與人相信背叛將終止合作從而導(dǎo)致其后的損失對他來說超過短期所得,那么,若博弈被重復(fù)進(jìn)行,則共同想要的結(jié)果(C,C)在每個(gè)時(shí)期發(fā)生是穩(wěn)定的。,將表2.4.1表示的博弈重復(fù)(固定)有限期,我們采用逆向歸納法,發(fā)現(xiàn)

3、納什均衡(D, D)是唯一的子博弈完美均衡。,Step 1 求解第T期,兩個(gè)參與人必定都在第T期選擇D,即背叛,因?yàn)檫x擇背叛將提高他們在第T期的收益而且也沒有未來受到懲罰的可能,2020/7/28,7,Step 2 在第T-1期對任何以正的概率出現(xiàn)的歷史,兩參與人都必定背叛.已經(jīng)證明沿著均衡路徑的兩個(gè)參與人將在最后一期都選擇背叛,所以,特別的,如果參與人i在時(shí)期T-1遵循均衡策略,那么,他的對手必然在最后一期背叛。因此,參與人i沒有激勵(lì)不在時(shí)期T-1背叛。,團(tuán)體規(guī)范的重要性:維持共同想要的結(jié)果所需的團(tuán)體規(guī)范涉及到每個(gè)參與人“懲罰”背叛者;在團(tuán)體規(guī)范要求懲罰者去實(shí)行威脅的情形中,團(tuán)體規(guī)范也必須確

4、保懲罰者有動(dòng)機(jī)這樣去做。,2020/7/28,8,懲罰機(jī)制,觸發(fā)策略(trigger strategies):(1)開始選擇合作;(2)選擇合作直到有一方選擇了背叛,然后永遠(yuǎn)選擇背叛。,針鋒相對策略(tit-for-tat)或稱投桃報(bào)李,意思是說,比如在囚徒困境博弈中,開始選擇合作,在t階段選擇對手在t-1階段的選擇。,2020/7/28,9,對于有限期重復(fù)博弈,有下面的定理,定理2.4.1 令G是階段博弈,G(T)是G重復(fù)T次的重復(fù)博弈(T有限)。那么,如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈完美納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次,即每個(gè)階段博弈出現(xiàn)的是一次性博弈的均衡結(jié)

5、果。,2020/7/28,10,雙頭重復(fù)價(jià)格競爭,兩企業(yè)以同樣的邊際成本c生產(chǎn)可以完全相互替代的產(chǎn)品,低價(jià)企業(yè)得到了整個(gè)市場,而各家企業(yè)在收取同樣價(jià)格的情況下,則分享這個(gè)市場。,基本的伯川德博弈重復(fù)了T+1次,T 可能是有限數(shù),也可能是無限數(shù)。,企業(yè)i的貼現(xiàn)利潤為,2020/7/28,11,在每個(gè)時(shí)期,兩家企業(yè)同時(shí)選擇他們的價(jià)格 。,在各個(gè)時(shí)期之間沒有“物質(zhì)”聯(lián)系;當(dāng)一家企業(yè)選定其價(jià)格時(shí),其對手以前選定的價(jià)格已經(jīng)過時(shí)了。,完美均衡要求:對于任何給定的t時(shí)期的歷史,從t時(shí)期開始,企業(yè)i的策略,在企業(yè)j從那時(shí)開始的策略給定的情況下,將使利潤的貼現(xiàn)值最大化。,2020/7/28,12,有限期重復(fù)博弈

6、的解,先給定博弈在時(shí)期T的歷史,每家企業(yè)在最后時(shí)期如何選擇價(jià)格?,因?yàn)檫^去的價(jià)格不影響T時(shí)期的利潤,各企業(yè)在其對手價(jià)格給定的情況下,應(yīng)當(dāng)使它的“靜態(tài)利潤” 最大化。因此,對任何歷史情況來說,均衡是伯川德均衡,即,2020/7/28,13,T-1時(shí)期的均衡價(jià)格是什么?,由于在T時(shí)期的價(jià)格選擇不依賴于T-1時(shí)期發(fā)生什么事,一切事情都會(huì)像T-1就是最后一個(gè)時(shí)期一樣。因此,各企業(yè)也在T-1時(shí)期選擇競爭性的價(jià)格,而不管直到這個(gè)時(shí)期之前的歷史如何。對于任何T-1時(shí)期的歷史,有,T+1期價(jià)格博弈的結(jié)果僅是伯川德均衡重復(fù)T+1次,2020/7/28,14,無限期重復(fù)博弈的解,可以驗(yàn)證伯川德均衡無限期的重復(fù)仍然

7、是這一博弈的均衡。,考慮下述的博弈:每家企業(yè)在每個(gè)時(shí)期t選擇等于邊際成本的價(jià)格,而不管直到t以前的博弈歷史。給定對手企業(yè)在此方式下索取等于c的價(jià)格,則每家企業(yè)所能做的不會(huì)比本身收取c更好些。,2020/7/28,15,重復(fù)的伯川德均衡不再是唯一的均衡,假設(shè)價(jià)格 使 最大化。,觸發(fā)策略:每家企業(yè)在0時(shí)期索取 。若是在t以前各時(shí)期兩家企業(yè)都曾索取 ,它在t時(shí)期繼續(xù)索取 ;否則,它將永遠(yuǎn)把價(jià)格定在邊際成本c上 .,如果貼現(xiàn)因子足夠高,它們就構(gòu)成一個(gè)均衡。,2020/7/28,16,如果一家企業(yè)削減其壟斷價(jià)格,它將在整個(gè)背離時(shí)期得利,但它破壞了以后時(shí)期的合謀所有企業(yè)回復(fù)到“觸發(fā)策略”上去(即他們永遠(yuǎn)執(zhí)

8、行純競爭對策,這是一個(gè)均衡)。注意,合謀是通過一個(gè)純粹不合作的機(jī)制實(shí)現(xiàn)的。,這個(gè)均衡是默契合謀的結(jié)果。,2020/7/28,17,其他均衡,讓p屬于區(qū)間 ,并且讓每家企業(yè),在還沒有企業(yè)背離那個(gè)價(jià)格的期間,索取價(jià)格 p。如果其中有一家企業(yè)過去曾經(jīng)背離這個(gè)價(jià)格,雙方就都永遠(yuǎn)索取競爭性價(jià)格。,在一致遵守價(jià)格p的情況下,每家企業(yè)得到,如果一家企業(yè)背離,在背離期間,它最多得到 (因?yàn)樗膶κ挚扇)。因此,它在那一時(shí)期最多多賺到 ,而它在以后永遠(yuǎn)失去p時(shí)利潤的一半,即,2020/7/28,18,因此,如果 ,即 ,背離價(jià)格p并非最佳做法。,2020/7/28,19,平均支付(average payoff

9、):為得到相等的現(xiàn)值之和在每一階段都應(yīng)得到的等額支付值,令貼現(xiàn)因子為 ,那么,無限支付序列 的現(xiàn)值之和 為,無限支付序列 的現(xiàn)值之和為 。,那么, 是無限支付序列 的平均支付,它是各階段支付現(xiàn)值之和的 倍。,2020/7/28,20,無名氏定理,2020/7/28,21,對于目前考察的重復(fù)價(jià)格博弈來說,無名氏定理說的是,任何一對滿足,的利潤 都是 充分接近于1時(shí)的階段均衡支付。,就是說,存在完美均衡策略 。使得對所有的企業(yè)i來說,企業(yè)的階段支付為,2020/7/28,22,含義:在無限期重復(fù)博弈中,如果參與人有足夠的耐心(即 足夠大),那么,任何滿足個(gè)人理性的可行支付向量都可以通過一個(gè)特定的子

10、博弈完美均衡得到。,兩個(gè)暗示:,它們表明了如果參與人是短視的,則不能維持團(tuán)體想要的結(jié)果,參與人有長期目標(biāo)的情況下可以維持;,它們表明重復(fù)博弈的均衡結(jié)果集合是巨大的,所以,均衡概念缺乏預(yù)測的能力。,2020/7/28,23,2.5.4 魯賓斯坦討價(jià)還價(jià)模型,兩個(gè)參與人需要就如何分割一塊蛋糕達(dá)成協(xié)議,在第 階段 (偶數(shù)階段)參與人1提出一種分配方案(出價(jià)) ,參與人2可以接受也可以拒絕,如果接受,那么博弈結(jié)束,如果拒絕,他就在其后的奇數(shù)階段中提出自己的分配方案建議。,每個(gè)參與人的支付函數(shù)為:如果在t階段達(dá)成協(xié)議,那么,貼現(xiàn)支付為 ,x為參與人1獲得的蛋糕份額,1-x 為參與人2獲得的蛋糕份額, 與

11、 分別為兩個(gè)參與人的貼現(xiàn)因子。,2020/7/28,24,多重納什均衡,例如“參與人1總是要求得到 ,并拒絕任何其他提議,參與人2總是提議 ,并接受任何提議”就是一個(gè)納什均衡,但它不是一個(gè)子博弈完美均衡:如果參與人2拒絕參與人1的第一次出價(jià),而還價(jià) ,則參與人1應(yīng)該接受,因?yàn)榧词瓜乱浑A段他得到整個(gè)蛋糕,其價(jià)值也只有 。,2020/7/28,25,有限博弈的唯一子博弈均衡:在最后一個(gè)階段,不失一般性,設(shè)出價(jià)者為參與人1,他要得到整個(gè)蛋糕,而另一方接受;在這之前的一個(gè)階段中,參與人1拒絕所有使他的份額小于 的提議。然后,按照這種方式逆推。,有限期模型的缺點(diǎn),解依賴于期限的長短與最后是哪一方出價(jià);,如果最后一階段沒有達(dá)成協(xié)議,有限期模型不允許參與人進(jìn)一步努力以達(dá)成一個(gè)合理的協(xié)議。,2020/7/28,26,無限期的魯賓斯坦模型中存在唯一一個(gè)子博弈完美均衡:,2020/7/28,27,2020/7/28,28,2020/7/28,29,2020/7/28,30,供應(yīng)鏈的協(xié)調(diào),一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論