博弈論第五章-重復(fù)搏弈(Repeated-Games)課件_第1頁
博弈論第五章-重復(fù)搏弈(Repeated-Games)課件_第2頁
博弈論第五章-重復(fù)搏弈(Repeated-Games)課件_第3頁
博弈論第五章-重復(fù)搏弈(Repeated-Games)課件_第4頁
博弈論第五章-重復(fù)搏弈(Repeated-Games)課件_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第五章 重復(fù)搏弈(Repeated Games) 本章介紹基本博弈重復(fù)進行構(gòu)成的重復(fù)博弈。雖然形式上是基本博弈的重復(fù)進行,但重復(fù)博弈中博弈方的行為和博弈結(jié)果卻不一定是基本博弈的簡單重復(fù),因為博弈方對于博弈會重復(fù)進行的意識,會使他們對利益的判斷發(fā)生變化,從而使他們在重復(fù)博弈過程中的行為選擇受到影響。這意味著不能把重復(fù)博弈當(dāng)作基本博弈的簡單疊加,必須把整個重復(fù)博弈過程作為整體進行研究。2021/7/131第五章 重復(fù)搏弈(Repeated Games) 一、有限次重復(fù)博弈二、無限次重復(fù)博弈三、參與人不固定時的重復(fù)博弈四、應(yīng)用舉例2021/7/132一、有限次重復(fù)博弈2021/7/132信息集 挺好

2、用見下圖2021/7/133信息集 挺好用2021/7/133在每一個重復(fù)博弈中,有一個實施許多遍的組件博弈有時候稱作階段博弈。博弈中的盈利是每個階段的盈利之和 2021/7/134在每一個重復(fù)博弈中,有一個實施許多遍的組件博弈有時候稱作重復(fù)博弈重復(fù)博弈:指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈”。如囚徒困境。重復(fù)博弈類型:有限次重復(fù)博弈無限次重復(fù)博弈隨機結(jié)束的重復(fù)博弈2021/7/135重復(fù)博弈重復(fù)博弈:指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱重復(fù)博弈重復(fù)博弈的特征:1、階段博弈之間沒有“物質(zhì)上”的聯(lián)系,即前一階段的博弈不改變后一階段的結(jié)構(gòu) ;2、所有參與人都觀測到博弈過去的

3、歷史;3、參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權(quán)平均均值。貼現(xiàn)因子:下一期的一單位支付在這一期的價值。注意:在每個階段,參與人可同時行動,也可不同時行動。2021/7/136重復(fù)博弈重復(fù)博弈的特征:2021/7/136重復(fù)博弈 因為其他參與人過去的歷史總是可以觀測到的,因此,一個參與人可以使自己在某個階段博弈的選擇依賴于其他參與人過去的行動歷史,因此,參與人在重復(fù)博弈中的戰(zhàn)略空間遠遠大于和復(fù)雜于每一階段的戰(zhàn)略空間,這意味著,重復(fù)博弈可能帶來一些“額外”的均衡結(jié)果。 影響重復(fù)博弈均衡結(jié)果的主要因素是博弈重復(fù)的次數(shù)和信息的完備性。 博弈重復(fù)的次數(shù)的重要性來源于參與人在短期利益和長遠利益

4、之間的權(quán)衡。 信息的完備性:當(dāng)一個參與人的支付函數(shù)不為其他參與人知道時,該參與人可能有積極性建立一個“好”的聲譽以換取長遠利益。2021/7/137重復(fù)博弈 因為其他參與人過去的歷史總是可以觀重復(fù)博弈的要素策略、子博弈、均衡路徑支付(得益)貼現(xiàn)系數(shù)有限次重復(fù)博弈無限次重復(fù)博弈2021/7/138重復(fù)博弈的要素策略、子博弈、均衡路徑2021/7/138重復(fù)博弈隨機停止與貼現(xiàn)率:設(shè)停止重復(fù)的概率為p,繼續(xù)重復(fù)的概率為1p。2021/7/139重復(fù)博弈隨機停止與貼現(xiàn)率:2021/7/139定義:令G=A1, A2,An; u1, u2,un)表示n個局中人的完全信息博弈,對G重復(fù)若干次,稱G為階段博

5、弈。給定階段博弈G,令G(T)表示G 實施T(T為大于1的整數(shù))次的重復(fù)博弈。在某次階段博弈開始之前,所有已采取過的前面階段的行動都可以觀察到。局中人在G(T)的盈利函數(shù)或效用簡單的為來自T個階段博弈盈利現(xiàn)時值之和。有限重復(fù)博弈2021/7/1310定義:令G=A1, A2,An; u1, u2,u定理:如果階段博弈G有唯一的Nash均衡,那么對任意有限次T,重復(fù)博弈G(T)有唯一的子博弈完美結(jié)局:在每一階段取G的Nash均衡策略。注1:定理中要求的唯一Nash均衡可以是混合策略均衡。如猜謎游戲。注2:階段博弈G可以不是靜態(tài)的,假如階段博弈G是完全且完美信息動態(tài)博弈時,且具有唯一的“逆向歸納”

6、結(jié)局,那么G(T)有唯一的子博弈完美結(jié)局。當(dāng)階段博弈具有唯一的Nash均衡時2021/7/1311定理:如果階段博弈G有唯一的Nash均衡,那么對任意有限次T舉例有限次重復(fù)博弈:寡頭市場的削價競爭連鎖店悖論:2021/7/1312舉例有限次重復(fù)博弈:寡頭市場的削價競爭2021/7/1312寡頭市場的削價競爭這個博弈的納什均衡是什么?假定博弈共進行10次,結(jié)果會如何?為什么會出現(xiàn)這個結(jié)果?3,36,11,65,5高價企業(yè)乙企業(yè)甲低價高價低價價格大戰(zhàn)中的囚徒困境2021/7/1313寡頭市場的削價競爭這個博弈的納什均衡是什么?3,36,11,逆向歸納法 假定現(xiàn)在是第十次,結(jié)果和一次博弈一樣。第九次

7、,即倒數(shù)第二次,局中人已經(jīng)很清楚,最后一次博弈對方肯定要實行低價,因此,現(xiàn)在如何對他施行好心都不會在下一次得到好報,所以,理性人的“我”沒有理由實施高價使對方獲益。依次類推。3,36,11,65,5高價企業(yè)乙企業(yè)甲低價高價低價2021/7/1314逆向歸納法3,36,11,65,5高價企業(yè)乙企業(yè)甲低價高價低連鎖店悖論進入者進入不進入在位者默許斗爭默許(-10,0)(0,300)(0,300)(40,50)xx在位者斗爭 假定同樣的市場上有20個(可以理解為在位者有20個連鎖店),進入者每次進入一個市場,博弈就變成了20次重復(fù)博弈。 假定進入者進入第1個市場,在位者應(yīng)該如何反應(yīng)呢?2021/7/

8、1315連鎖店悖論進入者進入不進入在位者默許斗爭默許(-10,0)(結(jié)論:不存在純戰(zhàn)略納什均衡和存在惟一的純戰(zhàn)略納什均衡,作為原博弈構(gòu)成的有限次重復(fù)博弈,共同特點是重復(fù)博弈本質(zhì)上不過是原博弈的簡單重復(fù),重復(fù)博弈的子博弈完美納什均衡就是每次重復(fù)采用原博弈的納什均衡。2021/7/1316結(jié)論:不存在純戰(zhàn)略納什均衡和存在惟一的純戰(zhàn)略納什均衡,作為原多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈考慮下面的三價博弈: 該博弈存在兩個純戰(zhàn)略納什均衡(M,M)和(L,L)。顯然一次博弈的結(jié)果效率不是最高的,因此有帕雷托改進的余地。廠商2HML廠商1H5,50,60,2M6,03,30,2L2,02,01,1202

9、1/7/1317多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈考慮下面的三價博弈:廠多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈現(xiàn)在考慮該博弈重復(fù)進行的情況。如果這個博弈重復(fù)進行兩次:兩次重復(fù)博弈的純戰(zhàn)略路徑:9981子博弈完美納什均衡路徑:兩階段都采用原博弈同一個純戰(zhàn)略納什均衡,或者輪流采用不同純戰(zhàn)略納什均衡,或者兩次都采用混合戰(zhàn)略納什均衡,或者混合戰(zhàn)略和純戰(zhàn)略輪流采用。2021/7/1318多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈現(xiàn)在考慮該博弈重復(fù)進行多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈在這些子博弈完美納什均衡路徑中,確實存在第一階段采用(H,H)的子博弈完美納什均衡。雙方的戰(zhàn)略是:局中人1:第一次選H

10、;如第一次結(jié)果為(H,H),則第二次選M,如第一次結(jié)果為任何其它戰(zhàn)略組合,則第二次選L。局中人2:同局中人1。2021/7/1319多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈在這些子博弈完美納什均多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈此戰(zhàn)略組合的兩次重復(fù)博弈的路徑:第一階段(H,H),第二階段(M,M),此為一個子博弈完美納什均衡路徑。證明:第二階段是一個原博弈的納什均衡,因此不可能有哪一方會愿意單獨偏離;第一階段的(H,H)雖然不是原博弈的納什均衡,一方單獨偏離,采用M能增加1單位得益,但這樣的話,在第二階段至少要損失2單位得益,因為對方采用的“有報復(fù)機制”的戰(zhàn)略。偏離(H,H)得不償失,合理的

11、選擇是堅持H。2021/7/1320多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈此戰(zhàn)略組合的兩次重復(fù)博多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈總結(jié):觸發(fā)戰(zhàn)略(Trigger Strategy),首先試探合作,一旦發(fā)現(xiàn)對方不合作,則也用不合作相報復(fù)的戰(zhàn)略。觸發(fā)戰(zhàn)略是重復(fù)博弈中實現(xiàn)合作和提高均衡效率的關(guān)鍵機制,是重復(fù)博弈分析的重要“構(gòu)件”之一。在觸發(fā)戰(zhàn)略中,第二階段的選擇實際上是一種條件選擇。2021/7/1321多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈總結(jié):2021/7/1多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈當(dāng)?shù)谝浑A段結(jié)果為(H,H)時,第二階段必為(M,M);當(dāng)?shù)谝浑A段結(jié)果為其它8種結(jié)果是,第二階段必

12、為(L,L)。把上面的分析加到原博弈得到下面的博弈,該博弈的納什均衡為(H,H)廠商2HML廠商1H8,81,71,3M7,14,41,3L3,13,12,22021/7/1322多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈當(dāng)?shù)谝浑A段結(jié)果為(H,多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈如果此博弈重復(fù)多次,一般地說n次,仍然可以采用觸發(fā)戰(zhàn)略得到較好的結(jié)果:子博弈完美納什均衡路徑為,除了最后一次重復(fù)外,每次都采用(H,H),最后一次重復(fù)采用原博弈的納什均衡(M,M)。當(dāng)重復(fù)的次數(shù)較多時,平均得益接近于一次性博弈中的(H,H)的得益(5,5)。2021/7/1323多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈如果

13、此博弈重復(fù)多次,一結(jié)論:如果階段博弈G=A1, A2,An; u1, u2,un)具有多重Nash均衡,那么可能(但不必)存在重復(fù)博弈G(T)的子博弈完美均衡結(jié)局,其中對于任意的tT,在t階段的結(jié)局并不是G的Nash均衡。多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈2021/7/1324結(jié)論:如果階段博弈G=A1, A2,An; u1, u多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈觸發(fā)戰(zhàn)略的可信性問題從合作開始,一直到有一方不合作,然后永遠選擇不合作。2021/7/1325多個純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈觸發(fā)戰(zhàn)略的可信性問題2無限次重復(fù)博弈無限次重復(fù)博弈與有限重復(fù)博弈的區(qū)別:無限次重復(fù)博弈沒有結(jié)束

14、重復(fù)的確定時間。在有限次重復(fù)博弈中,存在最后一次重復(fù)正是破壞重復(fù)博弈中局中人利益和行為的相互制約關(guān)系,使重復(fù)博弈無法實現(xiàn)更高效率均衡的關(guān)鍵問題。無限次重復(fù)博弈不能忽視不同時間得益的價值差異和貼現(xiàn)問題,必須考慮后一期得益的貼現(xiàn)系數(shù),對局中人和博弈均衡的分析必須以平均得益或總得益的現(xiàn)值為根據(jù)。無限次重復(fù)博弈與有限次重復(fù)博弈的共同點:試圖“合作”和懲罰“不合作”是實現(xiàn)理想均衡的關(guān)鍵,是構(gòu)造高效率均衡戰(zhàn)略的核心構(gòu)件。2021/7/1326無限次重復(fù)博弈無限次重復(fù)博弈與有限重復(fù)博弈的區(qū)別:2021/無限次重復(fù)博弈一個男孩被視為傻瓜,因為每當(dāng)別人拿一枚1角硬幣和5分硬幣讓他選的時候,他總是選5分的,有一個

15、人覺得奇怪,就問他:“為什么你不拿1角錢的?”,男孩小聲回答:“假若我拿了1角錢的硬幣,下次他們就不會拿錢讓我選了?!?021/7/1327無限次重復(fù)博弈一個男孩被視為傻瓜,因為每當(dāng)別人拿一枚1角硬幣無限次重復(fù)博弈兩人零和博弈的無限次重復(fù)博弈:所有階段都不可能發(fā)生合作,局中人會一直重復(fù)原博弈的混合戰(zhàn)略納什均衡。2021/7/1328無限次重復(fù)博弈兩人零和博弈的無限次重復(fù)博弈:2021/7/1惟一純戰(zhàn)略納什均衡博弈的無限次重復(fù)博弈原博弈惟一的納什均衡本身是帕雷托效率意義上最佳戰(zhàn)略組合,符合各局中人最大利益:采用原博弈的純戰(zhàn)略納什均衡本身是各局中人能實現(xiàn)的最好結(jié)果,符合所有局中人的利益,因此,不管

16、是重復(fù)有限次還是無限次,不會和一次性博弈有區(qū)別。惟一的納什均衡不是效率最高的戰(zhàn)略組合,存在潛在合作利益的囚徒困境博弈:2021/7/1329惟一純戰(zhàn)略納什均衡博弈的無限次重復(fù)博弈原博弈惟一的納什均衡本惟一純戰(zhàn)略納什均衡博弈的無限次重復(fù)博弈無限次重復(fù)囚徒困境:囚徒困境博弈重復(fù)無窮次,結(jié)果如何?證明得出,如果參與人有足夠的耐心,(抵賴,抵賴)是一個子博弈精練納什均衡結(jié)果)。觸發(fā)戰(zhàn)略(1)開始選擇抵賴;(2)選擇抵賴一直到有一方選擇了坦白,然后永遠選擇坦白。-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴 無限次重復(fù)博弈使其走出了囚徒困境,背后的原因是: 如果博弈重復(fù)無窮次而且

17、每個人有足夠的耐心,任何短期機會主義行為的所得都是微不足道的,參與人有積極性為自己建立一個樂于合作的聲譽,同時也有積極性懲罰對方的機會主義的行為。2021/7/1330惟一純戰(zhàn)略納什均衡博弈的無限次重復(fù)博弈無限次重復(fù)囚徒困境:-兩寡頭價格競爭博弈:一次性博弈的惟一純戰(zhàn)略納什均衡(L,L),雙方的得益(1,1)4,40,55,01,1局中人2局中人1HLHL2021/7/1331兩寡頭價格競爭博弈:4,40,55,01,1局中人2局中人1無限次重復(fù)囚徒困境觸發(fā)戰(zhàn)略:第一階段采用H,在第t階段,如果前t1階段的結(jié)果都是(H,H),則繼續(xù)采用H,否則采用L。結(jié)論:在不同時期得益的貼現(xiàn)因素 較大時,雙

18、方采用上述戰(zhàn)略構(gòu)成無限次重復(fù)博弈的一個子博弈完美納什均衡。2021/7/1332無限次重復(fù)囚徒困境觸發(fā)戰(zhàn)略:第一階段采用H,在第t階段,如果無限次重復(fù)囚徒困境局中人2:如第一階段選L,如第一階段采用H,下一階段也采用H,一直下去2021/7/1333無限次重復(fù)囚徒困境局中人2:2021/7/1333無限次重復(fù)囚徒困境2021/7/1334無限次重復(fù)囚徒困境2021/7/1334無限次重復(fù)古諾模型:壟斷合作 假定: , 邊際成本都為2。 在無限次重復(fù)古諾模型中,當(dāng)貼現(xiàn)率 滿足一定條件時,兩廠商采用下列觸發(fā)策略構(gòu)成一個子博弈完美納什均衡: 在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5;在第 t 階段,如果前

19、 t-1 階段結(jié)果都是(1.5,1.5),則繼續(xù)生產(chǎn)1.5,否則生產(chǎn)古諾產(chǎn)量2。 2021/7/1335無限次重復(fù)古諾模型:壟斷合作 假定: 設(shè)廠商1已采用該觸發(fā)策略,若廠商2也采用該觸發(fā)策略,則每期得益4.5,無限次重復(fù)博弈總得益的現(xiàn)值為: 如果廠商2偏離上述觸發(fā)策略,則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時,自己的最大利潤產(chǎn)量,即滿足: 解得 ,此時利潤為5.0625,高于觸發(fā)策略第一階段得益4.5。2021/7/1336 設(shè)廠商1已采用該觸發(fā)策略,若廠商2也采用該觸發(fā)策 但從第二階段開始,廠商1將報復(fù)性地永遠采用古諾產(chǎn)量2,這樣廠商2也被迫永遠采用古諾產(chǎn)量,從此得利潤4。因此,無限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為: 當(dāng) 上述策略是廠商2對廠商1的同樣觸發(fā)策略的最佳反應(yīng),否則偏離是最佳反應(yīng)。 2021/7/1337 但從第二階段開始,廠商1將報復(fù)性地永遠采用古無限次重復(fù)古諾模型:低水平合作觸發(fā)戰(zhàn)略:在第一階段生產(chǎn)q*(該產(chǎn)量位于qm/2和qc之間);在第t階段,如果前t1階段的結(jié)果都是(q*,q*),則繼續(xù)生產(chǎn)q*,否則生產(chǎn)古諾產(chǎn)量qc2。分析:雙方都采用觸發(fā)戰(zhàn)略時均衡路徑為每階段都是(q*,q*),兩廠商的得益都為2021/7/1338無限次重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論