博弈論重復(fù)博弈.pptx_第1頁(yè)
博弈論重復(fù)博弈.pptx_第2頁(yè)
博弈論重復(fù)博弈.pptx_第3頁(yè)
博弈論重復(fù)博弈.pptx_第4頁(yè)
博弈論重復(fù)博弈.pptx_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、,2,為什么現(xiàn)實(shí)生活中并不總是出現(xiàn)“囚徒困境”?,3,重復(fù)博弈,4,重復(fù)博弈引論,為何研究重復(fù)博弈經(jīng)濟(jì)中的長(zhǎng)期關(guān)系人們的預(yù)見性未來(lái)利益對(duì)當(dāng)前行為的制約長(zhǎng)期合同、回頭客、長(zhǎng)客和一次性買賣的區(qū)別有無(wú)確定的結(jié)束時(shí)間,5,無(wú)限次重復(fù)博弈:一個(gè)基本博弈G一直重復(fù)博弈下去的博弈G()策略:博弈方在每個(gè)階段針對(duì)每種情況如何行為的計(jì)劃子博弈:從某個(gè)階段(不包括第一階段)開始,包括此后所有的重復(fù)博弈部分均衡路徑:由每個(gè)階段博弈方的行為組合串聯(lián)而成,6,重復(fù)博弈和無(wú)名氏定理,重復(fù)十次(1)兩人同時(shí)選好十次策略(2)兩人一次博弈接一次博弈,10次(3)一人先選一人后選,10次,圖2-27囚徒困境問(wèn)題,囚徒2,囚徒1

2、,7,重復(fù)博弈和無(wú)名氏定理,重復(fù)博弈(repeatedgame)的定義指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈(stagegame)”。如兩個(gè)多次犯罪的“囚徒問(wèn)題”。由于動(dòng)態(tài)博弈是相機(jī)行動(dòng),反映到重復(fù)博弈中,就是可以使自己在某個(gè)階段的博弈選擇依賴于其他參與人過(guò)去的行動(dòng)歷史。,8,重復(fù)博弈與策略空間的擴(kuò)展,如囚徒困境的重復(fù)博弈的一個(gè)策略可以是:“如果這次你選擇了坦白,我下次將選擇坦白;如果你這次選擇了抵賴,我下次將選擇抵賴”。因此,參與人在重復(fù)博弈中的策略空間遠(yuǎn)遠(yuǎn)大于和復(fù)雜于在每個(gè)階段博弈中的策略空間。假定上屬博弈重復(fù)多次或無(wú)限次;那么,每個(gè)參與人有多個(gè)可以選擇的戰(zhàn)略:僅舉幾例:A

3、ll-D:不論過(guò)去什么發(fā)生,總是選擇不合作;All-C:不論過(guò)去什么發(fā)生,總是選擇合作;合作-不合作交替進(jìn)行;tit-for-tat:從合作開始,之后每次選擇對(duì)方前一階段的行動(dòng);triggerstrategies:從合作開始,一直到有一方不合作,然后永遠(yuǎn)選擇不合作。,9,10,兩個(gè)均衡,11,均衡:(進(jìn)入,合謀)為什么實(shí)際上還是有很多會(huì)選擇(進(jìn)入,斗爭(zhēng))?,12,重復(fù)博弈和無(wú)名氏定理,如此一直倒推回去,我們得到這個(gè)博弈的唯一子博弈精煉均衡是在位者在每一個(gè)市場(chǎng)上都選擇默許,進(jìn)入者在每一個(gè)市場(chǎng)上選擇進(jìn)入。這就是所謂的“連鎖店悖論”(chain-storeparadox,Selten,1978)因?yàn)?/p>

4、實(shí)際生活中,進(jìn)入者和在位者在每個(gè)市場(chǎng)都斗得你死我活,13,有限次重復(fù)博弈定理,令G是階段博弈,G(T)是G重復(fù)T次的重復(fù)博弈(T)。如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是:階段博弈G的納什均衡重復(fù)T次(即每個(gè)階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果)。只要博弈的重復(fù)次數(shù)是有限的,重復(fù)本身并不改變囚徒困境的均衡結(jié)果。條件:“唯一性”:如果納什均衡不是唯一的,那會(huì)怎么樣?有限性:如果博弈重復(fù)無(wú)限次,那會(huì)怎么樣?時(shí)間性:如果每次博弈的收益受到時(shí)間(貼現(xiàn)率、利率、風(fēng)險(xiǎn)、通貨膨脹)的影響,那會(huì)怎么樣?,14,多個(gè)均衡的重復(fù)博弈,(H,H)是“合作”,但不是NENE為(M,M

5、)(L,L)純策略=動(dòng)作混合策略=?條件策略(H|M,M|H,L|L)其他策略,15,多個(gè)均衡的重復(fù)博弈,兩階段博弈(HH,HH)仍然不是NE,16,17,等價(jià)于一次博弈,HH是均衡,所以沒有人愿意偏離,18,如果背叛,今天的收益加1,但是明天的收益減2(合作的收益為3,背叛的收益為1),19,眼前利益與長(zhǎng)遠(yuǎn)利益,欺騙的短期收益,信譽(yù)的長(zhǎng)期收益,時(shí)間,20,當(dāng)博弈有多個(gè)納什均衡時(shí),參與人可以使用不同的納什均衡懲罰前面階段的不合作行為或獎(jiǎng)勵(lì)第一階段的合作行為。從而迫使大家合作,21,人們?yōu)槭裁磿?huì)做好事(合作)?因?yàn)橛忻魈斓幕貓?bào),或者避免明天的懲罰。人的理性就在于,為了將來(lái)更大的利益,可以犧牲眼前

6、利益。大部分的小孩和動(dòng)物,一般就做不到這一點(diǎn)。,今天欺騙的收獲合作后的收獲(承諾)欺騙后的收獲(威脅),教訓(xùn):在發(fā)展關(guān)系的時(shí)候,承諾合作后的收益以及威脅欺騙的懲罰,有時(shí)能夠激勵(lì)今天良好行為的發(fā)生。而這種行為,有助于創(chuàng)建一個(gè)好的未來(lái)!,22,先別急著吃棉花糖,有三只青蛙在河中的一片葉子上順?biāo)?。其中一只想跳到河里。在葉子上還剩幾只青蛙?吃掉棉花糖等于吃掉未來(lái)!,23,無(wú)限次重復(fù)博弈,圖2-27囚徒困境問(wèn)題,囚徒2,囚徒1,24,首先,(一直坦白,一直坦白)可以是一個(gè)均衡有沒有其他的均衡?也即:有沒有其他的策略,當(dāng)雙方都采用該策略之后,就沒有人反悔去用其他策略?如果你知道對(duì)方會(huì)一直坦白,那么你的

7、最佳應(yīng)對(duì)是一直坦白T,T,T,T,T,T,T,T,25,考慮下列所謂的“冷酷策略”(grimstrategies):開始時(shí)選擇抵賴;選擇抵賴直到有一方選擇了坦白,然后永遠(yuǎn)選擇坦白。,重復(fù)博弈和無(wú)名氏定理,圖2-27囚徒困境問(wèn)題,囚徒2,囚徒1,26,D,D,D,D,D,D,D,D,D,D,D,D,T,T,T,.T,D,T,D,T,.T,D,D,D,D,D,T,T,T,T,.,27,重復(fù)博弈和無(wú)名氏定理,首先證明冷酷策略是一個(gè)納什均衡回顧一下,所謂納什均衡,就是這樣的一個(gè)狀態(tài),對(duì)于任意一個(gè)參與人,給定其他參與人選擇納什均衡策略,該參與人都無(wú)法偏離納什均衡策略。因此,證明囚徒問(wèn)題中冷酷策略是一個(gè)納

8、什均衡的方法是:給定其中任意一個(gè)參與人堅(jiān)持“冷酷戰(zhàn)略”,另外一個(gè)參與人的最優(yōu)選擇也是堅(jiān)持冷酷戰(zhàn)略。,28,如果i在博弈的某個(gè)階段首先選擇了坦白,在該階段得到0單位的支付,優(yōu)于選擇抵賴得到的-1。但這個(gè)機(jī)會(huì)主義行為將觸發(fā)他的伙伴選擇“永遠(yuǎn)坦白”的懲罰,因此i隨后每個(gè)階段的支付都是-8。(-1是獎(jiǎng)勵(lì),-8是懲罰)因此,如果下列條件滿足,給定對(duì)手沒有選擇坦白,i將不會(huì)選擇坦白,這個(gè)不等式是否正確?,有限和無(wú)限的不同,希爾伯特旅館的故事,29,另外一種計(jì)算方法,這個(gè)策略為什么不適用于兩階段(有限)重復(fù)博弈?,因?yàn)橛心嫦驓w納法:大家在第二階段肯定都坦白,也即,第二階段肯定是-8,不會(huì)有-1,30,所以,

9、無(wú)限很重要給你100萬(wàn),你愿意今天要這個(gè)錢還是明天(10年后)要這個(gè)錢?Why?今天的錢并不等于明天的錢:利率明天的錢并不等于今天的錢:貼現(xiàn)率,31,貼現(xiàn)率,將未來(lái)資產(chǎn)折算成現(xiàn)值(presentvalue)的利率,一般是用當(dāng)時(shí)零風(fēng)險(xiǎn)的利率來(lái)當(dāng)作貼現(xiàn)率,但并不是絕對(duì)。舉個(gè)例子:貼現(xiàn)率為10%,明年的100塊在今年就相當(dāng)于100/(1+10%)=90.909090.塊錢,到了去年就是100/(1+10%)*(1+10%),也就是說(shuō),今年用90.909090.塊可以買到的東西相當(dāng)于明年100塊可以買到的東西。今天投資100萬(wàn)元的項(xiàng)目,將來(lái)如能收回200萬(wàn),也不能證明此項(xiàng)投資一定有效。因?yàn)槿绻@回收的

10、200萬(wàn)要等50年之后,今天衡量的價(jià)值就遠(yuǎn)低于100萬(wàn)。這是由于如果利率是3%,100萬(wàn)元存銀行,50年內(nèi)得到的利息也將達(dá)338萬(wàn)元(利率為2%的話,50年的利息為169萬(wàn)元)。所以50年后回收200萬(wàn)的投資與存銀行得利息相比不值得去做。貼現(xiàn)率:將來(lái)的錢現(xiàn)在花,把將來(lái)的錢借給現(xiàn)在利率:現(xiàn)在的錢存起來(lái)將來(lái)花,把現(xiàn)在的錢借給將來(lái),32,考慮貼現(xiàn)因子的重復(fù)博弈,設(shè)a為貼現(xiàn)因子(假定兩人貼現(xiàn)因子相同)。貼現(xiàn)因子=1/(1+貼現(xiàn)率)如果i在博弈的某個(gè)階段首先選擇了坦白,在該階段得到0單位的支付,優(yōu)于選擇抵賴得到的-1。但這個(gè)機(jī)會(huì)主義行為將觸發(fā)他的伙伴選擇“永遠(yuǎn)坦白”的懲罰,因此i隨后每個(gè)階段的支付都是-

11、8。因此,如果下列條件滿足,給定對(duì)手沒有選擇坦白,i將不會(huì)選擇坦白,即,33,a1/8a太小,則將來(lái)的錢根本不管用,將來(lái)不值得期待(有未來(lái),但是更期待今天)因此,冷酷戰(zhàn)略是一個(gè)納什均衡。,34,重復(fù)博弈和無(wú)名氏定理,該策略是否是子博弈精煉均衡?因?yàn)椴┺闹貜?fù)無(wú)限次,從任何一個(gè)階段開始的子博弈與這個(gè)博弈的結(jié)構(gòu)完全相同。在冷酷戰(zhàn)略均衡下,子博弈可以分為兩類:在類型a,沒有任何參與人曾經(jīng)坦白;在類型b,至少有一個(gè)參與人曾經(jīng)坦白。,35,重復(fù)博弈和無(wú)名氏定理,在類型a中,我們已經(jīng)證明,冷酷戰(zhàn)略在a類型子博弈中構(gòu)成納什均衡;在b類子博弈中,根據(jù)冷酷戰(zhàn)略,參與人只是重復(fù)單階段博弈的納什均衡,因此也是子博弈的

12、納什均衡。因此,如果a1/8,冷酷戰(zhàn)略是無(wú)限次囚徒博弈的一個(gè)子博弈精煉納什均衡。,36,重復(fù)博弈和無(wú)名氏定理,該博弈還有許多其他子博弈精煉均衡。各期都坦白,是另一個(gè)子博弈精煉納什均衡子博弈精煉均衡的多重性是無(wú)限次重復(fù)博弈的普遍問(wèn)題。,37,更多例子,無(wú)限次重復(fù)古諾模型支持壟斷產(chǎn)量的條件:P194-195低水平的合作:P195-197加大懲罰力度和提高合作水平:P197-199復(fù)雜的現(xiàn)實(shí)(OPEC):P199-200工資:P200-205,38,39,Axelrod(1984),Tit-for-tat是成功率最高的戰(zhàn)略,40,41,懲罰與合作,Abreu(1986):最大合作戰(zhàn)略是使用最嚴(yán)厲的可

13、信懲罰(thestrongestcrediblepunishment);維護(hù)合作并不需要無(wú)限期的懲罰;只要懲罰期足夠長(zhǎng)就可以了;蘿卜加大棒(stickandcarrot):從合作開始,一直合作直到:如果有任何一方在t期不合作,在t+1期,前期合作者選擇“不合作”來(lái)實(shí)施懲罰,前期不合作者選擇合作;如果該合作的沒有合作或者該懲罰的沒有懲罰,在t+2期繼續(xù)按照上述t+1期的策略規(guī)定博弈;否則,合作恢復(fù)。,42,仁:人不犯我,我不犯人怒:以眼還眼,以手還手即:(君子報(bào)仇,十年不晚)?。簩捤?duì)方,寬以待人信:說(shuō)到做到,43,概率問(wèn)題,有可能有限,有可能無(wú)限明天是否繼續(xù)是一個(gè)概率事件什么情況?人們也是傾向

14、于合作如果沒有明天,今天就會(huì)為非作歹如果有無(wú)限多明天,作惡不懲罰,今天就會(huì)為非作歹如果有無(wú)限多明天,作惡會(huì)懲罰,今天就會(huì)合作如果明天有可能或者,也有可能掛掉,作惡會(huì)懲罰,則今天有可能合作,合作的可能性看明天掛掉的概率和作惡懲罰的力度,44,不可信的懲罰:壟斷廠家,客戶,商家,不購(gòu)買,購(gòu)買,誠(chéng)實(shí),欺騙,(5,5),(1,7),(0,0),45,不確定性下的最優(yōu)處罰,在確定的情況下,懲罰越嚴(yán)厲,越有助于合作。因?yàn)榫馇闆r下,欺騙從來(lái)不會(huì)發(fā)生,所以懲罰實(shí)際上是沒有成本的。但在不確定的情況下,即使每個(gè)人都選擇合作,“壞結(jié)果”也會(huì)出現(xiàn)。如果壞結(jié)果總是觸發(fā)懲罰,就會(huì)冤枉好人,過(guò)重的懲罰反到導(dǎo)致不合作;但如

15、果總是原諒,合作也不會(huì)發(fā)生。,46,家族企業(yè)的困境;“殺熟”,如果懲罰對(duì)懲罰者本身的損害太大,懲罰就是不可信的。這與投鼠忌器是一個(gè)道理,你討厭老鼠,但是你沒有辦法,因?yàn)槟阈奶勰莻€(gè)盤子,那個(gè)器皿。投鼠忌器在我們企業(yè)內(nèi)部很多環(huán)節(jié)都會(huì)發(fā)生,導(dǎo)致懲罰不可信,所以對(duì)方就不會(huì)太注重信譽(yù)。家族成員有時(shí)候比非家族成員更不可信任,更不守規(guī)矩,就是這個(gè)道理。朋友專門騙朋友,是“殺熟”。問(wèn)題也與懲罰的不可信有關(guān)。,47,長(zhǎng)期參與人與不固定的短期參與人,最簡(jiǎn)單的例子是廠家與消費(fèi)者之間的博弈:每個(gè)消費(fèi)者一般只購(gòu)買一次,而廠家重復(fù)出售產(chǎn)品給眾多的消費(fèi)者。此時(shí),只要消費(fèi)者足夠多,并且每個(gè)消費(fèi)者能觀察到前一個(gè)消費(fèi)者購(gòu)買的產(chǎn)品

16、的質(zhì)量,合作仍然可以出現(xiàn)。,48,產(chǎn)品質(zhì)量博弈,購(gòu)買,不購(gòu)買,高質(zhì)量,低質(zhì)量,1,1,-1,2,0,0,0,0,49,社會(huì)規(guī)范:集體抵制,Boycott:每個(gè)人都應(yīng)該誠(chéng)實(shí);都有責(zé)任懲罰騙過(guò)人的人;不參與懲罰的人應(yīng)該受到懲罰;如:假定A在t期欺騙了B,C在t+1期就不應(yīng)該與B合作,否則,D在t+2期就不應(yīng)該與C合作;如果C在t+1期與B合作,而D在t+2期又與C合作,F(xiàn)在t+3期就不應(yīng)該與D合作,如此等等;(美國(guó)對(duì)不參與伊拉克戰(zhàn)爭(zhēng)的國(guó)家的態(tài)度);,50,敵友規(guī)則,開始把所有的人當(dāng)朋友;t期的朋友關(guān)系繼續(xù)保持到t+1期,當(dāng)只當(dāng)他在t期不曾騙過(guò)任何人并不曾與你的敵人合作;朋友的朋友是朋友;朋友的敵人

17、是敵人;敵人的朋友是敵人;敵人的敵人未必是朋友。,51,傳統(tǒng)社會(huì)的個(gè)人信譽(yù),在傳統(tǒng)社會(huì),人們常年生活在封閉的村莊,村民之間彼此非常熟悉,欺騙行為很容易識(shí)別,人們之間的口頭交流足以使任何欺騙行為廣為而知,每個(gè)人的歷史都存儲(chǔ)在別人的腦海里,對(duì)欺騙行為的懲罰即使不能施加于欺騙者本人,也可以通過(guò)家庭成員而實(shí)現(xiàn),前面講的四個(gè)條件基本是可以得到滿足。因此,即使沒有法律,村民之間也可以建立起高度的信任,欺騙行為很少發(fā)生。,計(jì)算機(jī)中的博弈(大作業(yè)),調(diào)研博弈在計(jì)算機(jī)中的應(yīng)用情況,給出自己的見解。如何調(diào)研(演示,CNKI、Scholar、WOS)調(diào)研的廣度要求(5篇論文,至少1篇外文論文,至少2篇2012年以后的論文)調(diào)研的深度要求(1篇高引用(50次引用)的論文,1篇SCI期刊論文)調(diào)研的連續(xù)性要求(2篇被引用論文中,存在引用關(guān)系)調(diào)研的結(jié)果展示要求(一定要在調(diào)研報(bào)告中出現(xiàn)引用標(biāo)記,對(duì)每篇論文,關(guān)聯(lián)的文字100字)自己的見解(一定要有自己的見解、思考,這部分不允許引用,文字300字),52,計(jì)算機(jī)中的博弈(大作業(yè)),調(diào)研形式:小組調(diào)研、小組討論,形成小組結(jié)果自由組隊(duì),組員不超過(guò)5名每個(gè)組員的貢獻(xiàn)在結(jié)果報(bào)告中明確寫明結(jié)果形式:調(diào)研報(bào)告+(條件)課堂報(bào)告時(shí)間:一個(gè)月,6月19號(hào)課堂報(bào)告若

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論