版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三章 完全、完美信息動(dòng)態(tài)博弈 本章討論動(dòng)態(tài)博弈,所有博弈方都對(duì)博弈過(guò)程和收益完全了解的完全且完美信息動(dòng)態(tài)博弈。這類(lèi)博弈也是現(xiàn)實(shí)中常見(jiàn)的基本博弈類(lèi)型。由于動(dòng)態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對(duì)動(dòng)態(tài)博弈分析的概念和方法,特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動(dòng)態(tài)博弈模型。本章分六節(jié)3.1動(dòng)態(tài)博弈的表示法和特點(diǎn)3.2可信性和納什均衡的問(wèn)題3.3子博弈和子博弈完美納什均衡3.4幾個(gè)經(jīng)典動(dòng)態(tài)博弈模型3.5有同時(shí)選擇的動(dòng)態(tài)博弈模型3.6動(dòng)態(tài)博弈分析的問(wèn)題和擴(kuò)展討論復(fù)習(xí)1:什么是動(dòng)態(tài)博弈 動(dòng)態(tài)博弈(d
2、ynamic game)是指參與人的行動(dòng)有先后順序,而且行動(dòng)在后者可以觀(guān)察到行動(dòng)在先者的選擇,并據(jù)此作出相應(yīng)的選擇。 那么,根據(jù)定義,生活中有些什么動(dòng)態(tài)博弈呢?復(fù)習(xí)2:完美信息與不完美信息 完美信息的博弈是指在博弈的任何階段,每個(gè)參與者都清楚博弈之前發(fā)生的所有行動(dòng),也即每個(gè)信息集都是一個(gè)單元素集合。 沒(méi)有完美信息的博弈具有不完美信息。復(fù)習(xí)3:完全信息與不完全信息 按照參與人對(duì)其他參與人的了解程度分為完全信息博弈和不完全信息博弈。 完全信息博弈是指在博弈過(guò)程中,每一位參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。 如果參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或
3、者不是對(duì)所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者不可置信威脅合作(40,50)斗爭(zhēng)(-10,0)一個(gè)動(dòng)態(tài)博弈的例子:產(chǎn)業(yè)進(jìn)入壁壘進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者可信威脅合作(40,50)斗爭(zhēng)(10,0)3.1 動(dòng)態(tài)博弈的表示法和特點(diǎn)3.1.1 階段和擴(kuò)展性表示3.1.2 動(dòng)態(tài)博弈的基本特點(diǎn)3.1.1 階段和擴(kuò)展性表示 階段:動(dòng)態(tài)博弈中一個(gè)博弈方的一次選擇行為 例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2 動(dòng)
4、態(tài)博弈的基本特點(diǎn) 策略是在整個(gè)博弈中所有選擇、行為的計(jì)劃 結(jié)果是上述“計(jì)劃型”策略的策略組合,構(gòu)成一條路徑 收益對(duì)應(yīng)每條路徑,而不是對(duì)應(yīng)選擇、行為 動(dòng)態(tài)博弈的非對(duì)稱(chēng)性先后次序決定動(dòng)態(tài)博弈必然是非對(duì)稱(chēng)的。 先選擇、行為的博弈方有時(shí)更有利,有“先行優(yōu)勢(shì)”。一 博弈擴(kuò)展式表述博弈的基本構(gòu)造結(jié): 包括決策結(jié)和終點(diǎn)結(jié)兩類(lèi);決策結(jié)是參與人行動(dòng)的始點(diǎn),終點(diǎn)結(jié)是決策人行動(dòng)的終點(diǎn).結(jié)滿(mǎn)足傳遞性和非對(duì)稱(chēng)性x之前的所有結(jié)的集合,稱(chēng)為x的前列集P(x),x之后的所有結(jié)的集合稱(chēng)為x的后續(xù)集T(x)。博弈擴(kuò)展式表述l 枝: 枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線(xiàn),每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇.l 信息集: 每個(gè)信息集
5、是決策結(jié)集合的一個(gè)子集,該子集包括所有滿(mǎn)足下列條件的決策結(jié):1 每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);2 該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)A開(kāi)發(fā)不開(kāi)發(fā)NN大小1/21/2大小1/21/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略收益參與人集合參與人行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開(kāi)發(fā)博弈結(jié),決策結(jié)終點(diǎn)結(jié)枝結(jié),初始結(jié) 信息集A開(kāi)發(fā)不開(kāi)發(fā)NN大小1/21/2大小1/21/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)
6、發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3) (1,0)(0,8)(0,0)(0,1)(0,0) B在決策時(shí)有不確定性房地產(chǎn)開(kāi)發(fā)博弈A開(kāi)發(fā)不開(kāi)發(fā)NN大小1/21/2大小1/21/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策) 房地產(chǎn)開(kāi)發(fā)博弈博弈擴(kuò)展式表述 只包含一個(gè)決策結(jié)的信息集稱(chēng)為單結(jié)信息集,如果博弈樹(shù)的所有信息都是單結(jié)的,該博弈稱(chēng)為完美信息博弈。 自然總是假定是單結(jié)的,因?yàn)樽匀辉趨⑴c人決策之后行動(dòng)等價(jià)于自然在參與人之前行動(dòng)但參與人不能觀(guān)測(cè)到
7、自然的行動(dòng)。 不同的博弈樹(shù)可以代表相同的博弈,但是有一個(gè)基本規(guī)則:一個(gè)參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。AB坦白抵賴(lài)BBAA坦白抵賴(lài)坦白抵賴(lài)(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵賴(lài)坦白抵賴(lài)坦白抵賴(lài)(-8,-8)(0,-10) (-10,0) (-1,-1)囚徒困境博弈的擴(kuò)展式表述囚徒困境博弈的擴(kuò)展式表述3.2 可信性和納什均衡的問(wèn)題3.2.1 相機(jī)選擇和策略中的可信性問(wèn)題3.2.2 納什均衡的問(wèn)題3.2.3 逆推歸納法3.2.1 相機(jī)選擇和策略中的可信性問(wèn)題不同版本的開(kāi)金礦博弈分錢(qián)和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分開(kāi)金
8、礦博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的開(kāi)金礦博弈分錢(qián)打官司都可信3.2.1 相機(jī)選擇和策略中的可信性問(wèn)題乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的開(kāi)金礦博弈分錢(qián)打官司都不可信3.2.1 相機(jī)選擇和策略中的可信性問(wèn)題3.2.2 納什均衡的問(wèn)題第三種開(kāi)金礦博弈中, (不借-不打,不分)和(借-打,分)都是納什均衡。但后者不可信,不可能實(shí)現(xiàn)或穩(wěn)定。 結(jié)論結(jié)論:納什均衡在動(dòng)態(tài)博弈可能缺乏穩(wěn)定性,也就是說(shuō),在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡,在動(dòng)態(tài)博弈中可能可能是不穩(wěn)定的,不能作為預(yù)測(cè)的基礎(chǔ)。 根源根源:納什均衡本身不能排
9、除博弈方策略中包含的不可信的行為設(shè)定,不能解決動(dòng)態(tài)博弈的相機(jī)選擇引起的可信性問(wèn)題3.2.3 逆推歸納法定義定義:從動(dòng)態(tài)博弈的最后一個(gè)階段博弈方的行為開(kāi)始分析,逐步倒推回前一個(gè)階段相應(yīng)博弈方的行為選擇,一直到第一個(gè)階段的分析方法,稱(chēng)為“逆推歸納法逆推歸納法”。 逆推歸納法是動(dòng)態(tài)博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3 子博弈和子博弈完美納什均衡3.3.1 子博弈3.3.2 子博弈完美納什均衡完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n考慮下列問(wèn)題:一個(gè)博弈可能有多個(gè)(甚至無(wú)窮多個(gè))納什均衡,究竟哪個(gè)更合理?納什均衡假定每一個(gè)參與人在選擇自己的最
10、優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動(dòng)有先有后,后行動(dòng)者的選擇空間依賴(lài)于前行動(dòng)者的選擇,前行動(dòng)者在選擇時(shí)不可能不考慮自己的行動(dòng)對(duì)后行動(dòng)者的影響。子博弈精練納什均衡的一個(gè)重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開(kāi)。3.3.1 子博弈 定義:由一個(gè)動(dòng)態(tài)博弈第一階段以外的某階段開(kāi)始的后續(xù)博弈階段構(gòu)成的,有初始信息集和進(jìn)行博弈所需要的全部信息,能夠自成一個(gè)博弈的原博弈的一部分,稱(chēng)為原動(dòng)態(tài)博弈的一個(gè)“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965) 曹操與袁紹的倉(cāng)亭之戰(zhàn),曹操召集將領(lǐng)來(lái)獻(xiàn)破袁之策
11、,程昱獻(xiàn)了十面埋伏之計(jì),他讓曹操退軍河上,誘袁前來(lái)追擊,到那時(shí)“我軍無(wú)退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計(jì),令許褚誘袁軍軍至河上,曹軍無(wú)退路,操大呼曰:“前無(wú)去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。3.3.2 子博弈完美納什均衡定義定義:如果一個(gè)完美信息的動(dòng)態(tài)博弈中,各博弈方的策略構(gòu)成的一個(gè)策略組合滿(mǎn)足,在整個(gè)動(dòng)態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡,那么這個(gè)策略組合稱(chēng)為該動(dòng)態(tài)博弈的一個(gè)“子博弈完美納什均衡”。 子博弈完美納什均衡能夠排除均衡策略中不可信的威脅和承諾,因此是真正穩(wěn)定的。 逆推歸納法是求完美信息動(dòng)態(tài)博弈子博弈完美納什均衡的基本方法。完全信息動(dòng)態(tài)博弈-子博弈精練納
12、什均衡(舉例)澤爾騰(1965)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者合作(40,50)斗爭(zhēng)(-10,0)市場(chǎng)進(jìn)入阻撓博弈樹(shù)特點(diǎn):剔除博弈中包含的不可置信威脅。 承諾行動(dòng)-破釜沉舟-背水一戰(zhàn)v給定進(jìn)入者進(jìn)入,剔除(進(jìn)入,斗爭(zhēng)),(進(jìn)入,默許)是唯一的子博弈精練納什均衡-舉例(結(jié)婚-反對(duì))不可置信威脅收益函數(shù)行動(dòng)子博弈精練納什均衡n一個(gè)納什均衡稱(chēng)為精練納什均衡,當(dāng)只當(dāng)參與人的戰(zhàn)略在每個(gè)子博弈中都構(gòu)成納什均衡,也就是說(shuō),組成精練納什均衡的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的。n一個(gè)精練納什均衡首先必須是一個(gè)納什均衡,但納什均衡不一定是精練納什均衡。n承諾行動(dòng)-當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動(dòng)。完
13、全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果,簡(jiǎn)單說(shuō),子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。子博弈精練納什均衡n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果n子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n子博弈:是原博弈的一部分,它本身也可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析:(1)子博弈必
14、須從一個(gè)單結(jié)信息點(diǎn)開(kāi)始:只有決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的初始結(jié)。如果信息集包含兩個(gè)以上的決策結(jié),則這兩個(gè)都不可以作為子博弈的初始結(jié)(見(jiàn)下頁(yè))。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng)x和x在原博弈中屬于同一信息集時(shí),他們?cè)谧硬┺闹胁艑儆谕恍畔⒓?。n習(xí)慣上,任何博弈的本身稱(chēng)為自身的一個(gè)子博弈。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n子博弈精練納什均衡: 擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1,0)(
15、0,1)(0,0)(-3,-3)xx房地產(chǎn)開(kāi)發(fā)博弈開(kāi)發(fā)不開(kāi)發(fā)(1,0)(-3,-3)x開(kāi)發(fā)(0,1)(0,0)x子博弈I子博弈II(不開(kāi)發(fā),(開(kāi)發(fā),開(kāi)發(fā)),(開(kāi)發(fā),(不開(kāi)發(fā),開(kāi)發(fā)),(開(kāi)發(fā),(不開(kāi)發(fā),不開(kāi)發(fā))在c上構(gòu)成均衡,在b上不構(gòu)成; 在b和c上都構(gòu)成 在c上構(gòu)成均衡,在b上不構(gòu)成完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)不開(kāi)發(fā) 判斷下列均衡結(jié)果哪個(gè)構(gòu)成子博弈精練納什均衡?不開(kāi)發(fā)bc完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n如果一個(gè)博弈有幾個(gè)子博弈,一個(gè)特定的納什均衡決定了原博弈樹(shù)上唯一的一條路徑,這條路徑稱(chēng)為“均衡路徑”,博弈樹(shù)上的其他路徑稱(chēng)為“非均衡路徑”。n
16、納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的;n而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實(shí)質(zhì)區(qū)別。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n戰(zhàn)略是參與人行動(dòng)規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見(jiàn)的情況下(即每一個(gè)決策結(jié))上選擇什么行動(dòng),即使這種情況實(shí)際上沒(méi)有發(fā)生(甚至參與人并不預(yù)期它會(huì)發(fā)生)。n因此,只有當(dāng)一個(gè)戰(zhàn)略規(guī)定的行動(dòng)規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個(gè)合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動(dòng)規(guī)則。用逆向
17、歸納法求-子博弈精練納什均衡1UDL(3,1)(0,0)22,2R 給定博弈達(dá)到最后一個(gè)決策結(jié),該決策結(jié)上行動(dòng)的參與人有一個(gè)最優(yōu)選擇,這個(gè)最優(yōu)選擇即該決策結(jié)開(kāi)始的子博弈的納什均衡 倒數(shù)第二個(gè)決策結(jié),找倒數(shù)第二個(gè)的最優(yōu)選擇,這個(gè)最優(yōu)選擇與我們?cè)诘谝徊秸业降淖顑?yōu)選擇構(gòu)成一個(gè)納什均衡。 用逆向歸納法求-子博弈精練納什均衡1UDL(3,1)(0,0)22,2R如此重復(fù)直到初始結(jié)。每一步都得到對(duì)應(yīng)于子博弈的一個(gè)納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個(gè)過(guò)程的最后一步得到整個(gè)博弈的納什均衡完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n用逆向歸納法求子博弈精練納什均衡
18、 對(duì)于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個(gè)最簡(jiǎn)便的方法。A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開(kāi)發(fā)博弈完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)1UDL(1,1)22,0RU(3,0)(0,2)2D 子博弈精練納什均衡(U,U),L). U和L分別是參與人1和參與人2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過(guò)程,實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過(guò)程:從最后一個(gè)決策結(jié)依次剔除每個(gè)子博弈的劣戰(zhàn)略,最后生存下來(lái)的戰(zhàn)略構(gòu)成精練納什均衡。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n用逆向歸納法求解的子博弈
19、精練納什均衡也要求“所有的參與人是理性的”是共同知識(shí)。n如果博弈由多個(gè)階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者市場(chǎng)進(jìn)入阻撓博弈樹(shù)不可置信威脅收益函數(shù)行動(dòng)合作(40,50)斗爭(zhēng)(-10,0)承諾行動(dòng)與子博弈精練納什均衡n承諾行動(dòng)與子博弈精練納什均衡n有些戰(zhàn)略之所以不是精練納什均衡,是因?yàn)樗瞬豢芍眯诺耐{戰(zhàn)略,如果參與人能在博弈之前采取某種行動(dòng)改變自己的行動(dòng)空間或支付函數(shù),原來(lái)不可置信威脅將變得可置信,博弈的精練納什均衡也會(huì)隨之改變.承諾行動(dòng)與子博弈精練納什均衡n這些改變博弈結(jié)果而采取的
20、措施稱(chēng)為承諾行動(dòng).n完全承諾:承諾可以使某項(xiàng)行動(dòng)完全沒(méi)有可能(破釜沉舟).n不完全承諾:承諾只是增加了某個(gè)行動(dòng)的成本而不是使該活動(dòng)完全沒(méi)有可能.承諾行動(dòng)與子博弈精練納什均衡A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開(kāi)發(fā)博弈 如果在A(yíng)決策之前,B與某客戶(hù)簽定了一個(gè)合同,規(guī)定B若不在特定時(shí)期內(nèi)開(kāi)發(fā)若干面積的寫(xiě)字樓,則將支付違約金3.5,這個(gè)合同就是承諾行動(dòng).(1,-3.5)承諾行動(dòng)與子博弈精練納什均衡n經(jīng)常有這樣的情況,非理性-通常是自動(dòng)的而不是策略性的-是一個(gè)優(yōu)勢(shì)。n在電影怪愛(ài)博士中的末日機(jī)器就是一個(gè)例子。前蘇聯(lián)認(rèn)為不可能在一場(chǎng)理性的軍備競(jìng)賽中超過(guò)更富有
21、的美國(guó),所以,他制造了一顆炸彈,如果任何人引爆了這顆炸彈,它將自動(dòng)炸毀整個(gè)世界。著部電影描述了這樣一個(gè)細(xì)節(jié),你必須告訴對(duì)方你有這么一個(gè)末日機(jī)器。n據(jù)說(shuō)前美國(guó)總統(tǒng)尼克松曾告訴他的副手哈德蔓,他對(duì)這個(gè)策略更復(fù)雜的看法:我稱(chēng)為瘋子理論,我要讓北越相信我已經(jīng)到了無(wú)論付出多少都要結(jié)束戰(zhàn)爭(zhēng)的地步,我們只要他聽(tīng)到這樣的傳聞:“看在上帝的份上,尼克松已經(jīng)被共產(chǎn)黨搞瘋了,當(dāng)他生氣的時(shí)候,我們沒(méi)法制止他,他的手已經(jīng)按在核按紐上了?!焙久鲀商熘髸?huì)到巴黎求和的。重復(fù)博弈 其他參與人過(guò)去的歷史總是可以觀(guān)測(cè)到的一個(gè)參與人可以使自己在某個(gè)階段博弈的選擇依賴(lài)于其他參與人過(guò)去的行動(dòng)歷史參與人在重復(fù)博弈中的戰(zhàn)略空間遠(yuǎn)遠(yuǎn)大于和
22、復(fù)雜于每一階段的戰(zhàn)略空間重復(fù)博弈可能帶來(lái)一些“額外”的均衡結(jié)果。 重復(fù)博弈 影響重復(fù)博弈均衡結(jié)果的主要因素是博弈重復(fù)的次數(shù)和信息的完備性。 博弈重復(fù)的次數(shù)的重要性來(lái)源于參與人在短期利益和長(zhǎng)遠(yuǎn)利益之間的權(quán)衡。 信息的完備性:當(dāng)一個(gè)參與人的支付函數(shù)不為其他參與人知道時(shí),該參與人可能有積極性建立一個(gè)“好”的聲譽(yù)以換取長(zhǎng)遠(yuǎn)利益。重復(fù)博弈和無(wú)名氏定理 有限次重復(fù)博弈連鎖店悖論進(jìn)入者進(jìn)入不進(jìn)入在位者默許斗爭(zhēng)默許(-10,0)(0,300)(0,300)(40,50)xx在位者斗爭(zhēng) 假定同樣的市場(chǎng)上有20個(gè)(可以理解為在位者有20個(gè)連鎖店),進(jìn)入者每次進(jìn)入一個(gè)市場(chǎng),博弈就編程了20次重復(fù)博弈。 假定進(jìn)入者進(jìn)
23、入第1個(gè)市場(chǎng),在位者應(yīng)該如何反應(yīng)呢?重復(fù)博弈和無(wú)名氏定理這個(gè)博弈的納什均衡是什么?假定博弈共進(jìn)行10次,結(jié)果會(huì)如何?為什么會(huì)出現(xiàn)這個(gè)結(jié)果?倒推論證法 假定現(xiàn)在是第十次,結(jié)果和一次博弈一樣。第九次,即倒數(shù)第二次,局中人已經(jīng)很清楚,最后一次博弈對(duì)方肯定要實(shí)行低價(jià),因此,現(xiàn)在如何對(duì)他施行好心都不會(huì)在下一次得到好報(bào),所以,理性人的“我”沒(méi)有理由實(shí)施高價(jià)使對(duì)方獲益。依次類(lèi)推。高價(jià)企業(yè)乙企業(yè)甲低價(jià)高價(jià)低價(jià)價(jià)格大戰(zhàn)中的囚徒困境價(jià)格大戰(zhàn)中的囚徒困境重復(fù)博弈 無(wú)限次重復(fù)博弈囚徒困境博弈重復(fù)無(wú)窮次,結(jié)果如何?證明得出,如果參與人有足夠的耐心,(抵賴(lài),抵賴(lài))是一個(gè)子博弈精練納什均衡結(jié)果)。冷酷戰(zhàn)略(1)開(kāi)始選擇抵賴(lài)
24、;(2)選擇抵賴(lài)一直到有一方選擇了坦白,然后永遠(yuǎn)選擇坦白。囚徒A囚徒 B坦白抵賴(lài)坦白抵賴(lài) 無(wú)限次重復(fù)博弈使其走出了囚徒困境,背后的原因是: 如果博弈重復(fù)無(wú)窮次而且每個(gè)人有足夠的耐心,任何短期機(jī)會(huì)主義行為的所得都是微不足道的。簡(jiǎn)單邏輯 一個(gè)男孩被視為傻瓜,因?yàn)槊慨?dāng)別人拿一枚1角硬幣和5分硬幣讓他選的時(shí)候,他總是選5分的 有一個(gè)人覺(jué)得奇怪,就問(wèn)他:“為什么你不拿1角錢(qián)的?” 男孩小聲回答:“假若我拿了1角錢(qián)的硬幣,下次他們就不會(huì)拿錢(qián)讓我選了?!敝貜?fù)博弈和無(wú)名氏定理n參與人不固定時(shí)的重復(fù)博弈廠(chǎng)商消費(fèi)者購(gòu)買(mǎi)不購(gòu)買(mǎi)高質(zhì)量低質(zhì)量質(zhì)量博弈 假定只有一個(gè)廠(chǎng)商提供產(chǎn)品,每個(gè)消費(fèi)者只買(mǎi)一次,且每個(gè)階段只有一個(gè)消費(fèi)
25、者。 為什么消費(fèi)者偏好于購(gòu)買(mǎi)大商店的產(chǎn)品而不相信走街串巷的小商販?一次博弈的均衡結(jié)果重復(fù)博弈和無(wú)名氏定理n參與人不固定時(shí)的重復(fù)博弈廠(chǎng)商消費(fèi)者購(gòu)買(mǎi)不購(gòu)買(mǎi)高質(zhì)量低質(zhì)量質(zhì)量博弈 如果廠(chǎng)商的貼現(xiàn)因子 =1/2,則無(wú)限次重復(fù)博弈的納什均衡為: 廠(chǎng)商從生產(chǎn)高質(zhì)量的產(chǎn)品廠(chǎng)商從生產(chǎn)高質(zhì)量的產(chǎn)品開(kāi)始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,開(kāi)始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,除非曾經(jīng)生產(chǎn)過(guò)低質(zhì)量產(chǎn)品,除非曾經(jīng)生產(chǎn)過(guò)低質(zhì)量產(chǎn)品,如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)品,之后永遠(yuǎn)生產(chǎn)低質(zhì)量的產(chǎn)品,之后永遠(yuǎn)生產(chǎn)低質(zhì)量的產(chǎn)品。品。 第一個(gè)消費(fèi)者選擇購(gòu)買(mǎi),第一個(gè)消費(fèi)者選擇購(gòu)買(mǎi),只要廠(chǎng)商不曾生產(chǎn)過(guò)低質(zhì)量的只要廠(chǎng)商不曾生產(chǎn)過(guò)低質(zhì)量的產(chǎn)品
26、,隨后消費(fèi)者繼續(xù)購(gòu)買(mǎi),產(chǎn)品,隨后消費(fèi)者繼續(xù)購(gòu)買(mǎi),如果廠(chǎng)商曾件生產(chǎn)過(guò)低質(zhì)量的如果廠(chǎng)商曾件生產(chǎn)過(guò)低質(zhì)量的產(chǎn)品,之后消費(fèi)者不再購(gòu)買(mǎi)。產(chǎn)品,之后消費(fèi)者不再購(gòu)買(mǎi)。重復(fù)博弈的均衡結(jié)果貼現(xiàn)因子:下一期的一單位支付在這一期的價(jià)值。重復(fù)博弈和無(wú)名氏定理 參與人不固定時(shí)的重復(fù)博弈廠(chǎng)商廠(chǎng)商消費(fèi)者消費(fèi)者購(gòu)買(mǎi)購(gòu)買(mǎi)不購(gòu)買(mǎi)不購(gòu)買(mǎi)高質(zhì)量高質(zhì)量低質(zhì)量低質(zhì)量質(zhì)量博弈質(zhì)量博弈 廠(chǎng)商:如果生產(chǎn)低質(zhì)量的產(chǎn)品,得到的短期利潤(rùn)是2,但之后每階段利潤(rùn)為0,如果總是生產(chǎn)高質(zhì)量的產(chǎn)品,每階段得到1單位利潤(rùn),貼現(xiàn)值為1/(1- ) =2,廠(chǎng)商將不會(huì)生產(chǎn)低質(zhì)量產(chǎn)品。害怕失掉消費(fèi)者。 消費(fèi)者: =1/2,其只關(guān)心1階段的支付,只有當(dāng)預(yù)期高質(zhì)量時(shí),才會(huì)
27、購(gòu)買(mǎi)。消費(fèi)者預(yù)期不曾生產(chǎn)過(guò)低質(zhì)量產(chǎn)品的廠(chǎng)商將繼續(xù)生產(chǎn)高質(zhì)量產(chǎn)品,故選擇購(gòu)買(mǎi),反之亦然廠(chǎng)商生產(chǎn)過(guò)高質(zhì)量的產(chǎn)品.重復(fù)博弈的均衡結(jié)果 克萊因等認(rèn)為這個(gè)例子可以解釋為什么消費(fèi)者偏好去大商店購(gòu)買(mǎi)東西而不信賴(lài)走街串巷的小商販。 西蒙等用類(lèi)似博弈解釋雇傭關(guān)系,認(rèn)為,企業(yè)存在的原因之一正式創(chuàng)造一個(gè)“長(zhǎng)期的參與人”,這樣一個(gè)參與人由于對(duì)未來(lái)利益的考慮而更講信用。3.4 幾個(gè)經(jīng)典動(dòng)態(tài)博弈模型3.4.1 寡占的斯塔克博格模型3.4.2 勞資博弈3.4.3 討價(jià)還價(jià)博弈3.4.4 委托人代理人理論3.4.1 寡占的斯塔克博格模型 先后選擇產(chǎn)量的產(chǎn)量競(jìng)爭(zhēng)博弈 把古諾模型改為廠(chǎng)商1先選擇,廠(chǎng)商2后選擇,而非同時(shí)選擇即可。
28、QQPPqqQ8)(,21221 cc121111112)(8 )(qqqqqcQPqu212116qqqq221222222)(8 )(qqqqqcQPqu222126qqqq第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡n斯坦克爾伯的寡頭競(jìng)爭(zhēng)模型企業(yè)1企業(yè)2v參與人:企業(yè)參與人:企業(yè)1 1、企業(yè)、企業(yè)2 2;v行動(dòng)順序:企業(yè)行動(dòng)順序:企業(yè)1 1先選擇產(chǎn)量先選擇產(chǎn)量q q1 1,企業(yè),企業(yè)2 2觀(guān)測(cè)到觀(guān)測(cè)到q q1 1,然后選,然后選 擇自己的產(chǎn)量擇自己的產(chǎn)量q q2 2。v支付:支付: 利潤(rùn),利潤(rùn)是兩個(gè)企業(yè)產(chǎn)量的函數(shù)利潤(rùn),利潤(rùn)是兩個(gè)企業(yè)產(chǎn)量的函數(shù)n斯坦克爾伯的寡頭競(jìng)爭(zhēng)模型nqi :第i個(gè)企
29、業(yè)的產(chǎn)量nC:代表單位不變成本n假定逆需求函數(shù)為:n第i個(gè)企業(yè)的利潤(rùn)函數(shù)為:企業(yè)1企業(yè)22 , 1),)(),(21icQPqqqii)()(21qqaQP斯坦克爾伯的寡頭競(jìng)爭(zhēng)模型n用你向歸納法求解,首先考慮給定q1的情況下,企業(yè)2的最優(yōu)選擇。企業(yè)2的問(wèn)題是:)(),(212212cqqaqqqMax最優(yōu)化一階條件意味著:)(21)(1122cqaqSq因?yàn)槠髽I(yè)1預(yù)測(cè)到企業(yè)2將根據(jù)S2(q1)來(lái)選擇q2,企業(yè)1在第1階段的問(wèn)題是:)()(,(111211cqSqaqqSqMax)(21*1caq)(41*2caq斯坦克爾伯的寡頭競(jìng)爭(zhēng)模型n均衡結(jié)果比較)(21ca)(31ca)(31ca2)(9
30、1ca2)(91ca)(21ca)(41ca2)(81ca2)(161ca2)(41ca)(21ca2)(41ca)(32ca)(43ca2)(92ca2)(163ca斯坦克爾伯的寡頭競(jìng)爭(zhēng)模型n從上述計(jì)算可以看出:n斯坦克爾伯的均衡總產(chǎn)量大于庫(kù)諾特均衡總產(chǎn)量,企業(yè)1的斯坦克爾伯的均衡產(chǎn)量大于庫(kù)諾特均衡產(chǎn)量,企業(yè)2的斯坦克爾伯的均衡產(chǎn)量小于庫(kù)諾特均衡產(chǎn)量。同樣,企業(yè)1在斯坦克爾伯博弈中的利潤(rùn)大于在庫(kù)諾特博弈中的利潤(rùn),企業(yè)2的利潤(rùn)卻有所下降,這就是所謂的“先動(dòng)優(yōu)勢(shì)”。斯坦克爾伯的寡頭競(jìng)爭(zhēng)模型n從上述計(jì)算可以看出: 擁有信息優(yōu)勢(shì)可能使參與人處于劣勢(shì)。企業(yè)1先行動(dòng)的承諾價(jià)值 :企業(yè)1之所以獲得斯坦克爾
31、伯利潤(rùn)而不是庫(kù)諾特利潤(rùn),是因?yàn)樗漠a(chǎn)品一旦生產(chǎn)出來(lái)就變成了一種積淀成本,無(wú)法改變,從而使企業(yè)2不得不承認(rèn)它的威脅是可置信的。而假如企業(yè)1只是宣布了它將生產(chǎn) ,企業(yè)2是不會(huì)相信她的威脅的。)(21ca 3.4.2 勞資博弈先由工會(huì)決定工資率,再由廠(chǎng)商決定雇用多少勞動(dòng)力)(*WLRL0W L廠(chǎng)商的反應(yīng)函數(shù)R(L)斜率為W)(max),(max00WLLRLWLLLW0工會(huì)的無(wú)差異曲線(xiàn))(*WL)(*WL0u1u2u3u*W)(,max*0WLWuW 采用逆推歸納法 利用廠(chǎng)商的效用函數(shù)計(jì)算出最佳反應(yīng) 帶入工會(huì)效用函數(shù)計(jì)算出均衡用工數(shù)量 聯(lián)想:吉利公司如何與沃爾沃公司達(dá)成一致?3.4.2 勞資博弈 分
32、冰激凌的故事 游戲規(guī)則:第一輪由第一個(gè)參與人(小鵑)提出條件,第二個(gè)參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進(jìn)入第二輪; 小明提出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進(jìn)入第三輪; 冰激凌融化呈線(xiàn)性,游戲結(jié)束,冰激凌融化3.4.3 討價(jià)還價(jià)博弈 第二種情況:桌上放了一個(gè)冰淇淋冰激凌,但兩輪談判過(guò)后,冰激凌將完全融化。博弈結(jié)果如何? 第三種情況:桌上的冰淇淋冰激凌在三輪談判后將完全融化,結(jié)果又如何?3.4.3 討價(jià)還價(jià)博弈 第四種情況:桌上的冰淇淋冰激凌在四輪談判后將完全融化,或者在五輪談判、六輪,100輪談判后將完全融化,結(jié)果又如何? 博弈的結(jié)果是:假如“輪數(shù)”是偶
33、數(shù),雙方各得一半,假若論述是奇數(shù),則小鵑得到(n+1)/2n;小明得到(n-1)/(2n) 最后:如果分的不是冰激凌,而是大白兔奶糖呢?3.4.3 討價(jià)還價(jià)博弈 兩個(gè)玩家 二人收益供給10000元 現(xiàn)在二人將針對(duì)每個(gè)人將獲得多少而展開(kāi)討價(jià)還價(jià)博弈3.4.3 討價(jià)還價(jià)博弈有限期輪流出價(jià)無(wú)貼現(xiàn) 回合T為奇數(shù),小王先出價(jià) 由于回合數(shù)為奇數(shù) 接受或拒絕沒(méi)有差異,因此所有的均衡都是弱的 均衡結(jié)果只決定于小張最后決定接受的時(shí)間 第一回合:小王的方案是自己得X1,小張得10000-S1 小張若接受,二人收益分別為S1和10000-S1,談判結(jié)束。如果小張拒絕,則開(kāi)始第二回合談判。 第二回合:小張的方案是小王
34、得S2,自己得10000-S2 如果拒絕,則開(kāi)始第三回合談判:小王自己得S3,小張得10000-S3,此時(shí)小張必須接受有限期輪流出價(jià)無(wú)貼現(xiàn) 這三回合中雙方所提出的S1、S2和S3都是0到 10000之間的任意金額 可以認(rèn)為由于S1、S2和S3都有無(wú)限多種 所以這個(gè)討價(jià)還價(jià)博弈是一個(gè)無(wú)限策略的動(dòng)態(tài)博弈有限期輪流出價(jià)無(wú)貼現(xiàn) 改變基本假設(shè),改變博弈均衡 假設(shè)小王仍然先出價(jià) 回合數(shù)為偶數(shù)時(shí),博弈的結(jié)果就是小張將得到全部收益。 這就是所謂的后發(fā)優(yōu)勢(shì)有限期輪流出價(jià)無(wú)貼現(xiàn)相同貼現(xiàn)討價(jià)還價(jià) 有貼現(xiàn)的情況就是討價(jià)還價(jià)每多進(jìn)行一個(gè)回合,由于談判費(fèi)用和利息損失等,雙方的利益都要打一個(gè)折扣 假設(shè)條件雙方折扣率均為 回
35、合數(shù)T=3。3.4.3 討價(jià)還價(jià)博弈三回合討價(jià)還價(jià)112不接受,出S3接受不接受,出S2接受出S1)10000(,22SS)10000,(11SS)10000(,3232SSSS2SSS211000010000三回合討價(jià)還價(jià)博弈結(jié)果的討論益越大甲的得益越小,乙的收越大,時(shí),當(dāng)益越小甲的得益越大,乙的收越大,時(shí),當(dāng)5 . 0015 . 0相同貼現(xiàn)討價(jià)還價(jià) 第一回合:小王的方案是自己得S1,小張得10000-S1。小張若接受,二人收益分別為S1和10000-S1,談判結(jié)束。如果小張拒絕,則開(kāi)始第二回合談判 第二回合:小張的方案是小王得S2,自己得10000-S2。小王若接受,二人收益分別為S2和(
36、10000-S2),談判結(jié)束 如果拒絕,則開(kāi)始第三回合談判:小王自己得S3,小張得10000-S3,此時(shí)小張必須接受,最后二人的實(shí)際收益分別為 和 )10000(22S22S 這三回合中雙方所提出的S1、S2和S3都是0到 10000之間的任意金額 由于S1、S2和S3都有無(wú)限多種,所以這個(gè)討價(jià)還價(jià)博弈是一個(gè)無(wú)限策略的動(dòng)態(tài)博弈。相同貼現(xiàn)討價(jià)還價(jià)有不同貼現(xiàn)的討價(jià)還價(jià) 假設(shè)小王的折扣率為1,小張的折扣率為2, 兩人知道對(duì)方的折扣率 回合數(shù)T=3 用逆推歸納法來(lái)分析這個(gè)博弈有不同貼現(xiàn)的討價(jià)還價(jià) 第三回合:知道雙方的收益 第二回合:小張?jiān)诘诙睾蠒?huì)出能讓小王接受的,也是可能使自己收益最大的S2,應(yīng)滿(mǎn)足
37、使小王收益 第一回合:小王只要令10000-S1=2,即 S1=10000-2即可。這樣第一回合與第二回合小張的收益相同,而小王的收益S1=10000-2,比第二、三回合收益更大。 小王會(huì)在第一回合出價(jià)S1=10000-2,小張會(huì)接受 最終二人收益分別為S1=10000-2和2 這就是這種有限奇數(shù)次討價(jià)還價(jià)有貼現(xiàn)情況的均衡解。有不同貼現(xiàn)的討價(jià)還價(jià)無(wú)限期討價(jià)還價(jià) 貼現(xiàn)肯定存在 與有限期討價(jià)還價(jià)邏輯推理相同 小張獲得的收益與自己的折扣率呈增函數(shù)關(guān)系,而與對(duì)方的折扣率呈減函數(shù)關(guān)系無(wú)限回合討價(jià)還價(jià)SS211000010000SSS211000010000110000*S11000010000*S3.4
38、.4 委托人代理人理論一、委托人代理人關(guān)系 經(jīng)濟(jì)活動(dòng)和社會(huì)活動(dòng)中有很多委托人代理人關(guān)系,有明顯的,也有隱蔽的。工廠(chǎng)和工人、店主和店員、客戶(hù)和律師、市民和政府、基金購(gòu)買(mǎi)者和基金管理人等都是。 委托人代理人關(guān)系的關(guān)鍵特征:不能直接控制,監(jiān)督不完全,信息不完全,利益的相關(guān)性 委托人代理人涉及問(wèn)題:激勵(lì)機(jī)制設(shè)計(jì)、機(jī)制設(shè)計(jì)理論,委托合同設(shè)計(jì)問(wèn)題等二、無(wú)不確定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懶努力拒絕接受不委托委托代理人的選擇激勵(lì)相容約束: w(E)-E w(S)-S w(E) w(S)+E-S代理人博弈 委托人的激勵(lì)
39、制度設(shè)計(jì)必須滿(mǎn)足兩個(gè)約束,即參與約束與激勵(lì)相容約束。 參與約束是指代理人執(zhí)行此契約的效用大于不執(zhí)行的效用 激勵(lì)相容約束是指代理人執(zhí)行此契約的收益不但大于其采取其他行動(dòng)的收益,而且委托人的收益也可得到有效保證,會(huì)符合其收益最大化的預(yù)期目標(biāo) 只有滿(mǎn)足這兩個(gè)條件的激勵(lì)制度才會(huì)被有效的實(shí)施參與約束:22R(E)-w(E), w(E)-E拒絕接受拒絕接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0參與約束 委托人的選擇11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-
40、w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激勵(lì)相容約束促使代理人努力的激勵(lì)相容約束、參與約束,以及委托人選擇委托的條件參與約束對(duì)于委托人來(lái)說(shuō),就是要根據(jù)上述兩個(gè)條件,以及 E、S的值,選擇最佳的工資水平w(20)和w(10),或者它們的差額w(20) -w(10)五、選擇報(bào)酬和連續(xù)
41、努力水平的 委托人代理人博弈R, CC(e) +R(e)委托人希望的代理人努力水平(滿(mǎn)足參與約束)UU*ee)()()()()()(*eCeRweCeRwUeCeRw激勵(lì)相容約束:參與約束:店主和店員的問(wèn)題商店的利潤(rùn) , 是均值為0的隨機(jī)變量店員的負(fù)效用 , 是店員的努力機(jī)會(huì)成本為1店主采用的報(bào)酬計(jì)算公式店員的收益店員期望收益為店主的收益為 eR42eC )4(eBABRASABeBeBAe)1 ()1 ( 4)4(424eBeAe2)4(eeBA參與約束參與約束:當(dāng)?shù)陠T風(fēng)險(xiǎn)中性時(shí) 符合其最大利益店主選擇下限 代入收益公式得: ,期望收益為 ,易求得令 得 ,再代入?yún)⑴c約束得 ,求數(shù)學(xué)期望得
42、解得 ,則店主的最優(yōu)激勵(lì)工資計(jì)算公式是*ee 1B5)8(BA58 BA1B3ARw 31)4(2eeBABe2*1)4(2eeBA142ee142ee2*e有趣的例子1:囚徒的救贖 好萊圬大片肖申克的救贖是一部很好看的電影,主要內(nèi)容是一個(gè)被冤屈的囚犯如何憑著堅(jiān)定的信念和聰明才智逃出牢房。我們的“囚犯”也可以通過(guò)好的策略合作,擺脫“困境”的詛咒。囚徒的救贖-一報(bào)還一報(bào) 一報(bào)還一報(bào)能夠贏(yíng)得競(jìng)賽不是靠打擊對(duì)方,而是靠從對(duì)方引出使雙方都有好處的行為。 如果重復(fù)博弈多次,就有報(bào)復(fù)的機(jī)會(huì),這種懲罰的規(guī)則是:人家對(duì)你怎么做,你就對(duì)他怎么做,如果他上次背叛了你,你這次背叛他,如果上次他與你合作,你這次就選擇
43、與他合作。囚徒的救贖-一報(bào)還一報(bào) 艾克謝羅德認(rèn)為,一報(bào)還一報(bào)體現(xiàn)了這個(gè)策略符合四個(gè)優(yōu)點(diǎn):清晰、善意、報(bào)復(fù)性和寬恕性。這一法則不會(huì)引發(fā)作弊,所以是善意的;它不會(huì)讓作弊者逍遙法外,所以是報(bào)復(fù)的;它不會(huì)長(zhǎng)時(shí)間懷恨在心,只要作弊者改正,就愿意恢復(fù)合作,所以是寬恕的。 一報(bào)還一報(bào)從自己的不可欺負(fù)性得到好處,還放棄了占他人便宜的可能性囚徒的救贖 重復(fù)囚徒困境的幾個(gè)建議: 1、不要嫉妒 2、不要首先背叛 3、對(duì)合作和背叛都要給予回報(bào) 4、不要耍小聰明旅行者困境-做人不要太精明 兩個(gè)旅行者從一個(gè)以生產(chǎn)細(xì)瓷花瓶聞名的地方旅行回來(lái),在提取行李的時(shí)候,發(fā)現(xiàn)花瓶被摔壞了,就向航空公司索賠。 航空公司知道花瓶的價(jià)格大概
44、雜八、九十元,但不知道他們購(gòu)買(mǎi)的確切價(jià)格。 因此航空公司請(qǐng)兩位旅客在100元以?xún)?nèi)寫(xiě)出花瓶的價(jià)格,如果兩個(gè)人寫(xiě)得一樣,就按照寫(xiě)的數(shù)額賠償,如果不一樣,原則上按照低的價(jià)格賠償,并認(rèn)為該旅客講了真話(huà),獎(jiǎng)勵(lì)2元,而講假話(huà)的罰款2元。 這個(gè)博弈的最終結(jié)果將是什么?旅行者困境 一位富翁的狗在散步時(shí)跑丟了,于是他急匆匆到電視臺(tái)發(fā)了一則啟示:有狗丟失,歸還者得酬金1萬(wàn)元,并附有狗的彩照。 一個(gè)乞丐看到廣告后,第二天一大早就報(bào)著狗準(zhǔn)備去領(lǐng)酬金,當(dāng)他經(jīng)過(guò)一家大商店的墻體屏幕時(shí),發(fā)現(xiàn)酬金漲到了3萬(wàn)元 乞丐又折回住處,把狗重新栓在那里,在接下來(lái)的幾天里,乞丐從來(lái)沒(méi)有離開(kāi)過(guò)這只大屏幕 當(dāng)酬金漲到使全市居民感到驚訝時(shí),乞
45、丐返回他的住處,可是那只狗已經(jīng)死了-在這個(gè)世界上,金錢(qián)一旦被作為籌碼,就不會(huì)再買(mǎi)到任何東西。3.5 有同時(shí)選擇的動(dòng)態(tài)博弈模型3.5.1 標(biāo)準(zhǔn)模型3.5.2 間接融資和擠兌風(fēng)險(xiǎn)3.5.3 國(guó)際競(jìng)爭(zhēng)和最優(yōu)關(guān)稅3.5.4 工資獎(jiǎng)金制度3.5.1 標(biāo)準(zhǔn)模型 博弈中有四個(gè)博弈方,分別稱(chēng)為博弈方1、博弈方2、博弈方3和博弈方4 第一階段是博弈方1和博弈方2的選擇階段,他們同時(shí)在各自的可選策略(行為)集合 和 中分別選擇 和 第二階段是博弈方3和博弈方4的選擇階段,他們?cè)诳吹讲┺姆?和博弈方2的選擇 和 以后,同時(shí)在各自的可選策略(行為)集合 和 中分別選擇 和 各博弈方的收益都取決于所有博弈方的策略 即博
46、弈方i的收益是各個(gè)博弈方所選擇策略的多元函數(shù)),(4321aaaauuii1a2a1a2a3a4a4321,aaaa1A2A3A4A3.5.2 間接融資和擠兌風(fēng)險(xiǎn)下一階段1, 11, 11, 1不 存存 款客戶(hù)客戶(hù)2不存存款客客戶(hù)戶(hù)1第一階段0.8,0.80.6,11,0.61.2,1.2提 前到 期客戶(hù)客戶(hù)2提前到期客客戶(hù)戶(hù)1第二階段(到期,到期) (存款,存款)(提前,提前) (不存,不存)1.2,1.2第二階段建立信貸保證、保險(xiǎn)制度,對(duì)存款進(jìn)行保護(hù)、保險(xiǎn)的原因非法集資問(wèn)題現(xiàn)代更容易引發(fā)金融、社會(huì)風(fēng)險(xiǎn)的主要是不正規(guī)的非法金融活動(dòng),如地下錢(qián)莊和非法集資等。非法金融活動(dòng)常常通過(guò)惡意欺騙的手段吸
47、引人們參加,用借新債還舊債的方法,而不是經(jīng)營(yíng)利潤(rùn)償還到期資金信用差、管理差而且缺乏保險(xiǎn)措施,引起金融風(fēng)險(xiǎn)并引發(fā)社會(huì)問(wèn)題的可能性要大得多。3.5.3 國(guó)際競(jìng)爭(zhēng)和最優(yōu)關(guān)稅ijiiijiijietehceheaheha)()()(廠(chǎng)商的收益函數(shù)為:第二階段廠(chǎng)商選擇:32,3),(max*jiiijijijiitcaetcaheehhtt),(jijijiiieehhtt第一階段政府選擇:先把第二階段根據(jù)廠(chǎng)商選擇得到結(jié)果代入政府收益,再求最優(yōu)化:2 , 1,9,9)(4,33)(9)2(9)(18)(2),(),(max*2*22*icaecahcattcattcatcatcattwttwiiiiijiijiijii政府的收益函數(shù);),(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鞋類(lèi)品牌箱包行業(yè)市場(chǎng)供需生產(chǎn)投資評(píng)估未來(lái)規(guī)劃分析研究報(bào)告
- 代理補(bǔ)賬協(xié)議書(shū)
- 流程化營(yíng)銷(xiāo)方案(3篇)
- 信訪(fǎng)委托協(xié)議書(shū)
- 支付項(xiàng)目營(yíng)銷(xiāo)方案(3篇)
- 幼兒過(guò)年活動(dòng)策劃方案(3篇)
- 戲曲公園活動(dòng)策劃方案(3篇)
- 離婚協(xié)議法務(wù)范文集
- 基于邊緣計(jì)算的路燈智能識(shí)別與定位-洞察及研究
- 股權(quán)激勵(lì)方案設(shè)計(jì)-洞察及研究
- GB/T 31402-2015塑料塑料表面抗菌性能試驗(yàn)方法
- GB/T 20969.3-2007特殊環(huán)境條件高原機(jī)械第3部分:高原型工程機(jī)械選型、驗(yàn)收規(guī)范
- 最新-脂肪性肝病課件
- 眼科OCT異常圖譜解讀
- 保密工作知識(shí)講課稿范文(通用3篇)
- DB11- 996-2013-城鄉(xiāng)規(guī)劃用地分類(lèi)標(biāo)準(zhǔn)-(高清有效)
- 風(fēng)光互補(bǔ)系統(tǒng)實(shí)驗(yàn)(圣威科技)王鑫
- 1-院前急救風(fēng)險(xiǎn)管理
- 古典園林分析之郭莊講解課件
- 核電工程質(zhì)量保證知識(shí)培訓(xùn)教材PPT課件
- 交管12123駕照學(xué)法減分題庫(kù)及答案共155題(完整版)
評(píng)論
0/150
提交評(píng)論