版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第三章 完全且完美信息動態(tài)博弈 本章討論動態(tài)博弈,所有博弈方都對博弈過程和得益完全了解的完全且完美信息動態(tài)博弈。這類博弈也是現(xiàn)實中常見的基本博弈類型。由于動態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對動態(tài)博弈分析的概念和方法,特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動態(tài)博弈模型。本章分六節(jié)3.1動態(tài)博弈的表示法和特點3.2可信性和納什均衡的問題3.3子博弈和子博弈完美納什均衡3.4幾個經(jīng)典動態(tài)博弈模型3.5有同時選擇的動態(tài)博弈模型3.6動態(tài)博弈分析的問題和擴展討論3.1 動態(tài)博弈的表示法和特點3.1
2、.1 階段和擴展性表示3.1.2 動態(tài)博弈的基本特點3.1.1 階段和擴展性表示階段:動態(tài)博弈中一個博弈方的一次選擇行為例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2 動態(tài)博弈的基本特點策略是在整個博弈中所有選擇、行為的計劃結(jié)果是上述“計劃型”策略的策略組合,構(gòu)成一條路徑得益對應每條路徑,而不是對應每步選擇、行為動態(tài)博弈的非對稱性先后次序決定動態(tài)博弈必然是非對稱的。先選擇、行為的博弈方常常更有利,有“先行優(yōu)勢”。3.2 可信性和納什均衡的問題3.2.1 相機選擇和策略中的可信性問題3.2.2 納什均衡的問
3、題3.2.3 逆推歸納法3.2.1 相機選擇和策略中的可信性問題不同版本的開金礦博弈分錢和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分開金礦博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的開金礦博弈分錢打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的開金礦博弈分錢打官司都不可信3.2.2 納什均衡的問題 第三種開金礦博弈中, (不借-不打,不分)和(借-打,分)都是納什均衡。但后者不可信,不可能實現(xiàn)或穩(wěn)定。結(jié)論:納什均衡在動態(tài)博弈可能缺乏穩(wěn)定性,也就是說,在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡,在動態(tài)博弈中
4、可能是不穩(wěn)定的,不能作為預測的基礎(chǔ)。根源:納什均衡本身不能排除博弈方策略中包含的不可信的行為設定,不能解決動態(tài)博弈的相機選擇引起的可信性問題3.2.3 逆推歸納法定義:從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應博弈方的行為選擇,一直到第一個階段的分析方法,稱為“逆推歸納法”。逆推歸納法是動態(tài)博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3 子博弈和子博弈完美納什均衡3.3.1 子博弈3.3.2 子博弈完美納什均衡3.3.1 子博弈定義:由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的,有初始信息集和進行博弈所需要的全部信息,
5、能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2 子博弈完美納什均衡定義:如果一個完美信息的動態(tài)博弈中,各博弈方的策略構(gòu)成的一個策略組合滿足,在整個動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個“子博弈完美納什均衡”。子博弈完美納什均衡能夠排除均衡策略中不可信的威脅和承諾,因此是真正穩(wěn)定的。逆推歸納法是求完美信息動態(tài)博弈子博弈完美納什均衡的基本方法。3.4 幾個經(jīng)典動態(tài)博弈模型3.4.1 寡占的斯塔克博格模型3.4.2 勞資博弈3.4.3 討價還價博弈3.4.4 委托人代理人
6、理論3.4.1 寡占的斯塔克博格模型先后選擇產(chǎn)量的產(chǎn)量競爭博弈把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時選擇即可。222126qqqq-= 產(chǎn)量 得益廠商1 3單位 4.5廠商2 1.5單位 2.25先行優(yōu)勢3.4.2 勞資博弈先由工會決定工資率,再由廠商決定雇用多少勞動力RL0W L廠商的反應函數(shù)R(L)斜率為WLW0工會的誤差異曲線3.4.3 討價還價博弈三回合討價還價112不接受,出S接受不接受,出S2接受出S1三回合討價還價博弈結(jié)果的討論無限回合討價還價3.4.4 委托人代理人理論一、委托人代理人關(guān)系經(jīng)濟活動和社會活動中有很多委托人代理人關(guān)系,有明顯的,也有隱蔽的。工廠和工人、
7、店主和店員、客戶和律師、市民和政府、基金購買者和基金管理人等都是。委托人代理人關(guān)系的關(guān)鍵特征:不能直接控制,監(jiān)督不完全,信息不完全,利益的相關(guān)性委托人代理人涉及問題:激勵機制設計、機制設計理論,委托合同設計問題等二、無不確定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懶努力拒絕接受不委托委托代理人的選擇激勵相容約束: w(E)-E w(S)-S w(E) w(S)+E-S參與約束:22R(E)-w(E), w(E)-E拒絕接受拒絕接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w
8、(S)-S0參與約束委托人的選擇11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激勵相容約束促使代理人努力的激勵相容約束、參與約束,以及委托人選擇委托的條
9、件參與約束對于委托人來說,就是要根據(jù)上述兩個條件,以及 E、S的值,選擇最佳的工資水平w(20)和w(10),或者它們的差額w(20) -w(10)五、選擇報酬和連續(xù)努力水平的 委托人代理人博弈R, CC(e) +R(e)委托人希望的代理人努力水平(滿足參與約束)店主和店員的問題商店的利潤 , 是均值為0的隨機變量店員的負效用 , 是店員的努力機會成本為1店主采用的報酬計算公式店員的得益店員期望得益為店主的得益為參與約束:當?shù)陠T風險中性時 符合其最大利益店主選擇下限 代入得益公式得: ,期望得益為 ,易求得令 得 ,再代入?yún)⑴c約束得 ,求數(shù)學期望得 解得 ,則店主的最優(yōu)激勵工資計算公式是3.5
10、 有同時選擇的動態(tài)博弈模型3.5.1 標準模型3.5.2 間接融資和擠兌風險3.5.3 國際競爭和最優(yōu)關(guān)稅3.5.4 工資獎金制度3.5.1 標準模型博弈中有四個博弈方,分別稱為博弈方1、博弈方2、博弈方3和博弈方4第一階段是博弈方1和博弈方2的選擇階段,他們同時在各自的可選策略(行為)集合 和 中分別選擇 和 第二階段是博弈方3和博弈方4的選擇階段,他們在看到博弈方1和博弈方2的選擇 和 以后,同時在各自的可選策略(行為)集合 和 中分別選擇 和各博弈方的得益都取決于所有博弈方的策略 即博弈方i的得益是各個博弈方所選擇策略的多元函數(shù)3.5.2 間接融資和擠兌風險下一階段1, 11, 11,
11、1不 存存 款客戶2不存存款客戶1第一階段0.8,0.80.6,11,0.61.2,1.2提 前到 期客戶2提前到期客戶1第二階段(到期,到期) (存款,存款)(提前,提前) (不存,不存)1.2,1.2第二階段建立信貸保證、保險制度,對存款進行保護、保險的原因非法集資問題 現(xiàn)代更容易引發(fā)金融、社會風險的主要是不正規(guī)的非法金融活動,如地下錢莊和非法集資等。因為非法金融活動常常通過惡意欺騙的手段吸引人們參加,用借新債還舊債的方法,而不是經(jīng)營利潤償還到期資金,信用差、管理差而且缺乏保險措施,引起金融風險并引發(fā)社會問題的可能性要大得多。3.5.3 國際競爭和最優(yōu)關(guān)稅廠商的得益函數(shù)為:第二階段廠商選擇
12、:第一階段政府選擇:先把第二階段根據(jù)廠商選擇得到結(jié)果代入政府得益,再求最優(yōu)化:政府的得益函數(shù);3.5.4 工資獎金制度 模型假設:1.雇員i(i=1,2)的產(chǎn)出函數(shù)為 , 為雇員努力水平, 為隨機擾動。 服從分布密度 ,均值為0的隨機變量。 雇員努力的負效用函數(shù)為 ,且 。2.產(chǎn)量高的雇員得到高工資 ,產(chǎn)量低的得到低工資 。3.兩雇員在已知雇主宣布的工資獎金制度下,同時獨立選擇各自的努力程度。雇員選擇雇主決定了工資以后,雇員同時決定努力程度:一階條件這是雇員所選擇努力程度必須滿足的基本條件。利用條件概率的貝葉斯法則: 代入得: 兩雇員情況一樣,對努力程度的選擇也相同,即: ,這樣就得到: 這就
13、是兩雇員之間的靜態(tài)博弈納什均衡。 若進一步假設 ,那么雇主選擇 由于雇員之間博弈的均衡是對稱均衡,因此雙方贏得競賽的機會都是0.5,假設雇能得到其他工作機會提供的得益是 ,則保證雇員接受工作的基本條件是:此即“參與約束”。 由于在雇員接受工作的前提下,雇主必然盡可能壓低工資,因此約束條件可取等號: 于是得到: 設上述參與約束條件滿足,雇主的利潤函數(shù)為 雇主的期望利潤為 ,因此雇主有如下的最優(yōu)化問題:上述雇主決策可轉(zhuǎn)化為促使雇員的努力程度滿足: 一階條件為: 代入兩雇員的最優(yōu)努力水平?jīng)Q定公式得到:3.6 動態(tài)博弈分析的問題和擴展討論3.6.1 逆推歸納法的問題3.6.2 顫抖手均衡和順推歸納法3
14、.6.3 蜈蚣博弈問題3.6.1 逆推歸納法的問題逆推歸納法只能分析明確設定的博弈問題,要求博弈的結(jié)構(gòu),包括次序、規(guī)則和得益情況等都非常清楚,并且各個博弈方了解博弈結(jié)構(gòu),相互知道對方了解博弈結(jié)構(gòu)。這些可能有脫實際的可能逆推歸納法也不能分析比較復雜的動態(tài)博弈在遇到兩條路徑利益相同的情況時逆推歸納法也會發(fā)生選擇困難對博弈方的理性要求太高,不僅要求所有博弈方都有高度的理性,不允許犯任何錯誤,而且要求所有博弈方相互了解和信任對方的理性,對理性有相同的理解,或進一步有“理性的共同知識”3.6.2 顫抖手均衡和順推歸納法顫抖手均衡10, 010, 12, 06, 2LRUD博弈方2博弈方12, 010,
15、16, 29, 0(3, 3)(2, 3)1212L(0, 0)NTVRM(1, 2)(1, 1)SU(2, 1)順推歸納法0,01,30,03,1swwsRD(2, 2)21Van Damme 博弈3,10,02,22,20,01,3DsRwsDw博弈方1博弈方2Van Damme 博弈策略形3.6.3 蜈蚣博弈問題該博弈是說明逆推歸納法和博弈分析困難的經(jīng)典博弈1211212R(98,98)(97,100)dr(99,99)DRrd(98,101)(100,100)DRrd(0,3)D(2,2)R(1,1)D第四章 重復博弈 本章介紹基本博弈重復進行構(gòu)成的重復博弈。雖然形式上是基本博弈的重復
16、進行,但重復博弈中博弈方的行為和博弈結(jié)果卻不一定是基本博弈的簡單重復,因為博弈方對于博弈會重復進行的意識,會使他們對利益的判斷發(fā)生變化,從而使他們在重復博弈過程中的行為選擇受到影響。這意味著不能把重復博弈當作基本博弈的簡單疊加,必須把整個重復博弈過程作為整體進行研究。本章分三節(jié)4.1 重復博弈引論4.2 有限次重復博弈4.3 無限次重復博弈4.1 重復博弈引論4.1.1 為何研究重復博弈4.1.2 基本概念4.1.1 為何研究重復博弈經(jīng)濟中的長期關(guān)系人們的預見性未來利益對當前行為的制約長期合同、回頭客、長客和一次性買賣的區(qū)別有無確定的結(jié)束時間4.1.2 基本概念有限次重復博弈:給定一個基本博弈
17、G(可以是靜態(tài)博弈,也可以是動態(tài)博弈),重復進行T次G,并且在每次重復G之前各博弈方都能觀察到以前博弈的結(jié)果,這樣的博弈過程稱為“G的T次重復博弈”,記為G(T)。而G則稱為G(T)的“原博弈”。G(T)中的每次重復稱為G(T)的一個“階段”。無限次重復博弈:一個基本博弈G一直重復博弈下去的博弈,記為G( )策略:博弈方在每個階段針對每種情況如何行為的計劃子博弈:從某個階段(不包括第一階段)開始,包括此后所有的重復博弈部分均衡路徑:由每個階段博弈方的行為組合串聯(lián)而成重復博弈的得益4.2 有限次重復博弈4.2.1 兩人零和博弈的有限次重復博弈4.2.2唯一純策略納什均衡博弈 的有限次重復博弈4.
18、2.3多個純策略納什均衡博弈 的有限次重復博弈4.2.4 有限次重復博弈的民間定理4.2.1 兩人零和博弈的有限次重復博弈零和博弈是嚴格競爭的,重復博弈并不改變這一點。以零和博弈為原博弈的有限次重復博弈與猜硬幣博弈的有限次重復博弈一樣,博弈方的正確策略是重復一次性博弈中的納什均衡策略。4.2.2唯一純策略納什均衡博弈的 有限次重復博弈定理:設原博弈G有唯一的純策略納什均衡,則對任意整數(shù)T,重復博弈 G(T)有唯 一的子博弈完美納什均衡,即各博弈方每個階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍,平均得益的與原博弈G中的得益。-5,-50,-8-8,0-1,-1坦
19、白不坦白囚徒2坦白不坦白囚徒1(-5,-5)-10,-10-13,-5-5,-13-6,-6坦 白不坦白囚徒2坦白不坦白囚徒1(-10,-10)有限次重復削價競爭博弈100,10020,150150,2070,70高 價低 價高價低價寡頭2寡頭1削價競爭博弈有唯一純策略納什均衡(70,70)有限次重復的結(jié)果仍然是(低價,低價)4.2.3多個純策略納什均衡博弈的 有限次重復博弈5,53,32,00,22,06,00,20,61,1HMH廠商2ML廠商1L三價博弈2,23,13,11,34,47,11,31,78,8廠商1廠商2LMHHML兩次重復三價博弈的等價模型觸發(fā)策略:兩博弈方先試探合作,一
20、旦發(fā)現(xiàn)對方不合作則也用不合作報復博弈方1:第一次選h;如第一次結(jié)果為(H,H),則第二次選M,否則選L博弈方2:同博弈方1兩市場博弈的重復博弈(重復兩次)(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1)連續(xù)兩次采用混合策略(2,2)(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)輪換策略一次純策略+一次混合策略(1.5,3)(3,1.5)0,04,11,33,3廠商1廠商2BAAB兩市場博弈重復博弈不同策略、均衡及一次性博弈得益比較不同策略組合、均衡得益圖示廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)
21、(1.5,3)4.2.4 有限次重復博弈的民間定理個體理性得益:不管其它博弈方的行為如何,一博弈方在某個博弈中只要自己采取某種特定的策略,最低限度保證能獲得的得益可實現(xiàn)得益:博弈中所有純策略組合得益的加權(quán)平均數(shù)組定理:設原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w,那么在該博弈的多次重復中所有不小于個體理性得益的可實現(xiàn)得益,都至少有一個子博弈完美納什均衡的極限的平均得益來實現(xiàn)它們廠商2得益廠商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)4.3 無限次重復博弈4.3.1 兩人零和博弈的無限次重復博弈4.3.2 唯一純策略納什均衡博弈 的無限次重復博弈4.3.3 無限次重復古諾模型4.3
22、.4 有效工資率4.3.1 兩人零和博弈的無限次重復博弈兩人零和博弈無限次重復的所有階段都不可能發(fā)生合作,博弈方會一直重復原博弈的混合策略納什均衡4.3.2唯一純策略納什均衡博弈 的無限次重復博弈兩寡頭削價競爭博弈 該博弈一次性博弈均衡是都采用低價,是囚徒困境型博弈4,40,55,01,1HLHL無限次重復兩寡頭削價博弈 觸發(fā)策略:第一階段采用H,如果前t-1階段的結(jié)果都是(H,H),則繼續(xù)采用H,否則采用L。 如果博弈方2采用L,總得益現(xiàn)值為 如果博弈方2采用H,總得益現(xiàn)值為 因此當 時,此觸發(fā)策略納什均衡策略兩寡頭削價競爭無限次重復博弈的民間定理廠商2得益廠商1得益(1,4)(3,3)(1
23、,1)(4,1)(5,0)(5,0)4.3.3 無限次重復古諾模型 假定: ,邊際成本都為2。 在無限次重復古諾模型中,當貼現(xiàn)率 滿足一定條件時,兩廠商采用下列觸發(fā)策略構(gòu)成一個子博弈完美納什均衡: 在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5;在第 t 階段,如果前 t-1 階段結(jié)果都是(1.5,1.5),則繼續(xù)生產(chǎn)1.5,否則生產(chǎn)古諾產(chǎn)量2。 設廠商1已采用該觸發(fā)策略,若廠商2也采用該觸發(fā)策略,則每期得益4.5,無限次重復博弈總得益的現(xiàn)值為: 如果廠商2偏離上述觸發(fā)策略,則他在第一階段所選產(chǎn)量應為給定廠商1產(chǎn)量為1.5時,自己的最大利潤產(chǎn)量,即滿足: 解得 ,此時利潤為5.0625,高于觸發(fā)策略第一階段得益4.5。 但從第二階段開始,廠商1將報復性地永遠采用古諾產(chǎn)量2,這樣廠商2也被迫永遠采
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026甘肅民族師范學院招聘82人備考題庫完整答案詳解
- 2026年農(nóng)業(yè)氣候韌性提升實務課
- 家電家居產(chǎn)品演示話術(shù)手冊
- 財政系統(tǒng)預算培訓課件
- 空調(diào)修理年終總結(jié)范文(3篇)
- 職業(yè)健康監(jiān)護中的職業(yè)史采集技巧
- 職業(yè)健康促進的投資回報周期
- 職業(yè)健康促進與職業(yè)健康人才培養(yǎng)
- 職業(yè)健康與心理健康的整合干預策略
- 茂名2025年廣東茂名市海洋綜合執(zhí)法支隊濱海新區(qū)大隊招聘4人筆試歷年參考題庫附帶答案詳解
- 2026貴州省黔晟國有資產(chǎn)經(jīng)營有限責任公司面向社會招聘中層管理人員2人備考考試試題及答案解析
- 2025年營養(yǎng)師考試練習題及答案
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責任公司社會成熟人才招聘備考題庫及答案詳解一套
- 消費者權(quán)益保護與投訴處理手冊(標準版)
- 南京航空航天大學飛行器制造工程考試試題及答案
- 注塑模具調(diào)試員聘用協(xié)議
- 2026年工程監(jiān)理招聘面試常見問題集
- 航運電子商務行業(yè)發(fā)展前景分析及物流配送體系創(chuàng)新與商業(yè)模式研究
- 2025年陜西中考語文試卷副題及答案
- 腦癱兒童護理中的職業(yè)治療
- 篩分設備安裝施工詳細方案
評論
0/150
提交評論