博弈論與信息經(jīng)濟學(xué)講義09-5.ppt_第1頁
博弈論與信息經(jīng)濟學(xué)講義09-5.ppt_第2頁
博弈論與信息經(jīng)濟學(xué)講義09-5.ppt_第3頁
博弈論與信息經(jīng)濟學(xué)講義09-5.ppt_第4頁
博弈論與信息經(jīng)濟學(xué)講義09-5.ppt_第5頁
已閱讀5頁,還剩115頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、博弈論與信息經(jīng)濟學(xué)(Game Theory and Information Economics ),張玲玲 中國科學(xué)院研究生院管理學(xué)院 ,主要內(nèi)容簡介,第一章 概述-人生處處皆博弈 第一篇 非合作博弈理論 第二章 完全信息靜態(tài)信息博弈-納什均衡 第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡 第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡 第五章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡,第二篇 信息經(jīng)濟學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞,主要內(nèi)容簡介,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈的基本概念與擴展式表述 二 子博弈精

2、練納什均衡 三 應(yīng)用舉例,一 、博弈的基本概念,博弈論的基本概念包括: 參與人:博弈論中選擇行動以最大化自己效用的決策主體; 行動:參與人的決策變量 戰(zhàn)略:參與人選擇行動的規(guī)則 信息:參與人在博弈中的知識,特別是有關(guān)其他參與人的特征和行動的知識 支付函數(shù):參與人從博弈中獲得的效用水平 結(jié)果:博弈分析真正感興趣的要素的集合 均衡:所有參與人的最優(yōu)戰(zhàn)略的組合 參與人、行動、結(jié)果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。,一 博弈的基本概念,案例- 房地產(chǎn)開發(fā)項目-假設(shè)有A、B兩家開發(fā)商 市場需求:可能大,也可能小 投入:1億,假定市場上有兩棟樓出售: 需求大時,每棟售價1.4億, 需求小

3、時,售價7千萬; 如果市場上只有一棟樓 需求大時,可賣1.8億 需求小時,可賣1.1億,一 、博弈的基本概念,不開發(fā),開發(fā)商A,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā)商B,開發(fā)商A,開發(fā),不開發(fā),開發(fā),開發(fā)商B,需求小的情況,需求大的情況,博弈的戰(zhàn)略式表述,一 、博弈的基本概念,參與人:博弈論中選擇行動以最大化自己效用的決策主體。 可以是自然人,也可以是團體,如企業(yè)、國家甚至由若干 國家組成的集團(OPEC、歐盟等)。 虛擬參與人:“自然”作為虛擬參與人 自然:指決定外生的隨機變量的機制 為分析方便引入,自然作為虛擬參與人沒有自己的支付和目標函數(shù)(即所有結(jié)果對它是無差異的) 參與人決策的后果依賴于自

4、然的選擇。在不完全信息博弈中,自然選擇參與人的類型,第一章 概述-人生處處皆博弈,囚徒A,囚徒 B,坦白,抵賴,坦白,抵賴,不完全信息靜態(tài)博弈-貝葉斯納什均衡海薩尼(1967-1968),不接受,求愛博弈: 品德優(yōu)良者求愛,求愛者,求愛,不求愛,接受,你,求愛者,求愛,不求愛,求愛博弈: 品德惡劣者求愛,你,100 x+(-100)(1-x)=0 當(dāng)x大于1/2時,接受求愛,自然選擇參與人的類型,不接受,接受,一 、博弈的基本概念,行動:參與人在某個時點的決策變量 Ai表示第i個參與人的一個特定行動 行動的順序:行動的順序?qū)τ诓┺牡慕Y(jié)果是非常重要的,事實上,不同的行動順序意味著不同的博弈。 在

5、博弈論中,一般假設(shè)參與人的行動空間和行動順序是所有參與人的共同知識。,不完全信息靜態(tài)博弈-貝葉斯納什均衡海薩尼(1967-1968),不接受,求愛博弈: 品德優(yōu)良者求愛,求愛者,求愛,不求愛,接受,你,求愛者,求愛,不求愛,求愛博弈: 品德惡劣者求愛,你,100 x+(-100)(1-x)=0 當(dāng)x大于1/2時,接受求愛,行動,自然選擇參與人的類型,不接受,接受,一 、博弈的基本概念,信息:參與人在博弈中的知識,特別是有關(guān)其他參與人的特征和行動的知識。 如求愛博弈中,如果被求愛者不知道求愛者到底是品德優(yōu)良還是品德壞,而求愛者知道,則被求愛者的信息集為優(yōu)良,惡劣,求愛者的信息集為優(yōu)良或惡劣 完美

6、信息:指一個參與人對其他參與人(包括“自然”)的行動選擇有準確了解的情況,即每一個信息集只包含一個值。 完全信息:指自然不首先行動或自然的行動的初始行動所有參與人觀察到的情況。 共同知識:指“所有參與人知道所有參與人知道所有參與人知道.”的知識。,博弈的信息結(jié)構(gòu)分類,一 、博弈的基本概念,戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的“相機行動方案”。,在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。 作為一種行動規(guī)則,戰(zhàn)略必須是完備的。,一 、博弈的基本概念,不開發(fā),開發(fā)商A,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā)商B,開發(fā)商A,開發(fā),不開發(fā),開發(fā),開發(fā)商B,需

7、求小的情況,需求大的情況,博弈的戰(zhàn)略式表述,一 、博弈的基本概念,人不犯我,我不犯人,人若犯我,我必犯人. 如果B在不知道市場需求的情況下先行動,A在得知B的行動后再選擇自己的行動,那么: B有兩個戰(zhàn)略SB(開發(fā),不開發(fā)) A有四個戰(zhàn)略SA(開發(fā),開發(fā),開發(fā),不開發(fā),不開發(fā),開發(fā),不開發(fā),不開發(fā)) 這里,戰(zhàn)略x,y內(nèi)的第一個元素對應(yīng)B選擇“開發(fā)”時A的行動,第二個元素對應(yīng)B選擇“不開發(fā)”時A的行動. S=(不開發(fā),開發(fā),開發(fā))是一個戰(zhàn)略組合,在這個戰(zhàn)略組合中,A的戰(zhàn)略是“如果B開發(fā),我不開發(fā);如果B不開發(fā),我開發(fā)”,B的戰(zhàn)略是開發(fā).,一 、博弈的基本概念,支付函數(shù):參與人從博弈中獲得的效用水平

8、,或者指參與人得到的期望效用水平。 博弈的基本特征是一個參與人的支付不僅取決于自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇,不完全信息靜態(tài)博弈-貝葉斯納什均衡海薩尼(1967-1968),不接受,求愛博弈: 品德優(yōu)良者求愛,求愛者,求愛,不求愛,接受,你,求愛者,求愛,不求愛,求愛博弈: 品德惡劣者求愛,你,100 x+(-100)(1-x)=0 當(dāng)x大于1/2時,接受求愛,自然選擇參與人的類型,不接受,接受,一 、博弈的基本概念,不開發(fā),開發(fā)商A,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā)商B,開發(fā)商A,開發(fā),不開發(fā),開發(fā),開發(fā)商B,需求小的情況,需求大的情況,博弈的戰(zhàn)略式表述,一 、博弈的基本

9、概念,結(jié)果:博弈分析感興趣的所有東西 如均衡戰(zhàn)略組合、均衡行動組合、均衡支付組合等。 如:(高需求,開發(fā),開發(fā))-均衡行動組合 (4000,4000)-均衡支付組合 S=(不開發(fā),開發(fā),開發(fā))-均衡戰(zhàn)略組合,一 、博弈的基本概念,均衡:所有參與人的最優(yōu)戰(zhàn)略的組合 一般記為:,房地產(chǎn)開發(fā)博弈中,如果需求大,(開發(fā),開發(fā))是唯一的均衡.,一 、博弈的基本概念,博弈論的基本概念包括: 參與人:博弈論中選擇行動以最大化自己效用的決策主體; 行動:參與人的決策變量 戰(zhàn)略:參與人選擇行動的規(guī)則 信息:參與人在博弈中的知識,特別是有關(guān)其他參與人的特征和行動的知識 支付函數(shù):參與人從博弈中獲得的效用水平 結(jié)果

10、:博弈分析真正感興趣的要素的集合 均衡:所有參與人的最優(yōu)戰(zhàn)略的組合 參與人、行動、結(jié)果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。,博弈的戰(zhàn)略式表述與擴展式表述,戰(zhàn)略式表述:適用于靜態(tài)博弈 擴展式表述:適用于動態(tài)博弈,博弈的戰(zhàn)略表述,案例- 房地產(chǎn)開發(fā)項目-假設(shè)有A、B兩家開發(fā)商 市場需求:可能大,也可能小 投入:1億,假定市場上有兩棟樓出售: 需求大時,每棟售價1.4億, 需求小時,售價7千萬; 如果市場上只有一棟樓 需求大時,可賣1.8億 需求小時,可賣1.1億,博弈戰(zhàn)略表述,不開發(fā),開發(fā)商A,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā)商B,開發(fā)商A,開發(fā),不開發(fā),開發(fā),開發(fā)商B,需求小的情

11、況,需求大的情況,博弈的戰(zhàn)略式表述,博弈的戰(zhàn)略式表述包括三個要素: 參與人集合 每個參與人的戰(zhàn)略集合 由戰(zhàn)略組合決定的每個參與人的支付,A,開發(fā),不開發(fā),N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),參與人集合 參與人行動順序 參與人的行動空間 參與人的信息集 參與人的支付函數(shù) 外生事件的概率分布,房地產(chǎn)開發(fā)博弈,博弈擴展式表述,一 博弈擴展式表述,博弈的基本構(gòu)造 結(jié): 包括決策結(jié)和終點結(jié)兩類;決策結(jié)是參與人行動的

12、始點,終點結(jié)是決策人行動的終點. 結(jié)滿足傳遞性和非對稱性 x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)。 枝: 枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇. 信息集: 每個信息集是決策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策結(jié): 1 每個決策結(jié)都是同一個參與人的決策結(jié); 2 該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié).,A,開發(fā),不開發(fā),N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),(4,4),(8,

13、0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B在決策時不確切地知道自然的選擇; B的決策結(jié)由4個變?yōu)?個,房地產(chǎn)開發(fā)博弈,A,開發(fā),不開發(fā),N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B知道自然的選擇;但不知道A的選擇(或A、B同時決策),房地產(chǎn)開發(fā)博弈,一 博弈擴展式表述,只包含一個決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。 自然

14、總是假定是單結(jié)的,因為自然在參與人決策之后行動等價于自然在參與人之前行動但參與人不能觀測到自然的行動。 不同的博弈樹可以代表相同的博弈,但是有一個基本規(guī)則:一個參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。,B知道自然的選擇;但不知道A的選擇(或A、B同時決策) A既不知道N也不知道B的選擇,N,開發(fā),不開發(fā),A,A,大,小,1/2,1/2,B,B,B,A,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),房地產(chǎn)開發(fā)博弈,開發(fā),不開發(fā),N,開發(fā),不開發(fā),B,B,大,小,1/2,

15、1/2,A,A,A,A,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B知道自然的選擇;但不知道A的選擇(或A、B同時決策) A?,房地產(chǎn)開發(fā)博弈,開發(fā),不開發(fā),二 占優(yōu)戰(zhàn)略均衡,案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵賴,坦白,抵賴,A,B,坦白,抵賴,B,B,A,A,坦白,抵賴,坦白,抵賴,(-8,-8),(0,-10),(-10,0),(-1,-1),坦白,抵賴,坦白,抵賴,坦白,抵賴,(-8,-8),(0,-10),(-10,0),(-1,-1),囚徒困境博弈的擴展式表述,

16、囚徒困境博弈的擴展式表述,智豬博弈的擴展式表述?,等待,小豬,大豬,按,等待,按,案例2-智豬博弈,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 子博弈精練納什均衡 擴展式表述博弈的納什均衡 子博弈精練納什均衡 用逆向歸納法求子搏弈精練納什均衡 承諾行動與子搏弈精練納什均衡 逆向歸納法與子搏弈精練納什均衡的存在問題 三 應(yīng)用舉例,博弈的劃分:,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),考慮下列問題: 一個博弈可能有多個(甚至無窮多個)納什均衡,究竟哪個更合理? 納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人

17、的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。 子博弈精練納什均衡的一個重要改進是將“合理納什均衡”與“不合理納什均衡”分開。,一 、博弈的基本概念及戰(zhàn)略表述,不開發(fā),開發(fā)商A,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā)商B,開發(fā)商A,開發(fā),不開發(fā),開發(fā),開發(fā)商B,需求小的情況,需求大的情況,博弈的戰(zhàn)略式表述,擴展式,A,開發(fā),不開發(fā),B,B,開發(fā),不開發(fā),開發(fā),(-3,-3),(1,0),(0,1),(0,0),不開發(fā),x,x,納什均衡與均衡結(jié)果: 存在三個純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(

18、不開發(fā),不開發(fā)) 兩個均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā)) 注意:均衡不同于均衡結(jié)果,到底哪一個均衡結(jié)果將最終出現(xiàn)?,需求小的情況,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 子博弈精練納什均衡 擴展式表述博弈的納什均衡 子博弈精練納什均衡 用逆向歸納法求子搏弈精練納什均衡 承諾行動與子搏弈精練納什均衡

19、 逆向歸納法與子搏弈精練納什均衡的存在問題 三 應(yīng)用舉例,戰(zhàn)略的表述,戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的“相機行動方案”。,在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。 作為一種行動規(guī)則,戰(zhàn)略必須是完備的。,擴展式表述博弈的納什均衡,足球,男的策略:足球,芭蕾 選擇足球; 還是選擇芭蕾。 女的策略: (足球,芭蕾),(芭蕾,足球) (芭蕾,芭蕾),(足球,足球) 1、追隨策略:他選擇什么,我就選擇什么 2、對抗策略:他選擇什么,我就偏不選什么 3、芭蕾策略:不管他選什么,我都選芭蕾; 4、足球策略:不管他選什么,我都選足球。,策略即:如果他選

20、擇什么,我就怎樣行動的相機行動方案。在擴展式博弈里,參與人是相機行事,即“等待”博弈到達一個自己的信息集(包含一個或多個決策結(jié)后,再采取行動方案。,什么是動態(tài)博弈?,擴展式表述博弈的納什均衡,若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可選擇的行動,戰(zhàn)略空間為:(開發(fā),不開發(fā)); B有兩個信息集,四個可選擇的行動,B有四個純戰(zhàn)略: 開發(fā)策略:不論A開發(fā)不開發(fā),我開發(fā); 追隨策略:A開發(fā)我開發(fā),A不開發(fā)我不開發(fā); 對抗策略:A開發(fā)我不開發(fā),A不開發(fā)我開發(fā); 不開發(fā)策略不論A開發(fā)不開發(fā)我不開發(fā), 簡寫為: (開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),括號內(nèi)

21、的第一個元素對應(yīng)A選擇“開發(fā)”時B的選擇,第二個元素對應(yīng)A選擇“不開發(fā)”時B的選擇。,什么是參與人的戰(zhàn)略?,擴展式,開發(fā),開發(fā),開發(fā),不開發(fā),不開發(fā), 開發(fā),不開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā)商B,開發(fā)商A,戰(zhàn)略式,納什均衡與均衡結(jié)果: 存在三個純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)) 兩個均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā)) 注意:均衡不同于均衡結(jié)果,擴展式,開發(fā),開發(fā),開發(fā),不開發(fā),不開發(fā), 開發(fā),不開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā)商B,開發(fā)商A,戰(zhàn)略式,開發(fā),(開發(fā),開發(fā)),路徑 在擴展式博弈中,所有n個參與人的一個純戰(zhàn)略

22、組合決定了博弈樹上的一個路徑。 (開發(fā),不開發(fā),開發(fā))決定了博弈的路徑為A開發(fā)B不開發(fā)-(1,0) (不開發(fā),開發(fā),開發(fā))決定了路徑:?,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 子博弈精練納什均衡 擴展式表述博弈的納什均衡 子博弈精練納什均衡 用逆向歸納法求子搏弈精練納什均衡 承諾行動與子搏弈精練納什均衡 逆向歸納法與子搏弈精練納什均衡的存在問題 三 應(yīng)用舉例,子博弈精煉納什均衡,澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信

23、息集上是最優(yōu)的。,子博弈精煉納什均衡-不可置信威脅,美國普林斯頓大學(xué)古爾教授在1997年的經(jīng)濟學(xué)透視里發(fā)表文章,提出一個例子說明威脅的可信性問題: 兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關(guān)起來,關(guān)起來比沒有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。 的確,如果弟弟是會算計自己利益的理性人,在這

24、樣的環(huán)境下,還是不告狀的好??梢姡艿苁抢硇匀?,他的告狀威脅是不可置信的。,擴展式,納什均衡與均衡結(jié)果: 存在三個純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)) 兩個均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā)) 注意:均衡不同于均衡結(jié)果,到底哪一個均衡結(jié)果將最終出現(xiàn)?,子博弈精練納什均衡,A,開發(fā),不開發(fā),B,B,開發(fā),不開發(fā),開發(fā),(-3,-3),(1,0),(0,1),(0,0),不開發(fā),(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)),如果A選擇開發(fā),B的最優(yōu)選擇是不開發(fā),如果A選擇不開發(fā),B的最優(yōu)選擇是開

25、發(fā),A預(yù)測到自己的選擇對B的影響,因此開發(fā)是A的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是:A選擇開發(fā),B選擇不開發(fā)。,x,x,對于(不開發(fā),(開發(fā),開發(fā)),這個組合之所以構(gòu)成納什均衡,是因為B威脅不論A開發(fā)還是不開發(fā),他都將選擇開發(fā),A相信了B的威脅,不開發(fā)是最優(yōu)選擇,但是A為什么要相信B的威脅呢? 畢竟,如果A真開發(fā),B選擇開發(fā)得-3,不開發(fā)得0,所以B的最優(yōu)選擇是不開發(fā)。如果A知道B是理性的,A將選擇開發(fā),逼迫B選擇不開發(fā)。自己得1,B得0,即納什均衡(不開發(fā),(開發(fā),開發(fā))是不可置信的。因為它依賴于B的一個不可置信的威脅。 同樣: (不開發(fā),不開發(fā))也是一個不可置信威脅,納什均衡(開發(fā),(不開

26、發(fā),不開發(fā))是不合理的。,子博弈精練納什均衡,澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。 什么是子博弈,什么是子博弈精練納什均衡? 有沒有更好的方法找到子博弈精練納什均衡?,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),子博弈:是原博弈的一部分,它本身也可以作為一個獨立的博弈進行分析: (1)子博弈必須從一個單結(jié)信息點開始:只有決策者在原博弈中確切地知道博弈進入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的初始結(jié)。如果信息集包

27、含兩個以上的決策結(jié),則這兩個都不可以作為子博弈的初始結(jié)(見下頁)。 (2)子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng)x和x在原博弈中屬于同一信息集時,他們在子博弈中才屬于同一信息集。 習(xí)慣上,任何博弈的本身稱為自身的一個子博弈。,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),不開發(fā),不開發(fā),房地產(chǎn)開發(fā)博弈,找出房地產(chǎn)開發(fā)博弈的子博弈,(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)),A,開發(fā),不開發(fā),X,X,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),開發(fā),不開發(fā),(4,4),(8,0)

28、,(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),參與人X的信息集不能開始一個子博弈,否則的話,參與人B的信息將被切割。,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),子博弈精練納什均衡: 擴展式博弈的戰(zhàn)略組合是一個子博弈精練納什均衡,如果: (1)它是原博弈的納什均衡; (2)它在每一個子博弈上給出納什均衡。,A,開發(fā),不開發(fā),B,B,開發(fā),不開發(fā),開發(fā),(1,0),(0,1),(0,0),(-3,-3),x,x,房地產(chǎn)開發(fā)博弈,(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)) 在c上構(gòu)成均衡,在b上不構(gòu)成; 在b和c上都構(gòu)

29、成 在c上構(gòu)成均衡,在b上不構(gòu)成,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),不開發(fā),判斷下列均衡結(jié)果哪個構(gòu)成子博弈精練納什均衡?,不開發(fā),b,c,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),如果一個博弈有幾個子博弈,一個特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。 納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的; 而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實質(zhì)區(qū)別。,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(

30、1965),戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(即每一個決策結(jié))上選擇什么行動,即使這種情況實際上沒有發(fā)生(甚至參與人并不預(yù)期它會發(fā)生)。 因此,只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 子博弈精練納什均衡 擴展式表述博弈的納什均衡 子博弈精練納什均衡 用逆向歸納法求子搏弈精練納什均衡 承諾行動與子搏弈精練納什均衡 逆向歸納法與子搏弈精練納什均衡的存在問題

31、三 應(yīng)用舉例,用逆向歸納法求-子博弈精練納什均衡,1,U,D,L,(3,1),(0,0),2,(2,2),R,給定博弈達到最后一個決策結(jié),該決策結(jié)上行動的參與人有一個最優(yōu)選擇,這個最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡 倒數(shù)第二個決策結(jié),找倒數(shù)第二個的最優(yōu)選擇,這個最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構(gòu)成一個納什均衡。,如此重復(fù)直到初始結(jié)。每一步都得到對應(yīng)于子博弈的一個納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個過程的最后一步得到整個博弈的納什均衡,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),用逆向歸納法求子博弈精練納什均衡 對于有限完美信息博弈,逆向

32、歸納法求解子博弈精練納什均衡是一個最簡便的方法。,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),1,U,D,L,(1,1),2,2,0,R,U,(3,0),(0,2),1,D,子博弈精練納什均衡(U,U),L). U和L分別是參與人1和參與人2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過程,實質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個決策結(jié)依次剔除每個子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識。 如果博弈由多個階段組成,則從逆向歸

33、納法得到的均衡可能并不非常令人信服。,完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),進入者,進入,不進入(0,300),在位者,市場進入阻撓博弈樹,不可置信威脅,支付函數(shù),行動,合作(40,50),斗爭(-10,0),作業(yè),強盜分贓(向前展望,倒后推理) 有5個強盜搶得100枚硬幣,在如何分贓上爭論不休,于是他們決定: (1)抽簽決定個人的號碼(1,2,3,4,5) (2)由1號提出分配方案,然后5人表決,如果方案超過半數(shù)同意就通過,否則他被扔進大海喂鯊魚; (3)1號死后,2號提方案,4人表決,當(dāng)且僅當(dāng)超過半數(shù)同意時方案通過,否則2號被扔進大海; (4)依次類推,直到找到一個每個人

34、都接受的方案(當(dāng)然,如果只剩5號,他獨吞) 結(jié)果會如何?,作業(yè),完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965),練習(xí):-作業(yè)6 參與人1(丈夫)和參與人2(妻子)必須獨立決定出門時是否帶傘。他們知道下雨和不下雨的可能性均為50%,支付函數(shù)為:如果只有一人帶傘,下雨時帶傘者的效用為-2.5,不帶傘者的效用為-3不下雨時帶傘的效用為-1,不帶的效用為0;如果兩人都帶傘,下雨時每人效用為-2,不下雨時每人效用為-1;如兩人都不帶傘,下雨時每人的效用為-5,不下雨時每人的效用為1;給出下列四種情況下的擴展式及戰(zhàn)略式表述: (1)兩人出門前都不知道是否會下雨;并且兩人同時決定是否帶傘(即每一方在

35、決策時都不知道對方的決策); (2)兩人在出門前都不知道是否會下雨,但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘; (3)丈夫出門前知道是否會下雨,但妻子不知道,但丈夫先決策,妻子后決策; (4),同(3),但妻子先決策,丈夫后決策.,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 子博弈精練納什均衡 擴展式表述博弈的納什均衡 子博弈精練納什均衡 用逆向歸納法求子搏弈精練納什均衡 承諾行動與子搏弈精練納什均衡 逆向歸納法與子搏弈精練納什均衡的存在問題 三 應(yīng)用舉例,承諾行動與子博弈精練納什均衡,承諾行動與子博弈精練納什均衡 有些戰(zhàn)略之所以不是精練納什均衡,是

36、因為它包含了不可置信的威脅戰(zhàn)略,如果參與人能在博弈之前采取某種行動改變自己的行動空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會隨之改變. 這些改變博弈結(jié)果而采取的措施稱為承諾行動. 完全承諾:承諾可以使某項行動完全沒有可能(破釜沉舟). 不完全承諾:承諾只是增加了某個行動的成本而不是使該活動完全沒有可能.,承諾行動與子博弈精練納什均衡,曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻破袁之策,程昱獻了十面埋伏之計,他讓曹操退軍河上,誘袁前來追擊,到那時“我軍無退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計,令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮

37、力回頭反擊,袁軍大敗。,承諾行動與子博弈精練納什均衡,房地產(chǎn)開發(fā)博弈,如果在A決策之前,B與某客戶簽定了一個合同,規(guī)定B若不在特定時期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個合同就是承諾行動.,(1,-3.5),承諾行動與子博弈精練納什均衡,經(jīng)常有這樣的情況,非理性-通常是自動的而不是策略性的-是一個優(yōu)勢。 在電影怪愛博士中的末日機器就是一個例子。前蘇聯(lián)認為不可能在一場理性的軍備競賽中超過更富有的美國,所以,他制造了一顆炸彈,如果任何人引爆了這顆炸彈,它將自動炸毀整個世界。這部電影描述了這樣一個細節(jié),你必須告訴對方你有這么一個末日機器。 據(jù)說前美國總統(tǒng)尼克松曾告訴他的副手哈德蔓,他對

38、這個策略更復(fù)雜的看法:我稱為瘋子理論,我要讓北越相信我已經(jīng)到了無論付出多少都要結(jié)束戰(zhàn)爭的地步,我們只要他聽到這樣的傳聞:“看在上帝的份上,尼克松已經(jīng)被共產(chǎn)黨搞瘋了,當(dāng)他生氣的時候,我們沒法制止他,他的手已經(jīng)按在核按紐上了?!焙久鲀商熘髸桨屠枨蠛偷摹?子博弈精煉納什均衡-不可置信威脅,美國普林斯頓大學(xué)古爾教授在1997年的經(jīng)濟學(xué)透視里發(fā)表文章,提出一個例子說明威脅的可信性問題: 兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關(guān)起來,關(guān)起來比沒有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把

39、玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。 的確,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢姡艿苁抢硇匀?,他的告狀威脅是不可置信的。,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 擴展式表述博弈的納什均衡 三 子博弈精練納什均衡 子博弈精練納什均衡 用逆向歸納法求子搏弈精練納什均衡 承諾行動與子搏弈精練納什均衡 逆向歸納法與子搏弈精練納什均衡的存在問題 多個參與人的情況 蜈蚣博弈 四 重復(fù)博

40、弈和無名氏定理 五 應(yīng)用舉例,逆向歸納法與子搏弈精練納什均衡的存在問題,1,D,(1,1),A,2,D,(1/2,1/2),A,i,D,(1/i,1/i),A,n,D,(1/n,1/n),A,逆向歸納法要求“所有參與人是理性的”是所有參與人的共同知識。因此,在有多個參與人或每個參與人有多次行動機會的情況下,逆向歸納法的結(jié)果可能并非如此。,多個參與人的情況,(2,2),逆向歸納法與子搏弈精練納什均衡的存在問題,如果n很大,結(jié)果又如何呢?,1,D,(1,1),A,2,D,(1/2,1/2),A,i,D,(1/i,1/i),A,n,D,(1/n,1/n),A,多個參與人的情況,(2,2),對于參與人

41、1,獲得2單位支付前提是所有n-1個參與人都選A,否則就要考慮是否應(yīng)該選擇D以保證1的支付。如果給定一個參與人選擇A的概率是p1,所有n-1個參與人選擇A的概率是pn-1,如果n很大,這個值就很?。?另外,即使參與人1確信所有n-1個參與人都選A,他也可能懷疑是否第2個參與人相信所有n-2個參與人都選A。 這個鏈越長,共同知識的要求就越難滿足。,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 擴展式表述博弈的納什均衡 三 子博弈精練納什均衡 子博弈精練納什均衡 用逆向歸納法求子搏弈精練納什均衡 承諾行動與子搏弈精練納什均衡 逆向歸納法與子搏弈精練納什均衡的存在問題 多個

42、參與人的情況 蜈蚣博弈 四 重復(fù)博弈和無名氏定理 五 應(yīng)用舉例,逆向歸納法與子搏弈精練納什均衡的存在問題,1,D,(1,0),A,2,D,(0,2),A,2,D,(N,0),A,(0,N+1),A,1,D,(0,N-1),A,1,D,(3,0),A,2,D,(0,4),A,每個參與人有多個行動機會的蜈蚣博弈,1、2進行游戲決策,如果1在第一輪決策,得1,2得0,否則進入第二輪,2決策得2,A得0,逆向歸納法與子搏弈精練納什均衡的存在問題,1,D,(1,1),A?,2,D,(0,3),A,1,D,(98,98),A,2,D,(98,101),A,另一種蜈蚣博弈,(100,100),2,D,(97

43、,100),A,1,D,(99,99),A,有兩個參與人1、2,若第一次1決策結(jié)束,1、2都得n,若2決策結(jié)束,1得n-1,B得n+2,下一輪從1、1都是n+1開始,共100次,每個參與人有100個決策結(jié)。,1,D,(2,2),A,2,D,(1,4),A,但是,當(dāng)你沒有預(yù)料的事情發(fā)生時,比如參與人選擇了A,你該如何選擇?你的選擇應(yīng)該依賴于你的參與人未來的行為。特別是,你如何修正你對參與人理性程度的評價。,逆向歸納法與子搏弈精練納什均衡的存在問題,逆向歸納法理論沒有為當(dāng)某些未預(yù)料到的事情出現(xiàn)時參與人如何形成他們的預(yù)期提供解釋,這使得逆向歸納法的解釋受到懷疑。 弗德伯格等人將偏離行為解釋為是由于有

44、關(guān)“支付函數(shù)”信息的不確定性造成的,即實際的支付函數(shù)不同于原來認為的支付函數(shù),從而參與人在觀測到未曾預(yù)料到的行為時應(yīng)該修正有關(guān)支付函數(shù)的信息。 他們認為,任何一個有關(guān)博弈行為的理論應(yīng)該是“完備的”,即理論應(yīng)該對任何可能的行為賦予正的概率,從而當(dāng)某件事情出現(xiàn)時,參與人對隨后的博弈行為的條件預(yù)測總是很好定義的。,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 擴展式表述博弈的納什均衡 三 子博弈精練納什均衡 四 重復(fù)博弈 有限次重復(fù)博弈 無限次重復(fù)博弈 參與人不固定時的重復(fù)博弈 五 應(yīng)用舉例,二 占優(yōu)戰(zhàn)略均衡,案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵賴,坦白,抵賴,假如

45、囚徒困境博弈重復(fù)有限次,博弈的均衡結(jié)果將會怎樣? 重復(fù)無限次呢?這種博弈和純粹的囚徒困境博弈有何區(qū)別?,重復(fù)博弈,一次動態(tài)博弈也稱為“序貫博弈”。 重復(fù)博弈:指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈”。如囚徒困境。 重復(fù)博弈的特征: 1、階段博弈之間沒有“物質(zhì)上”的聯(lián)系,即前一階段的博弈不改變后一階段的結(jié)構(gòu) ; 2、所有參與人都觀測到博弈過去的歷史; 3、參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權(quán)平均均值。 貼現(xiàn)因子: 下一期的一單位支付在這一期的價值。 注意:在每個階段,參與人可同時行動,也可不同時行動。,重復(fù)博弈,因為其他參與人過去的歷史總是可以觀測到的,因此,一個參

46、與人可以使自己在某個階段博弈的選擇依賴于其他參與人過去的行動歷史,因此,參與人在重復(fù)博弈中的戰(zhàn)略空間遠遠大于和復(fù)雜于每一階段的戰(zhàn)略空間,這意味著,重復(fù)博弈可能帶來一些“額外”的均衡結(jié)果。 影響重復(fù)博弈均衡結(jié)果的主要因素是博弈重復(fù)的次數(shù)和信息的完備性。 博弈重復(fù)的次數(shù)的重要性來源于參與人在短期利益和長遠利益之間的權(quán)衡。 信息的完備性:當(dāng)一個參與人的支付函數(shù)不為其他參與人知道時,該參與人可能有積極性建立一個“好”的聲譽以換取長遠利益。,短期交易與長期交易。城市與農(nóng)村。,重復(fù)博弈和無名氏定理,有限次重復(fù)博弈連鎖店悖論,進入者,進入,不進入,在位者,默許,斗爭,默許,(-10,0),(0,300),(

47、0,300),(40,50),x,x,在位者,斗爭,假定同樣的市場上有20個(可以理解為在位者有20個連鎖店),進入者每次進入一個市場,博弈就變成了20次重復(fù)博弈。 假定進入者進入第1個市場,在位者應(yīng)該如何反應(yīng)呢?,重復(fù)博弈和無名氏定理,這個博弈的納什均衡是什么? 假定博弈共進行10次,結(jié)果會如何? 為什么會出現(xiàn)這個結(jié)果? 倒推論證法 假定現(xiàn)在是第十次,結(jié)果和一次博弈一樣。第九次,即倒數(shù)第二次,局中人已經(jīng)很清楚,最后一次博弈對方肯定要實行低價,因此,現(xiàn)在如何對他施行好心都不會在下一次得到好報,所以,理性人的“我”沒有理由實施高價使對方獲益。依次類推。,高價,企業(yè)乙,企業(yè)甲,低價,高價,低價,價

48、格大戰(zhàn)中的囚徒困境,二 占優(yōu)戰(zhàn)略均衡,案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵賴,坦白,抵賴,假如囚徒困境博弈重復(fù)10次,博弈的均衡結(jié)果將會怎樣?,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 擴展式表述博弈的納什均衡 三 子博弈精練納什均衡 四 重復(fù)博弈 有限次重復(fù)博弈 無限次重復(fù)博弈 參與人不固定時的重復(fù)博弈 五 應(yīng)用舉例,重復(fù)博弈,無限次重復(fù)博弈 囚徒困境博弈重復(fù)無窮次,結(jié)果如何? 證明得出,如果參與人有足夠的耐心,(抵賴,抵賴)是一個子博弈精練納什均衡結(jié)果)。 冷酷戰(zhàn)略 (1)開始選擇抵賴; (2)選擇抵賴一直到有一方選擇了坦白,然后永遠選擇坦白。,囚徒A

49、,囚徒 B,坦白,抵賴,坦白,抵賴,無限次重復(fù)博弈使其走出了囚徒困境,背后的原因是: 如果博弈重復(fù)無窮次而且每個人有足夠的耐心,任何短期機會主義行為的所得都是微不足道的,參與人有積極性為自己建立一個樂于合作的聲譽,同時也有積極性懲罰對方的機會主義的行為。,一個男孩被視為傻瓜,因為每當(dāng)別人拿一枚1角硬幣和5分硬幣讓他選的時候,他總是選5分的,有一個人覺得奇怪,就問他:“為什么你不拿1角錢的?”,男孩小聲回答:“假若我拿了1角錢的硬幣,下次他們就不會拿錢讓我選了?!?第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 擴展式表述博弈的納什均衡 三 子博弈精練納什均衡 四 重復(fù)博

50、弈 有限次重復(fù)博弈 無限次重復(fù)博弈 參與人不固定時的重復(fù)博弈 五 應(yīng)用舉例,重復(fù)博弈,參與人不固定時的重復(fù)博弈,廠商,消費者,購買,不購買,高質(zhì)量,低質(zhì)量,質(zhì)量博弈,假定只有一個廠商提供產(chǎn)品,每個消費者只買一次,且每個階段只有一個消費者。 為什么消費者偏好于購買大商店的產(chǎn)品而不相信走街串巷的小商販?,一次博弈的均衡結(jié)果,重復(fù)博弈,參與人不固定時的重復(fù)博弈,廠商,消費者,購買,不購買,高質(zhì)量,低質(zhì)量,質(zhì)量博弈,如果廠商的貼現(xiàn)因子 =1/2,則無限次重復(fù)博弈的納什均衡為: 廠商從生產(chǎn)高質(zhì)量的產(chǎn)品開始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,除非曾經(jīng)生產(chǎn)過低質(zhì)量產(chǎn)品,如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)品,之后永遠生產(chǎn)低質(zhì)量的

51、產(chǎn)品。 第一個消費者選擇購買,只要廠商不曾生產(chǎn)過低質(zhì)量的產(chǎn)品,隨后消費者繼續(xù)購買,如果廠商曾件生產(chǎn)過低質(zhì)量的產(chǎn)品,之后消費者不再購買。,貼現(xiàn)因子: 下一期的一單位支付在這一期的價值。,重復(fù)博弈,參與人不固定時的重復(fù)博弈,廠商,消費者,購買,不購買,高質(zhì)量,低質(zhì)量,質(zhì)量博弈,廠商:如果生產(chǎn)低質(zhì)量的產(chǎn)品,得到的短期利潤是2,但之后每階段利潤為0,如果總是生產(chǎn)高質(zhì)量的產(chǎn)品,每階段得到1單位利潤,貼現(xiàn)值為1/(1- ) =2,廠商將不會生產(chǎn)低質(zhì)量產(chǎn)品。害怕失掉消費者。 消費者: =1/2,其只關(guān)心1階段的支付,只有當(dāng)預(yù)期高質(zhì)量時,才會購買。消費者預(yù)期不曾生產(chǎn)過低質(zhì)量產(chǎn)品的廠商將繼續(xù)生產(chǎn)高質(zhì)量產(chǎn)品,故選

52、擇購買,反之亦然廠商生產(chǎn)過高質(zhì)量的產(chǎn)品.,克萊因等認為這個例子可以解釋為什么消費者偏好去大商店購買東西而不信賴走街串巷的小商販。 西蒙等用類似博弈解釋雇傭關(guān)系,認為,企業(yè)存在的原因之一正式創(chuàng)造一個“長期的參與人”,這樣一個參與人由于對未來利益的考慮而更講信用。,重復(fù)博弈,未來影響現(xiàn)在 對未來的預(yù)期,是影響我們行為的重要因素。一種是預(yù)期的收益,一種是預(yù)期的風(fēng)險。 地攤、車站、旅游點不但服務(wù)質(zhì)量差,而且假貨橫行 公共汽車上,兩個陌生人會為座位而爭吵,但是如果他們互相認識 為什么現(xiàn)代城市人的關(guān)系如此冷漠?為什么不文明行為屢禁不止? ,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述

53、 二 擴展式表述博弈的納什均衡 三 子博弈精練納什均衡 四 重復(fù)博弈 五 應(yīng)用舉例 斯坦克爾伯的寡頭競爭模型 輪流出價的討價還價模型 囚徒的救贖 旅行者困境,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,斯坦克爾伯的寡頭競爭模型,企業(yè)1,企業(yè)2,參與人:企業(yè)1、企業(yè)2; 行動順序:企業(yè)1先選擇產(chǎn)量q1,企業(yè)2觀測到q1,然后選 擇自己的產(chǎn)量q2。 支付: 利潤,利潤是兩個企業(yè)產(chǎn)量的函數(shù),斯坦克爾伯的寡頭競爭模型,qi :第i個企業(yè)的產(chǎn)量 C:代表單位不變成本 假定逆需求函數(shù)為: 第i個企業(yè)的利潤函數(shù)為:,斯坦克爾伯的寡頭競爭模型,用你向歸納法求解,首先考慮給定q1的情況下,企業(yè)2的最優(yōu)選擇。

54、企業(yè)2的問題是:,最優(yōu)化一階條件意味著:,因為企業(yè)1預(yù)測到企業(yè)2將根據(jù)S2(q1)來選擇q2,企業(yè)1在第1階段的問題是:,斯坦克爾伯的寡頭競爭模型,均衡結(jié)果比較,斯坦克爾伯的寡頭競爭模型,從上述計算可以看出: 斯坦克爾伯的均衡總產(chǎn)量大于庫諾特均衡總產(chǎn)量,企業(yè)1的斯坦克爾伯的均衡產(chǎn)量大于庫諾特均衡產(chǎn)量,企業(yè)2的斯坦克爾伯的均衡產(chǎn)量小于庫諾特均衡產(chǎn)量。同樣,企業(yè)1在斯坦克爾伯博弈中的利潤大于在庫諾特博弈中的利潤,企業(yè)2的利潤卻有所下降,這就是所謂的“先動優(yōu)勢”。 擁有信息優(yōu)勢可能使參與人處于劣勢。企業(yè)1先行動的承諾價值 :企業(yè)1之所以獲得斯坦克爾伯利潤而不是庫諾特利潤,是因為它的產(chǎn)品一旦生產(chǎn)出來就

55、變成了一種積淀成本,無法改變,從而使企業(yè)2不得不承認它的威脅是可置信的。而假如企業(yè)1只是宣布了它將生產(chǎn) ,企業(yè)2是不會相信她的威脅的。,第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡,一 博弈擴展式表述 二 擴展式表述博弈的納什均衡 三 子博弈精練納什均衡 四 重復(fù)博弈 五 應(yīng)用舉例 斯坦克爾伯的寡頭競爭模型 輪流出價的討價還價模型 囚徒的救贖 旅行者困境,輪流出價的討價還價模型,分蛋糕的動態(tài)博弈 游戲規(guī)則:第一輪由第一個參與人(小鵑)提出條件,第二個參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進入第二輪;小明提出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進入第三輪;蛋糕融

56、化呈線性,游戲結(jié)束,蛋糕融化 第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個人按照約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會怎樣?,輪流出價的討價還價模型,第二種情況:桌上放了一個冰淇淋蛋糕,但兩輪談判過后,蛋糕將完全融化。博弈結(jié)果如何? 第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何? 第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪,100輪談判后將完全融化,結(jié)果又如何?,博弈的結(jié)果是:假如“輪數(shù)”是偶數(shù),雙方各得一半,假若論述是奇數(shù),則小鵑得到(n+1)/2n;小明得到(n-1)/(2n),輪流出價的討價還價模型,通常情況下,在一個漫長的多輪的討價還價過程匯總,誰第一個提出條件并不重要。“妥協(xié)”的幾乎一半對一半的解決方案看來還是難以避免的。 如果談判長時間陷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論