ch3 完全且完美信息動(dòng)態(tài)博弈.ppt_第1頁(yè)
ch3 完全且完美信息動(dòng)態(tài)博弈.ppt_第2頁(yè)
ch3 完全且完美信息動(dòng)態(tài)博弈.ppt_第3頁(yè)
ch3 完全且完美信息動(dòng)態(tài)博弈.ppt_第4頁(yè)
ch3 完全且完美信息動(dòng)態(tài)博弈.ppt_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2020/8/18,1,第三章 完全且完美信息動(dòng)態(tài)博弈,完全得益 完美過程 動(dòng)態(tài)先后 請(qǐng)考慮以下問題: (1)是不是信息越多越有利? (2)過程是否重要? (3)動(dòng)態(tài)博弈與靜態(tài)博弈有哪些異同之處? (4)人們對(duì)已經(jīng)過去的博弈是更注重結(jié)果還是更注重過程?其意義何在?,2020/8/18,2,本章分六節(jié),3.1動(dòng)態(tài)博弈的表示法和特點(diǎn) 3.2可信性和納什均衡的問題 3.3子博弈和子博弈完美納什均衡 3.4幾個(gè)經(jīng)典動(dòng)態(tài)博弈模型 3.5有同時(shí)選擇的動(dòng)態(tài)博弈模型 3.6動(dòng)態(tài)博弈分析的問題和擴(kuò)展討論,2020/8/18,3,3.1 動(dòng)態(tài)博弈的表示法和特點(diǎn),3.1.1 階段和擴(kuò)展性表示 3.1.2 動(dòng)態(tài)博弈的

2、基本特點(diǎn),2020/8/18,4,3.1.1 階段和擴(kuò)展性表示,階段:動(dòng)態(tài)博弈中一個(gè)博弈方的一次選擇行為 例子:仿冒和反仿冒博弈,注:并不是所有的動(dòng)態(tài)博弈都可以用擴(kuò)展形來表示,如下棋。,2020/8/18,5,3.1.2 動(dòng)態(tài)博弈的基本特點(diǎn),1.動(dòng)態(tài)博弈的策略和結(jié)果 策略是在整個(gè)博弈中所有選擇、行為的計(jì)劃 結(jié)果是上述“計(jì)劃型”策略的策略組合,構(gòu)成一條路徑 得益對(duì)應(yīng)每條路徑,而不是對(duì)應(yīng)每步選擇、行為 2、與靜態(tài)博弈不同的基本特點(diǎn) 1)策略不同。每個(gè)博弈方的策略是指在整個(gè)博弈過程中在每個(gè)階段作出相應(yīng)選擇和行為的完整計(jì)劃。 2)結(jié)果不同。博弈的結(jié)果是指每個(gè)博弈方的策略組成的策略組合、實(shí)現(xiàn)博弈的路徑及

3、各個(gè)博弈方的得益。 3)地位不對(duì)稱,6,完全信息靜態(tài)博弈模型的表述(回顧),圖3.2 市場(chǎng)進(jìn)入的動(dòng)態(tài)博弈,擴(kuò)展式(博弈樹),標(biāo)準(zhǔn)(戰(zhàn)略)式,A先行動(dòng),B先行動(dòng),圖3.1 市場(chǎng)進(jìn)入的靜態(tài)博弈,完全信息靜態(tài)博弈模型的表述 (等價(jià)) 動(dòng)態(tài)博弈的標(biāo)準(zhǔn)式表示,圖3.2 市場(chǎng)進(jìn)入的動(dòng)態(tài)博弈,擴(kuò)展式(博弈樹),標(biāo)準(zhǔn)(戰(zhàn)略)式,A先行動(dòng),該博弈有三個(gè)納什均衡: 1.(進(jìn)入,(不進(jìn)入,不進(jìn)入); 2.(不進(jìn)入,(進(jìn)入,進(jìn)入); 3.(進(jìn)入,(不進(jìn)入,進(jìn)入)。 博弈的最終結(jié)局應(yīng)出現(xiàn)哪個(gè)均衡,需要分析在三個(gè)均衡的合理性。,1.含有不可信的承諾 2.含有不可信的威脅 3.合理的納什均衡,完全信息靜態(tài)博弈模型的表述 (

4、等價(jià)) 靜態(tài)博弈的博弈樹表示,圖3.1 市場(chǎng)進(jìn)入的靜態(tài)博弈,擴(kuò)展式(博弈樹),標(biāo)準(zhǔn)(戰(zhàn)略)式,A先行動(dòng),B決策時(shí)不知道A的選擇,2020/8/18,9,3.2 可信性和納什均衡的問題,3.2.1 相機(jī)選擇和策略中的可信性問題 3.2.2 納什均衡的問題 3.2.3 逆推歸納法,2020/8/18,10,3.2 可信性和納什均衡的問題,在動(dòng)態(tài)博弈中,由于博弈方策略的實(shí)施是一個(gè)過程,所以過程十分重要,類似于對(duì)未來過程的了解,它本身依賴于其它博弈方的行為。那么就存在一個(gè)對(duì)其博弈方所可能采取策略的可信性問題。博弈方在博弈過程中存在著改變計(jì)劃的情況,這種問題稱為相機(jī)選擇問題. 可信性:動(dòng)態(tài)博弈中先行為的

5、博弈方是否應(yīng)該相信后行為博弈方會(huì)采取某種策略或行為。 后行為博弈方將來采取對(duì)先行為博弈方有利的行為為“許諾”,采取對(duì)先行方不利的行為為“威脅”。,2020/8/18,11,3.2.1 相機(jī)選擇和策略中的可信性問題1.開金礦博弈,條件:甲去開采一價(jià)值4萬(wàn)元的金礦,缺1萬(wàn)元,乙恰好有1萬(wàn)元可以投資。甲向乙借1萬(wàn)元可以可開金礦,并“許諾”成功后與對(duì)半分成。 問題:乙是否該給甲投資?,2020/8/18,12,3.2.1 相機(jī)選擇和策略中的可信性問題1.開金礦博弈,可能性 即甲可能成功之后不與乙分錢(分當(dāng)然好),則乙損失1萬(wàn)元。 由此,乙決策的關(guān)鍵在于他是否相信甲的“許諾”,而結(jié)局取決于甲是否遵守他的

6、“許諾”。 接下來乙可采取一些方法以使甲盡可能兌現(xiàn)他的許諾打官司。,2020/8/18,13,3.2.1 相機(jī)選擇和策略中的可信性問題1.開金礦博弈,根據(jù)自身利益最大化 原則,甲在輪到行為 時(shí)的唯一選擇是不分, 而乙清楚甲的行為準(zhǔn) 則,則選擇不借。對(duì)乙來講,本博弈中甲有一個(gè)不可信的肯定不會(huì)信守的許諾。 怎樣使甲的許諾變?yōu)榭尚诺哪??關(guān)鍵在于必須增加一些對(duì)甲行為的約束。,2020/8/18,14,3.2.1 相機(jī)選擇和策略中的可信性問題2.法律保障的開金礦博弈,若乙采取法律手段,即打官司保護(hù)自己的利益,則博弈進(jìn)程如下圖所示。,2020/8/18,15,3.2.1 相機(jī)選擇和策略中的可信性問題2.法

7、律保障的開金礦博弈,在本博弈中,乙的唯一選擇是打官司,對(duì)甲來講,乙打官司的威脅是可信的,是肯定會(huì)信守的,他最理智的選擇就是分。 即,乙的策略是在第一階段借,如甲在第二階段選擇不分,則第三階段選擇打;甲的策略是如乙在第一階段選擇借,則他在第二階段選擇分。在雙方這樣的策略組合下,本博弈的路徑是(借,分),雙方得益為(2,2),實(shí)現(xiàn)有效率的理想的結(jié)果。,2020/8/18,16,3.2.1 相機(jī)選擇和策略中的可信性問題3.法律保障不足的開金礦博弈,根據(jù)納什均衡的定義可以判斷,乙的策略是第一階段選擇“借”,若第二階段甲選擇“不分”,第三階段選擇“打”, 甲的策略是第二階段選擇“分”。 實(shí)際結(jié)果是:乙在

8、第一階段不會(huì)選擇“借”,甲在第二階段也不會(huì)選擇“分”,乙在第三階段也不會(huì)選擇“打”。 結(jié)果相反的原因是第三階段的“打”是不可信的威脅。,如果乙的選擇打官司的得益是-1,即所謂贏了官司輸了錢。即法律保障不足的開金礦博弈,2020/8/18,17,3.2.1 相機(jī)選擇和策略中的可信性問題3.法律保障不足的開金礦博弈,法律制度必須滿足兩方面的要求:一是對(duì)人們的正當(dāng)權(quán)益保護(hù)力度足夠大;二是對(duì)侵害他人利益者有足夠的震懾作用,否則作用有限甚至完全無(wú)效。 乙打官司的威脅不可信,于是甲“分”錢的許諾就不可信。 最后結(jié)果乙選擇“不借”,2020/8/18,18,3.2.1 相機(jī)選擇和策略中的可信性問題,結(jié)論:在

9、動(dòng)態(tài)博弈中,各個(gè)博弈方的選擇和博弈結(jié)果,與各個(gè)博弈方在各個(gè)階段選擇各種行為的可信程度有很大關(guān)系。,2020/8/18,19,3.2.1 相機(jī)選擇和策略中的可信性問題先來后到博弈,在此博弈中,后進(jìn)入者博弈方1要決定是否進(jìn)入市場(chǎng)競(jìng)爭(zhēng),而先進(jìn)入市場(chǎng)的博弈方2有打擊和不打擊兩種選擇。,2020/8/18,20,3.2.1 相機(jī)選擇和策略中的可信性問題先來后到博弈,根據(jù)利潤(rùn)最大化原則,博弈方2的唯一選擇是無(wú)情打擊對(duì)手,這時(shí)博弈方2的打擊的威脅是可信的。了解博弈方2決策原則的博弈方1在第一階段只會(huì)選擇不進(jìn)。該博弈的結(jié)果為(0,10),即先占領(lǐng)市場(chǎng)者獨(dú)享利潤(rùn)。,2020/8/18,21,3.2.1 相機(jī)選擇

10、和策略中的可信性問題先來后到博弈,當(dāng)?shù)靡孀兂捎覉D情況 以后,博弈方2的打擊的 威脅就不再是可信的了。 這樣,博弈方1在第一階 段的合理選擇當(dāng)然只有進(jìn)。 博弈的結(jié)果選擇路徑為 (進(jìn),不打擊),雙方得益為(5,8)。 后進(jìn)者信息多,但利潤(rùn)不如先進(jìn)入者。后來者不一定總是從前者利益中分出一部分,而可能創(chuàng)造更大的總利益,而先進(jìn)入者的損失也不一定很大。,2020/8/18,22,第三種開金礦博弈中, (不借-不打,不分)和(借-打,分)都是納什均衡。但后者不可信,不可能實(shí)現(xiàn)或穩(wěn)定。 結(jié)論:納什均衡在動(dòng)態(tài)博弈可能缺乏穩(wěn)定性,也就是說,在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡,在動(dòng)態(tài)博弈中可能是不穩(wěn)定的,不能作為預(yù)

11、測(cè)的基礎(chǔ)。 根源:納什均衡本身不能排除博弈方策略中包含的不可信的行為設(shè)定,不能解決動(dòng)態(tài)博弈的相機(jī)選擇引起的可信性問題。,3.2.2 納什均衡的問題,2020/8/18,23,3.2.3 逆推歸納法,在動(dòng)態(tài)博弈中如何求解? 動(dòng)態(tài)博弈的特點(diǎn)是:在采取某一種決策時(shí)必須對(duì)其后可能進(jìn)行的子博弈有充分的了解,這樣才能很好的進(jìn)行博弈并得到合理的結(jié)果(基于理性和可信性,相當(dāng)于對(duì)后博弈行為的合理假設(shè))。由此,對(duì)于完全且完美信息的動(dòng)態(tài)博弈其基本求解方法可由最后階段的子博弈逆推來決定采取合適的策略逆推歸納法。,2020/8/18,24,3.2.3 逆推歸納法,定義:逆推歸納法就是從動(dòng)態(tài)博弈的最后一個(gè)階段或最后一個(gè)子

12、博弈開始,逐步向前倒推以求解動(dòng)態(tài)博弈的方法。 例,2020/8/18,25,3.2.3 逆推歸納法,逆推歸納法是動(dòng)態(tài)博弈分析最重要、基本的方法。,2020/8/18,26,3.3 子博弈和子博弈完美納什均衡,3.3.1 子博弈 3.3.2 子博弈完美納什均衡,2020/8/18,27,3.3.1 動(dòng)態(tài)博弈中的子博弈,定義: 子博弈即能夠自成一個(gè)博弈的某個(gè)動(dòng)態(tài)博弈的從其某個(gè)階段開始的后續(xù)階段,它必須有一個(gè)初始信息集,且具備進(jìn)行博弈所需的各種信息。,2020/8/18,28,3.3.1 動(dòng)態(tài)博弈中的子博弈,注意: 原博弈的初始節(jié)點(diǎn)開始的博弈為原博弈本身,不稱它為原博弈的子博弈; 第五章將說明在不完

13、美信息博弈中有其它的不作為子博弈的起始信息集的 節(jié)點(diǎn)。,2020/8/18,29,3.3.2 子博弈完美納什均衡,在動(dòng)態(tài)博弈中由于博弈過程是逐步深入的,這一過程由每個(gè)階段所采取的策略構(gòu)成,由此引出“路徑”的概念。 路徑:從第一階段開始通過每階段一個(gè)行為,最后達(dá)到博弈結(jié)束的一個(gè)終端各博弈方的行為組合。 找到了路徑也就找到了一個(gè)分階段的策略組合,這一策略組合恰似一個(gè)完整的計(jì)劃,計(jì)劃的最終實(shí)現(xiàn)取決于過程中各階段的實(shí)現(xiàn)。,2020/8/18,30,3.3.2 子博弈完美納什均衡,在開金礦案例中,策 略組合(借,分)是 一個(gè)穩(wěn)定的策略組合, 因?yàn)槿绻环?,則有 乙打官司的威脅,這 是雙方都不愿得到的結(jié)果

14、。 “穩(wěn)定”意味著博弈方都不會(huì)單獨(dú) 改變策略,這恰似納什均衡的概念。,2020/8/18,31,3.3.2 子博弈完美納什均衡,由于動(dòng)態(tài)博弈與靜態(tài)博弈有較大的差異,那么如何才能使靜態(tài)博弈中的納什均衡在動(dòng)態(tài)博弈中亦有相應(yīng)的概念發(fā)展? 以開金礦為例(注意此例與以前開金礦例子的差異),2020/8/18,32,3.3.2 子博弈完美納什均衡,此時(shí)打官司對(duì)乙亦無(wú)好處 (此情況在現(xiàn)實(shí)中可能出 現(xiàn))。在此情況中,逆推 可以得出乙不借,原因在 于乙在第三階段打官司的 威脅是不可信的。由此導(dǎo) 致甲在第二階段分的許諾也變?yōu)椴豢尚?。結(jié)局 是,甲開不成金礦,乙保本,甲失去掙錢的機(jī) 會(huì)。,2020/8/18,33,3

15、.3.2 子博弈完美納什均衡,如果按照靜態(tài)博弈的分析方法,則(借,分, 打)的策略組合為一個(gè)納什均衡,因?yàn)槿魏我环?都不會(huì)單獨(dú)改變策略而降低自己的得益。這與逆 推歸納法得到的結(jié)論相矛盾,原因在于路徑(借,分)的納什均衡策略組合包含了一個(gè)不 可信的威脅,即乙在第三階段會(huì)選擇打官司的行 為是不可信的。,2020/8/18,34,3.3.2 子博弈完美納什均衡,由此需要對(duì)靜態(tài)博弈中的納什均衡的概念有所調(diào)整,即應(yīng)滿足: 是納什均衡,從而具有策略穩(wěn)定性 不能包含任何的不會(huì)信守的許諾或威脅 這樣的動(dòng)態(tài)博弈策略組合稱為子博弈納什均衡。,2020/8/18,35,3.3.2 子博弈完美納什均衡,定義(Selt

16、en塞爾頓):如果動(dòng)態(tài)博弈中各博弈方的策略在動(dòng)態(tài)博弈本身和所有子博弈中都構(gòu)成一個(gè)納什均衡,則稱該策略組合為一個(gè)“子博弈完美納什均衡”。,2020/8/18,36,3.3.2 子博弈完美納什均衡,注意,用逆推歸納法所得到的解應(yīng)為子博弈完美納什均衡。 動(dòng)態(tài)博弈所應(yīng)注意的兩點(diǎn): 要求各博弈方的策略對(duì)每階段每種可能的情況都設(shè)定一個(gè)行為方案。其意義在于避免出現(xiàn)不會(huì)信守的許諾或威脅,從而使子博弈完美納什均衡可以用。 假定所有博弈方都是理性的且不會(huì)犯錯(cuò)誤的。,2020/8/18,37,3.3.2 子博弈完美納什均衡,與實(shí)際情況的差異: 后續(xù)可能性太多而無(wú)法分析,于是考慮僅知道有限后續(xù)階段的情況? 許諾有限非

17、理性,如何考慮?比如假設(shè)非理性的次數(shù)小于等于k?下棋 K叉樹算法 博弈構(gòu)成的“長(zhǎng)短”與穩(wěn)定性,不可預(yù)測(cè)性等,2020/8/18,38,3.4 幾個(gè)經(jīng)典動(dòng)態(tài)博弈模型,3.4.1 寡占的斯塔克博格模型 3.4.2 勞資博弈 3.4.3 討價(jià)還價(jià)博弈 3.4.4 委托人代理人理論,2020/8/18,39,3.4.1 寡占的斯塔克博格模型(古諾模型在動(dòng)態(tài)博弈中的體現(xiàn)),模型:設(shè)一市場(chǎng)有1、2兩個(gè)廠商生產(chǎn)同樣的產(chǎn)品。如果廠商1的產(chǎn)量為q1, 廠商2的產(chǎn)量為q2,則市場(chǎng)總產(chǎn)量為Q=q1+q2。設(shè)市場(chǎng)出清價(jià)格是P=P(Q)=8-Q, 生產(chǎn)無(wú)固定成本,單位變動(dòng)成本為2,討論其納什均衡。 分析: 個(gè)體收益最大

18、化 博弈方1利潤(rùn): 博弈方2利潤(rùn):,回憶“古諾的寡頭模型”,2020/8/18,40,回憶“古諾的寡頭模型”,在本博弈中, 的納什均衡的充分必要條件是 和 的最大值問題: 第一個(gè)對(duì)q1求導(dǎo),并將q1* 代入, 6-q2*-2q1*=0 第二個(gè)對(duì)q2求導(dǎo),并將q2* 代入, 6-q1*-2q2*=0 解得 唯一解 社會(huì)收益最大化: 假設(shè)總產(chǎn)量為Q,總收益為UQP(Q)CQ Q(8-Q)2Q6QQ2 其最大值為Q*=3,U=9 該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。,3.4.1 寡占的斯塔克博格模型(古諾模型在動(dòng)態(tài)博弈中的體現(xiàn)),2020/8/18,41,3.4.1 寡占的斯塔克博格模型,然而,許多實(shí)際問題為各廠商進(jìn)入市場(chǎng)有先后,尤其是廠家有強(qiáng)弱之分,且后一廠商(跟隨者)在決策時(shí)是看著前一廠商的選擇的,由此引出斯塔克博格模型。 斯塔克博格模型與古諾模型相比,唯一的不同是前者有一個(gè)選擇的次序問題,其他如博弈方、策略空間和得益函數(shù)等完全都是相同的。,2020/8/18,42,3.4.1 寡占的斯塔克博格模型,先后選擇產(chǎn)量的產(chǎn)量競(jìng)爭(zhēng)博弈 把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時(shí)選擇即可。,產(chǎn)量 得益 廠商1 3單位 4.5 廠商2 1.5單

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論