序貫決策博弈概論

上傳人：z*** IP屬地：廣東上傳時(shí)間：2022-10-10 格式：PPTX 頁數(shù)：76 大?。?.22MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩71頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、序貫決策博弈概論第一部分同時(shí)博弈與序貫博弈主要內(nèi)容本章主要介紹：1、如何用正規(guī)型表示和展開型表示來表述同一個(gè)博弈。2、博弈論中的兩個(gè)重要概念：信息集和不完美信息。3、考察包含同時(shí)決策行動(dòng)和序貫決策行動(dòng)的復(fù)合型博弈（混合博弈）的納什均衡。第一節(jié) 博弈的正規(guī)型表示與展開型表示第二節(jié) 同時(shí)決策與序貫決策的混合博弈第三節(jié) 樹形博弈的子博弈第四節(jié) 子博弈精煉納什均衡第五節(jié) 完美博弈的庫恩定理第六節(jié) 動(dòng)態(tài)博弈的運(yùn)用第一節(jié) 博弈的正規(guī)型表示與展開型表示一、如何將博弈的展開型形式轉(zhuǎn)化為正規(guī)型表示案例：“進(jìn)入障礙”博弈進(jìn)入者進(jìn)入不進(jìn)壟斷者容忍抵抗容忍抵抗（1，5）（-2，2）（0，10）（0，4）

2、壟斷者abc“進(jìn)入障礙”的矩陣表達(dá)1，5-2，2-2，21，50，100，40，100，4進(jìn)入者壟斷者進(jìn)入不進(jìn)入容忍，容忍抵抗，抵抗抵抗，容忍容忍，抵抗小結(jié)1、一般我們將先行動(dòng)者放在行局中人的位置，把后行動(dòng)者放在列局中人的位置。2、每個(gè)局中人的策略必須是一個(gè)完整的計(jì)劃，必須考慮自己在對方每一個(gè)行動(dòng)下的行動(dòng)。例如：容忍，容忍。在本例中，進(jìn)入者有兩個(gè)純策略，而壟斷者有四個(gè)純策略。3、每個(gè)局中人的決策輪數(shù)越多，則他的純策略選擇的數(shù)目越多。思考：如果有三輪博弈，如何寫矩陣形式。4、矩陣形式表示的可能的博弈結(jié)果比樹形表示的結(jié)果要多，這是因?yàn)橛胁恢挂粋€(gè)純策略可以導(dǎo)致相同的博弈結(jié)果。二、如何將正規(guī)型的博

3、弈轉(zhuǎn)化為展開型比前面簡單，尤其是序貫博弈，但如果是同時(shí)博弈，如何表示？信息集案例：情侶博弈2， 10， 00， 01， 2足球芭蕾足球芭蕾丈夫妻子夫妻之爭信息集根據(jù)同時(shí)博弈的定義，每個(gè)局中人決策時(shí)不知道別人的策略，即每個(gè)局中人在做自己的行動(dòng)選擇時(shí)，并不知道自己處在哪個(gè)決策節(jié)點(diǎn)上。例如妻子在選芭蕾時(shí)，并不知道丈夫選的是芭蕾還是足球。局中人不能是別人對方“已經(jīng)”做出的行動(dòng)或決策，就等于同時(shí)行動(dòng)或決策。此時(shí)，我們用一個(gè)扁橢圓形的虛線的圈，把所論局中人的若干決策節(jié)點(diǎn)罩起來，成為他的一個(gè)信息集。即局中人知道博弈已經(jīng)進(jìn)行到他的這個(gè)信息集，但不知道博弈究竟進(jìn)行到這個(gè)信息集中的哪個(gè)決策節(jié)點(diǎn)。信息集妻子雖然知

4、道博弈已經(jīng)進(jìn)行到她的信息集，但不知道進(jìn)行到信息集中的那個(gè)決策點(diǎn)，即她不知道丈夫會選什么，因此是同時(shí)博弈。丈夫足球芭蕾妻子足球芭蕾足球芭蕾（2，1）（0，0）（-1，-1）（1，2）妻子注意一個(gè)信息集罩住的必須是同一個(gè)局中人的決策點(diǎn)。必須是同一個(gè)局中人在同一個(gè)時(shí)點(diǎn)的決策節(jié)點(diǎn)。ABBA不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒這兩個(gè)虛線罩住的都不是信息集。注意同時(shí)，即使是同一個(gè)人在同一時(shí)點(diǎn)進(jìn)行決策，也不一定構(gòu)成一個(gè)信息集，他還必須滿足：在每一個(gè)決策點(diǎn)他的行動(dòng)選擇集合必須是相同的。因?yàn)榫种腥嗽谧鲂袆?dòng)選擇時(shí)并不知道自己位于哪個(gè)決策點(diǎn)，因此，他不

5、可能做出不同的行動(dòng)選擇。ABB該虛線罩住的不是信息集。其必須滿足：同集同注，即從各個(gè)決策點(diǎn)出發(fā)的策略選擇數(shù)目相同，名稱也相同。單點(diǎn)集和非單點(diǎn)集我們把不被扁橢圓虛線罩住的每個(gè)決策節(jié)點(diǎn)也給以信息集的地位，稱為單點(diǎn)集。因此，每一個(gè)決策位置都是一個(gè)信息集，只有單點(diǎn)集和非單點(diǎn)集之分。ABB非單點(diǎn)集單點(diǎn)集完美信息博弈和不完美信息博弈當(dāng)博弈走到一個(gè)單點(diǎn)集的信息集時(shí)，面臨決策的局中人對于博弈迄今的歷史清清楚楚，他清楚了博弈具體走到了他的這個(gè)決策節(jié)點(diǎn)而不是別的決策點(diǎn)。我們把這種歷史清楚的博弈稱為完美信息博弈。但是當(dāng)博弈走到一個(gè)非單點(diǎn)集的信息集時(shí)，面臨決策的局中人對于博弈迄今的歷史是不清楚的，他不清楚博弈具體走到

6、了他的這個(gè)信息集里面的那個(gè)決策點(diǎn)。我們把這種歷史不清楚的博弈稱為不完美信息博弈。如果一個(gè)序貫博弈的每個(gè)信息集都是一個(gè)單點(diǎn)集，那么該序貫博弈就是完美信息博弈，否則他就是不完美信息博弈。信息集舉例情愛博弈的擴(kuò)展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xxA開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/

7、2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策) 房地產(chǎn)開發(fā)博弈第二節(jié) 同時(shí)決策與序貫決策的混合博弈（完全不完美信息的兩階段博弈）我們把包含同時(shí)決策行動(dòng)和序貫決策行動(dòng)的博弈稱為混合博弈。假設(shè)有兩家計(jì)算機(jī)公司：方正和聯(lián)想。彼此對新產(chǎn)品的研發(fā)和定價(jià)進(jìn)行博弈競爭。該博弈分為兩個(gè)階段：第一階段，兩個(gè)公司進(jìn)行研發(fā)投入競爭，每個(gè)公司都可以選擇“大投入”和“小投入”的研發(fā)預(yù)算，同時(shí)每個(gè)公司都不公開公布自己的預(yù)算；第二階段，當(dāng)產(chǎn)品開發(fā)出來并面世以后，廠商會觀摩對方研制出

8、來的新產(chǎn)品對自己的新產(chǎn)品定價(jià)，每個(gè)廠商可以定高價(jià)也可以定低價(jià)，但定價(jià)之前看不到對方的定價(jià)。聯(lián)想大投入小投入大投入小投入方正高價(jià)格低價(jià)格5，52，66，24，44，33，42，11，26，63，77，35，53，41，24，32，1高價(jià)格高價(jià)格高價(jià)格高價(jià)格高價(jià)格高價(jià)格高價(jià)格低價(jià)格低價(jià)格低價(jià)格低價(jià)格低價(jià)格低價(jià)格低價(jià)格聯(lián)想大投入小投入大投入小投入方正5，52，66，24，44，33，42，11，23，41，24，32，16，63，77，35，5聯(lián)想大投入小投入大投入小投入4，43，44，35，5方正該博弈的結(jié)果為：兩個(gè)公司都在第一個(gè)階段采取小投入（帕累優(yōu)勢原則），在第二個(gè)階段采取低價(jià)格。但納什均衡有

9、16個(gè)（過程略），因?yàn)楹芏嗖呗詫?dǎo)致同一個(gè)結(jié)果。該博弈的展開型表述見P173頁銀行擠兌博弈案例案例情況：兩個(gè)投資者每人存入銀行一筆存款D，銀行已將這些存款投入一個(gè)長期項(xiàng)目。如果在該項(xiàng)目到期前銀行被迫對投資者變現(xiàn)，共可收回2r，這里DrD/2。不過，如果銀行允許投資項(xiàng)目到期，則項(xiàng)目共可取得2R，這里RD。有兩個(gè)時(shí)間，投資者可以從銀行提款:在銀行的投資項(xiàng)目到期之前或者在到期之后。為使分析簡化，假設(shè)不存在貼現(xiàn)。兩個(gè)投資者的提款日期可以有如下可能：A、兩個(gè)都提前，都得到rB、一個(gè)提前提取另一個(gè)不動(dòng)，則第一人得D,另一人得2r-D.C、兩個(gè)在到期后提，各得RD、兩個(gè)都不提，等到投資項(xiàng)目結(jié)束，都得到RE、

10、如果一個(gè)人在期滿后提取，另一人不動(dòng)則分別得：2R-D,D。如下圖所示：我們使用逆向歸納法分析問題從日期2開始先考慮日期2的標(biāo)準(zhǔn)式博弈，由于明顯的RD,也就是說2R-DR。我們可以得到這個(gè)博弈的納什均衡（R,R）。由于不存在貼現(xiàn)，我們可以直接帶入日期1的博弈矩陣表示式。由于rD(并且由此可得2r-D r)，這一由兩階段博弈變形得到的單階段博弈存在兩個(gè)純戰(zhàn)略納什均衡:(1)兩個(gè)投資者都提款，最終收益情況為(r , r); 兩個(gè)投資者都不提款，最終收益為(R,R)。從而，最初的兩階段銀行擠提博弈就有2個(gè)子博弈精煉解。銀行擠兌(1)王則柯“銀行擠兌的成因和預(yù)防”兩客戶在同一銀行各存有100元，銀行將這

11、200元投資于一個(gè)長期項(xiàng)目。如果在項(xiàng)目到期前銀行要抽回資金，則只能收回140元；但如果到期后再收回投資，則可收回本息280元。對客戶來說，抽回存款的日期也有兩種：一是在銀行投資項(xiàng)目到期之前，稱日期1；一是在到期之后，稱日期2。假定如果兩客戶在日期1要求抽回資金則各得70元；如果只有一個(gè)客戶在日期1要抽回資金則該客戶得100元，另一客戶只能得到剩余的40元。如果等到日期2兩客戶同時(shí)要收回資金，則各得140元；如果到日期2還只有一方要求收回資金，則要求收回資金一方得180元，另一方得100元；如果到日期2沒有客戶要求收回資金，則銀行還是分給他們各140元。周瑜存不存存不存諸葛亮40,100100,

12、4070,70周瑜抽回不抽回不諸葛亮40,100100,4070,70銀行擠兌(3)日期1周瑜諸葛亮抽回不抽回抽回70,70100,40不抽回40,100140,140 前一種結(jié)果可以解釋為對銀行的一次擠提。如果投資者1相信投資者2將在日期1提款、則投資者1的最優(yōu)反應(yīng)也是去提款，即使他們等到日期2再去提款的話兩人的福利都會提高。這里的銀行擠提博弈在一個(gè)很重要的方面不同于第1章中討論的囚徒困境:雖然兩個(gè)博弈都存在一個(gè)對整個(gè)社會是低效率的納什均衡;但在囚徒困境中這一均衡是惟一的(并且是參與者的嚴(yán)格占優(yōu)戰(zhàn)略)，而在這里還同時(shí)存在另一個(gè)有效率的均衡。從而，這一模型并不能預(yù)側(cè)何時(shí)會發(fā)生對銀行的擠提，但的

13、確顯示出擠提會作為一個(gè)均衡結(jié)果而出現(xiàn)。經(jīng)典案例之關(guān)稅競爭在國際爭端中，關(guān)稅與貿(mào)易爭端最為激烈。由于貿(mào)易能增進(jìn)雙方的福利，而關(guān)稅是阻礙貿(mào)易自由的最大障礙。在早期，政府自由選擇關(guān)稅稅率時(shí)將如何決策？考慮兩個(gè)完全相同的國家（i=1,2），考慮兩個(gè)完全相同的國家（i=1,2），政府負(fù)責(zé)確定關(guān)稅稅率(t1,t2)；考慮兩個(gè)完全相同的國家（i=1,2），一個(gè)政府負(fù)責(zé)確定關(guān)稅稅率(t1,t2)；企業(yè)1制造產(chǎn)品h1供給本國,及出口e1；考慮兩個(gè)完全相同的國家（i=1,2），一個(gè)政府負(fù)責(zé)確定關(guān)稅稅率(t1,t2)；企業(yè)1制造產(chǎn)品h1供給本國,及出口e1；企業(yè)制造產(chǎn)品供給本國(h1,h2)及出口(e1,e2)；

14、考慮兩個(gè)完全相同的國家（i=1,2），政府負(fù)責(zé)確定關(guān)稅稅率(t1,t2)；企業(yè)制造產(chǎn)品供給本國(h1,h2)及出口(e1,e2)；市場1：Q1=h1+e2考慮兩個(gè)完全相同的國家（i=1,2），政府負(fù)責(zé)確定關(guān)稅稅率(t1,t2)；企業(yè)制造產(chǎn)品供給本國(h1,h2)及出口(e1,e2)；兩個(gè)市場：Qi=hi+ej考慮兩個(gè)完全相同的國家（i=1,2），政府負(fù)責(zé)確定關(guān)稅稅率(t1,t2)；企業(yè)制造產(chǎn)品供給本國(h1,h2)及出口(e1,e2)；兩個(gè)市場：Qi=hi+ej, pi(Qi)=a-Qi考慮兩個(gè)完全相同的國家（i=1,2），每個(gè)國家有一個(gè)政府負(fù)責(zé)確定關(guān)稅稅率(t1,t2)；一個(gè)企業(yè)制造產(chǎn)品供給

15、本國(h1,h2)及出口(e1,e2)；博弈的時(shí)間順序如下：(1)政府同時(shí)選擇關(guān)稅稅率t1和t2；(2)企業(yè)觀察到關(guān)稅稅率，并同時(shí)選擇其提供國內(nèi)消費(fèi)和出口的產(chǎn)量(h1, e1)和(h2, e2)；企業(yè)的收益為其利潤i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei由于i (ti,tj,hi,ei,hj*,ej*)可表示為:企業(yè)I 在市場i的利潤 + 在市場j的利潤即i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei也即i(ti, t

16、j, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei)ei-cei-tjei企業(yè)i在市場的最優(yōu)化問題就可拆為一對問題，在每個(gè)市場分別求解企業(yè)的收益為其利潤i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei)ei-cei-tjei企業(yè)i在市場的最優(yōu)化問題就可拆為一對問題，在每個(gè)市場分別求解 hi*須滿足：max hia-(hi+ej*)-c,hi0企業(yè)的收益為其利潤i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei)ei-cei-tjeiei

17、*必須滿足：maxeia-(ei+hj*)-c-tjeiei0企業(yè)的收益為其利潤i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjeihi*須滿足：max hi a - (hi+ej*) - c,hi0ei*必須滿足：max ei a - (ei+hj*) c - tjeiei0企業(yè)的收益為其利潤i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjeihi*須滿足：maxhia-(hi+ej*)-c,hi0且ei*必須滿足：maxeia-(e

18、i+hj*)-c-tjeiei0企業(yè)的收益為其利潤i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei解得hi*=(a-ej*-c)/2ei*=(a-hj*-c-tj)/2 同理，若政府給定關(guān)稅稅率t1和t2，則第二個(gè)企業(yè)j將選擇產(chǎn)量(hj*, ej*)，即同理，若政府給定關(guān)稅稅率t1和t2，則第二個(gè)企業(yè)j將選擇產(chǎn)量(hj*, ej*)，即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3若政府給定關(guān)稅稅率t1和t2，則企業(yè)i將選擇產(chǎn)量(hi*, ei*)，即hj*=(a-c+tj)/3 ej*=(a-c

19、-2ti)/3則利潤為i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei若政府給定關(guān)稅稅率t1和t2，則企業(yè)i將選擇產(chǎn)量(hi*, ei*)，即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3則利潤為i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei政府的收益回到第一階段政府的收益則為其本國的總福利wi，它由消費(fèi)者剩余、企業(yè)利潤及關(guān)稅構(gòu)成，即： wi(ti, tj, hi,ei, hj, ej)= (hi+ej)2/2 + i(

20、ti, tj, hi,ei, hj, ej) + tiej回到第一階段政府的收益則為其本國的總福利wi，它由消費(fèi)者剩余、企業(yè)利潤及關(guān)稅構(gòu)成，即： wi(ti, tj, hi,ei, hj, ej)= (hi+ej)2/2 + i(ti, tj, hi,ei, hj, ej) + tiej回到第一階段把第一階段的結(jié)果代入得回到第一階段求解一階條件回到第一階段求解一階條件回到第一階段求解一階條件得有該博弈的子博弈完美納什均衡：以及對應(yīng)的納什均衡結(jié)果在子博弈精煉解中，每個(gè)市場上的總量為，。進(jìn)一步分析我們發(fā)現(xiàn)，如果政府選擇0關(guān)稅稅率，則每個(gè)市場上的總量為，。于是，政府就有動(dòng)因簽訂一個(gè)相互

21、承諾0關(guān)稅稅率的協(xié)定，即自由貿(mào)易。第三節(jié) 樹形博弈的子博弈定義：由一個(gè)動(dòng)態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的，有初始信息集和進(jìn)行博弈所需要的全部信息，能夠自成一個(gè)博弈的原博弈的一部分，稱為原動(dòng)態(tài)博弈的一個(gè)“子博弈”。乙甲不借借不分分（1，0）（0，4）（2，2）乙（-1，0）注意1、子博弈不能從第一個(gè)階段開始，因?yàn)樵瓉淼牟┺模覆┺模┍旧聿荒芊Q為子博弈，即子博弈集合是一個(gè)真子集合。2、子博弈不能分割原來博弈（母博弈）的信息集。ABCDEFGHID、E、F、G點(diǎn)以后都不能構(gòu)成子博弈.這個(gè)博弈有幾個(gè)子博弈?第四節(jié) 子博弈精煉納什均衡定義：如果一個(gè)完美信息的動(dòng)態(tài)博弈中，各博弈方的策略構(gòu)

22、成的一個(gè)策略組合滿足，在整個(gè)動(dòng)態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡，那么這個(gè)策略組合稱為該動(dòng)態(tài)博弈的一個(gè)“子博弈完美納什均衡”。子博弈完美納什均衡能夠排除均衡策略中不可信的威脅(允諾)和承諾，因此是真正穩(wěn)定的。逆推歸納法(倒推法)是求完美信息動(dòng)態(tài)博弈子博弈完美納什均衡的基本方法。注意子博弈精煉納什均衡本身也是納什均衡，但卻比納什均衡更強(qiáng)的均衡概念。子博弈精煉納什均衡能夠排除不是結(jié)果的納什均衡。例如：情侶博弈中，（足球，足球，足球）和（芭蕾，芭蕾，芭蕾）策略不是子博弈精煉納什均衡，因此不是最終的結(jié)果。圖見P179。如果一個(gè)策略組合的某個(gè)策略成分有偏離的激勵(lì)，我們可以說這個(gè)策略組合缺乏局部穩(wěn)定性，不是子博弈精煉納什均衡。完美博弈的庫恩定理：完美信息的有限序貫博弈都有納什均衡。動(dòng)態(tài)博弈分析中為什么要引進(jìn)子博弈完美納什均衡，它與納什均衡是什么關(guān)系？子博弈完美納什均衡是一種

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

序貫決策博弈概論

文檔簡介

溫馨提示

最新文檔

評論

序貫決策博弈概論

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔