博弈論及其應(yīng)用-課節(jié)4_第1頁
博弈論及其應(yīng)用-課節(jié)4_第2頁
博弈論及其應(yīng)用-課節(jié)4_第3頁
博弈論及其應(yīng)用-課節(jié)4_第4頁
博弈論及其應(yīng)用-課節(jié)4_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、教案工教學(xué)題目:學(xué)時數(shù)2(第二章完全信息靜態(tài)博弈,23)教學(xué)目的和要求:理解Nash均衡的表達(dá)。掌握Nash均衡的應(yīng)用。教學(xué)基本內(nèi)容:基本方法:理解Nash均衡的表達(dá)。掌握Nash均衡的應(yīng)用教學(xué)重點(diǎn)與難點(diǎn):重點(diǎn)在于Nash均衡的應(yīng)用;難點(diǎn)在于帔.6的討論教學(xué)過程:課前復(fù)習(xí)理解博弈均衡的概念。講授新課:2.2Nash均衡我們再以囚徒困境為例討論如下:囚徒B坦白囚徒B抗拒囚徒A坦白-6,-60,-10囚徒A抗拒-10,0-1,-1顯然,不論囚徒A選擇坦白還是抗拒,囚徒B的最優(yōu)策略都是坦白;不論囚徒B選擇坦白還是抗拒,囚那的最優(yōu)策略都是坦白;由收益函數(shù):UA(抗拒,坦白)=T0;UA(坦白,坦白)=

2、-6;UA(抗拒,抗拒)=1;UA(坦白,抗拒)=0。UB(抗拒,坦白)=0;UB(坦白,坦白)=-6;UB(抗拒,抗拒)=T;UB(坦白,抗拒)=-10。UA(坦白,O)UA(抗拒O);Ub(。坦白)Ub(。抗拒);這時,“坦白”策略就成為囚徒A,B的嚴(yán)格優(yōu)策略,如果一個博弈中的所有局中人都存在嚴(yán)格優(yōu)策略,那么由這些嚴(yán)格優(yōu)策略組成的局勢,就是該博弈的惟一均衡解。在囚徒困境中的囚徒A,B的嚴(yán)格優(yōu)策略“坦白”組成的局勢(坦白,坦白)就是該博弈的惟一均衡解。記Si(4,S2,L,01,s1,L,Sn),則局勢s(%,S2,L,0i,4,Si1,L,Sn)(Si,si)SSLS。定義2-2(嚴(yán)格優(yōu)策

3、略)在n人博弈G(N,S,U)中,除局中人i外,其余n1個局中人的所有可能的局勢Sj(S1,s2,L,s(1,si1,L,sn),局中人i存在著一個自己的策略Si,使得對一切的,Si(SiS*),有Ui(Si,Si)Ui(Si,S2,L,Si1,0,S1,L,Sn)uL,sL,s)q(S,Si),則稱Si*6是局中人的嚴(yán)格優(yōu)策略。囚徒A,B在囚徒困境中都有自己白鏟格優(yōu)策略“坦白;組成的局勢(坦白,坦白:為該博弈的惟一均衡解。這種現(xiàn)象是一般規(guī)律嗎?命題2 1 在n人博弈G(N,S,U)中,如果每一個局中人都有自己的嚴(yán)格優(yōu)策略si (i 1,L , n),那么,n個局中人每人的嚴(yán)格優(yōu)策略組成的局勢

4、(Si, L , Si, L , S|n)是博弈G(N, S,U )的惟一均衡解并稱(Si,L,Si,L,Sn)為嚴(yán)格優(yōu)策略均衡局勢或嚴(yán)格優(yōu)策略均衡解證明:由以上的討論,n個局中人的嚴(yán)格優(yōu)策略組成的局觀*(s*,L,s*,L,sn)是博弈G(N,S,U)的一個均衡解。如果博弈G(N,S,U)有兩個均衡解s*,S*,則至少有一個局中人j有兩個嚴(yán)* * * *格優(yōu)策略Sj , Sj ,設(shè)S(S1 , L , Sj , L , Sn),*S*(Si, L ,Sj , L ,Sn).*一.一.一一.因?yàn)镾j是局中人j的嚴(yán)格優(yōu)策暗所以*Uj(S)Uj(S);又因?yàn)镾*也是局中人j的嚴(yán)格優(yōu)策暗所以 TOC

5、 o 1-5 h z 一*.*.Uj(s)Uj(s).結(jié)合(1)(2)兩式有: HYPERLINK l bookmark28 o Current Document *Uj(s)Uj(S)Uj(S),.*.-*一.八.、此為矛盾因此SjSj.從而ss,即解是唯一的口定義2-4(優(yōu)策略)在n人博弈G(N,S,U)中,除局中人外,其余n1個局中人的所有可能的局勢si(s1,s2,L,S1,si1,L,sn),局中人i存在著一個自己的策略s*,使得對一切的siSi,有,*、,.*.、,.、,、Ui(si,si)Ui(s1,s2,L,1i,0,si,L,sJUi(s1,L,,L,sn)(s),并且局中人

6、i至少存在著一個自己的策略S,使得,*、,*.、,、,、Ui(1,si)Ui(si,L,i,,,si,L,sn)Ui(si,L,1,L,s)Ui(,si),則稱s*Si是局中人的優(yōu)策略。顯然嚴(yán)格優(yōu)策略一定是優(yōu)策略但在許多情況下,不要說嚴(yán)格優(yōu)策略,就是優(yōu)策略都未必存在!我們以例2-1(獵鹿博弈)為例討論如下獵人B-獵鹿獵人B-獵兔獵人A-獵鹿阿園0,1獵人A-獵兔1,01Q由收益函數(shù):UA (獵鹿,獵鹿)=10;UA (獵鹿,獵兔)=0;UB (獵鹿,獵鹿)=10;UB (獵鹿,獵兔)=0;但是,Ua (獵鹿,O) UUA (獵兔,獵鹿)=1;UA (獵兔,獵兔)=1。UB (獵兔,獵鹿)=1;

7、UB (獵兔,獵兔)=1。(獵兔,O)不成立,因?yàn)閁A(獵鹿,獵鹿)=10UA(獵兔,獵鹿)=1;UA(獵鹿,獵兔)=0UA(獵兔,獵兔)=1;因此,獵人A沒有優(yōu)策略,更沒有嚴(yán)格優(yōu)策略。對31人B的討論也同樣沒有優(yōu)策略但卻存在兩個Nash均衡解博弈解的第一組值為(10,10)(雙值),對應(yīng)博弈的解為(獵鹿,獵鹿);博弈解的第二組值為(1,1)(雙值),對應(yīng)博弈的解為(獵兔獵兔),它們都是Nash均衡,即此博弈有2個解或兩個均衡點(diǎn)。問題是:這兩個解應(yīng)當(dāng)如何去看?如果將博弈改為獵人乙-獵鹿獵人乙-獵兔獵人甲-獵鹿10,100,1獵人甲-獵兔1,00,0請同學(xué)們發(fā)表意見。毛澤東的思考由收益函數(shù):UA

8、 (獵鹿,獵鹿)=10;UA (獵鹿,獵兔)=1;UB (獵鹿,獵鹿)=10;Ub (獵鹿,獵兔)=0;UA (獵兔,獵鹿)=0;UA (獵兔,獵兔)=0Ub (獵兔,獵鹿)=1;Ub (獵兔,獵兔)=0 Ua(獵兔,O)成立,UA(獵鹿,獵鹿)=10Ua(獵兔,獵鹿)=1;UA(獵鹿,獵兔)=1UA(獵兔,獵兔)=0;因此,獵人A有嚴(yán)格劣策略獵兔”;同理,獵人B也有嚴(yán)格劣策略獵兔”我們在上述基本式中剔除嚴(yán)格劣策略,我們就只剩下一個均衡解:獵人B般鹿獵人A-獵鹿10,10我們?yōu)槭裁匆钯Y本主義的尾巴?智豬博弈產(chǎn)生了,我的經(jīng)歷:獵鹿博弈智豬博弈囚徒困境例2-2斗雞博弈首先依據(jù)情景描述寫出博弈的基

9、本式再列出博弈雙方的收益矩磔雙矩陽飛車黨黨徒B讓飛車黨黨徒B撞飛車黨黨徒A讓-10-10-10+10飛車黨黨徒A撞+10-10OOOO最后,用相對優(yōu)勢策略的劃線法求解飛車黨黨徒B讓飛車黨黨徒B撞飛車黨黨徒A讓-10-10飛車黨黨徒A撞叵0日0OOOO博弈解的第一組值為(10,+10)(雙值),對應(yīng)博弈的解為(讓,撞);博弈解的第二組值為什10,10)(雙值),對應(yīng)博弈的解為(撞讓),它們都是Nash均衡,即此博弈有2個解或兩個均衡點(diǎn)。例2-3雙寡頭壟斷博弈(Cournot模型(1838年)首先依據(jù)情景描述寫出博弈的基本式;再列出博弈雙方的收益矩微矩陣)企業(yè)乙-定身價企業(yè)乙-定低價企業(yè)甲-定身價

10、1000,1000500,1500企業(yè)甲-定低價1500,500700,700最后,用相對優(yōu)勢策略的劃線法求解企業(yè)乙-定身價企業(yè)乙-定低價企業(yè)甲-定身價1000,1000500,1500企業(yè)甲-定低價|1500|,500畫回博弈的值為(700,700)(雙值),對應(yīng)博弈的解為(低價,低價);它是Nash均衡。思考它與哪一個博弈是一致的?例2-4(雙人抬物)博弈G(N,S,U)的基本式為局中人的集合N1,2;策略空間SGS2出力,不出力X出力,不出力收益函數(shù):U1 (出力,出力)=v c 0,Ui (出力,不出力)=v 2c 0,U1 (不出力,出力)=v 0,U1 (不出力,不出力)=0。容易

11、看出局中人1的偏好序?yàn)椋海ú怀隽Γ隽Γゝ (出力,出力)f容易看出局中人2的偏好序?yàn)椋海ǔ隽Γ怀隽Γゝ (出力,出力)f 顯然,兩局中人均有U1 (不出力,O) U1 (出力,。),U2 (出力,出力)=v c 0,U2 (出力,不出力)k 2c 0,U2 (出力,不出力)k 0, U2 (不出力,不出力)=0。(不出力,不出力)f (出力,不出力);(不出力,不出力)f (不出力,出力);U2 (不出力,O) U2 (出力,O);即,選擇“不出力”是兩局中人的嚴(yán)格優(yōu)策略,因此,惟一的Nash均衡為(不出力,不出力)博弈的值為(0,0)我們還可以用劃線法解決:局中人2出力局中人2不出力局中

12、人1出力vc,vcv2c,v局中人1不出力v,v2c0,0討論:.例25(雙人抬物)和哪一個博弈一致?.關(guān)于道德風(fēng)險;.如何從技術(shù)上改變這種情況?例26(雙虎爭獵物博弈G(N,S,U)的基本式為局中人的集合NA,B;策略空間SSASB堅持,放棄X堅持,放棄;收益函數(shù):Ua(堅持,堅持)=Ub(堅持,堅持)=c0,UA(堅持,放棄)=UB(放棄,堅持)=f0,UA(放棄,堅持)=UB(堅持,放棄)=0,UA(放棄,放棄)=UB(放棄,放棄)=0。容易看出兩老虎沒有嚴(yán)格優(yōu)策略,我們還是用劃線法解決:老虎B堅持老虎B放弁老虎A堅持c,c國,0老虎A放棄耳國0,0因此,Nash均衡為(堅持,放棄)和(

13、放棄,堅持),博弈的值分別為(f,0)和(0,f)。討論:.例210和哪一個博弈一致?.現(xiàn)實(shí)中有何意義?例27(情侶分為博弈G(N,S,U)的基本式為局中人的集合N甲(男),乙(女);策略空間S08古典首樂,流行首樂X古典首樂,收益函數(shù)用矩陣表示為:流行音樂乙-古典音樂乙一流行音樂甲一古典音樂a,b0,0甲一流行音樂0,0b,a,用劃線法解決:乙-古典音樂乙一流行音樂甲一古典音樂,M0,0甲一流行音樂0,0因此,Nash均衡為(古典音樂,古典音樂)和(流行音樂,流彳二分別為(a,b)和(b,a),(0ba)。討論:.例27和哪個博弈T?.協(xié)調(diào)型博弈在現(xiàn)實(shí)中有何意義?(總收益高)亍音樂)博弈的值

14、例28(公共產(chǎn)品的提供一一集資建橋博弈G(N,S,U)的基本式為局中人的集合N1,2,L,n;策略空間SS2LSn出資,不出資乂乂出資,不出資收益函數(shù)根據(jù)參加出資的人數(shù)有不同的情況:1)出資人數(shù)kn(人人出資才能建橋)Ui5LUn(出資,出資)kt0,出資居民i的收益Ui(至少有一個人不出資)=t0,不出資居民j的收益Uj(至少有一個人不出資)=0。我們簡化問題為兩個局中人的情況:局中人j出資局中人j不出資局中人i出資vt,vtt,0局中人i不出資0,t0,0因此,Nash均衡為(出資,出資)和(不出資,不出資)2)出資人數(shù)kn如果恰有k個居民出資而nk個居民不出資。有2種情況,討論如下:如果

15、已經(jīng)有k1個居民出資而nk個居民不出資,局中人將選擇出資:k1個局中人出資,nk個局中人不出資局中人i出資vt0局中人不出資0如果已經(jīng)有k個居民出資而nk1個居民不出資k個局中人出資,nk1個局中人不出資局中人i出資vt0局中人i不出資vNash均衡出現(xiàn)了:(k個居民出資,nk個居民不出資);根據(jù)組合的知識,這樣的均衡共函:種。如果已經(jīng)有0mk1個居民出資,那么局中人的選擇是不出資,因?yàn)?mk1個局中人出資局中人i出資t局中人i不出資0由于每一個局中人面對m(0mk1)個局中人出資時,必選擇不出資,因此,Nash均衡為(不出資,不出資)對m(mk)個居民出資,局中人的選擇是不出資,因?yàn)閙(mk

16、)個局中人出資局中人i出資vt局中人i不出資vNash均衡出現(xiàn)了:(k個居民出資,nk個居民不出資);綜上所述,這樣的均衡共有2+C:種。討論:1.通過例2-7,談?wù)劶Y建設(shè)和公共產(chǎn)品如何攤派和收取集資款?例2-8(經(jīng)濟(jì)學(xué)著名例子:公共地悲居)n個牧民共同擁有一片草地,每年,他們在這片草地上放牧養(yǎng)羊。設(shè)牧民i放牧的羊?yàn)閝i(i0,1,L,n,L)只,則全體牧民養(yǎng)羊G&q2Lq”,照看一只羊的平均成本為c,當(dāng)草地上有G只羊時,牧民養(yǎng)每只羊的價值為V(G)(V(G)0)。假設(shè)使草地上草的生長和羊群達(dá)到平衡的羊的只數(shù)嵬max,如果羊的數(shù)量超過了Gmax,必將使草地的生態(tài)受到損害,從而使整個羊群不能吃

17、飽,使羊的值v(G)下降(此地將自變量G看作連續(xù)變量),這就可以用數(shù)學(xué)語言來表達(dá)為(1) TOC o 1-5 h z HYPERLINK l bookmark52 o Current Document dvcd2vc0,20dGdG2公共地悲劇博弈W(N,S,U)的基本式為局中人的集合N1,2,L,n;策略空間SS2LSn0,)Xx0,1 i n.收益函數(shù):Uj(q,L,qL,qjv(G)qicq博弈問題:每一個牧民如何確定自己羊群的數(shù)地(i1,L ,n),以獲得自己的最大收益(僅僅考慮個人利益的最大化)?根據(jù)微積分的知識,這需要去求n元函數(shù)Ui(q1,L,q,L,qn)的極值而方法是先求n個

18、變量的偏導(dǎo)數(shù):Uiqiv(G) qidv dGdG dqidvc v(G) q c (i 1,L , n). dG再令(2)dvV(G) %Gc (i 1,L , n),當(dāng)v(G)為已知函數(shù)時,由以上n個方程,可以解出n個數(shù)q1,L,qn,則得到Nash均衡局勢(q*,L,q;)q*GqLqn。我們以n3,v(G)kGkQq?q3)為例,有3個方程構(gòu)成的方程組:2qiq2q3c/kqi2q2q3c/kqiq22q3c/k解出q*q2q34:為簡單起見,我們進(jìn)一步假設(shè)誨個牧民的基本情況相同,因此,我們不妨設(shè)*,qiqi(iin),則n個收益函數(shù)成為Ui(qJ,qjq)v(nq)qcq1in,于是

19、據(jù)(2)式,v(G)qiv(G)c1in,1_*I_*_*v(G)Gv(G)c.n那么,為什么稱作公共地悲劇呢?這n個牧民的總收益函數(shù)是UnUinqiv(G)ncqGv(G)cG.這n個牧民在Nash均衡q下的總收出是U*nUi*nqi*v(G*)ncq*G*v(G*)cG*.-.一一一一一一一-一一、一一-一.一士.如果這塊草地是由政府管理的,專家認(rèn)定最佳的放牧量FGmax,即F是使得收益最優(yōu)的值,即FmaxU,或?qū)σ磺械目偸辙鞦根據(jù)極值的必要條件應(yīng)當(dāng)出|*0(邊際收益=邊際成本)從(3)dGGF式推得dU八八v(G)Gv(G)c,dG小、dU代入L/0有dGGF令我們首先有*v(F)Fv(

20、F)c.H(G)v(G)Gv(G),H(G)2v(G)Gv(G)0.所以函數(shù)H(G)是遞減的,其次H(G*)H(F*)v(G*)G*v(G*)v(F*)_*_*_*v(G)Gv(G)c_*_*_*_*v(G)Gv(G)v(G)n17Gv(G)0.n*Fv(F)1*Gv(G)n我們得到_*H(G)H(F),即*GF.牧民在均衡處的羊多于專家設(shè)定的羊的最佳數(shù)量,又由節(jié)是使得收益函數(shù)取得最大值的點(diǎn),有:*U*UF*.GF公共地悲劇指出如果每個牧民僅僅考慮個人利益的最大化那么,在Nash均衡(q*,L,q;)q*處,羊群的數(shù)量G*大,但不如羊群為F*的收益,而且,草地將退化,所以生產(chǎn)應(yīng)當(dāng)是有組織的公共

21、資源應(yīng)當(dāng)科學(xué)地開發(fā)怎么組織學(xué)問很深!公共地悲卿P.87)-公共衛(wèi)生一一國家資源一一例2-9(密封式二級價格拍為密封式二級價格拍賣一一規(guī)則介紹分析局中人的集合:N1,2,L,n;策略集A(0,)(i1,2,L,n),策略空間:AaA2la;局勢:sA|s(b1,b2,L,bn)是一個無限集。收益函數(shù):Ui(s)visbi1,2,L,n。表示為局中人12oooiooon標(biāo)的物價值v1v2oooviooovn競拍報價Ub2ooobiooobn收益v1bj0v2bj0ooovibj0ooovnbj0為討論方便,除第個局中人的報價bi外,把其余的n1個局中人報價的最大值記作我們討論如下:(i)hvibjoUi vbj00. TOC o 1-5 h z bivibjobivibivibjo(ii)hvi與biviUivibjo0bibjovi.vibjobiUivi可。o(iii)vibibjovibiUivib

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論