博弈論-第四章教材課件_第1頁
博弈論-第四章教材課件_第2頁
博弈論-第四章教材課件_第3頁
博弈論-第四章教材課件_第4頁
博弈論-第四章教材課件_第5頁
已閱讀5頁,還剩75頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章完全信息動態(tài)博弈更為現(xiàn)實的考慮是將靜態(tài)博弈動態(tài)化,動態(tài)化后,納什均衡這一概念是否仍然有效呢?答案是部分有效的。如果不存在動態(tài)不一致,那么納什均衡在完全信息動態(tài)博弈中仍不失為一個有用的均衡概念,但納什均衡概念本身并不能保證不出現(xiàn)動態(tài)不一致,為了克服這一點在納什均衡的基礎(chǔ)上生產(chǎn)了所謂子博弈完美均衡。而這一章,我們將圍繞這子博弈完美均衡來展開。

第一節(jié)完美信息與完全但不完美信息完全信息動態(tài)博弈可以分為兩類,即完美信息與完全但不完美信息。所謂的完美信息博弈,是指博弈中的后行動者始終能夠觀察到前行動者的行動,因而動態(tài)博弈中不存在參與者同時行動這樣的情況。而完全但不完美信息博弈,則指動態(tài)博弈中,至少存在兩個參與者同時行動的情況,因而“后行動者”無法觀察到“前行動者”的行動。我們不妨用兩個例子來加以說明。

例4.1動態(tài)囚徒困境招供招供沉默囚徒1囚徒2囚徒2招供沉默招供沉默圖4-1動態(tài)囚徒困境

例4.2取消管制維持維持取消進,進進,退退,進退,退1和2圖4-2取消管制政府與圖4-2完全等價的表示方法見圖4-3。維持維持取消進退進退1圖4-3取消管制政府2退進定義4.1完美信息動態(tài)博弈就是不存在同時行動的完全信息動態(tài)博弈。顯然,運用策略式來描述動態(tài)博弈會非常不便,特別是當信息不完全時更是如此,為了更簡便地描述動態(tài)博弈,我們將引入一種新的博弈表達式——擴展式。第二節(jié)動態(tài)博弈的擴展式我們把博弈中所有從開始到結(jié)束的行動序列稱為全歷史(Terminalhistory),而用參與者函數(shù)來表示在每一個全歷史上,在博弈進行到某個階段時誰來行動。因而要完整地描述一個動態(tài)博弈,必須具備四個要素:(1)參與者集合;(2)全歷史集合;(3)參與者函數(shù);(4)偏好。如果我們把全歷史表示成一個行動序列(a1,a2,…,aK)(K為自然數(shù),當時,就表示無窮動態(tài)博弈),那么(a1,a2,…,am),其中,就稱為全歷史(a1,a2,…,aK)的子歷史(Subhistory)。當m<K時,(a1,a2,…,am)就是全歷史(a1,a2,…,aK)的真子歷史(Propersubhistory)。顯然,在博弈開始前的歷史是一個空歷史(Emptyhistory),因而空歷史是所有全歷史的真子歷史。今后我們將用來表示空歷史,用h來表示子歷史,而用H來表示全歷史的集合,而P則表示參與者函數(shù)。定義4.2完全信息動態(tài)博弈的擴展式為,其中N為參與者集合,H為博弈的全歷史集合,即H={(a1,a2,…,aK)},其中K為博弈從開始到結(jié)束依次發(fā)生的行動次數(shù),行動序列中的每一個a都為向量。P為參與者函數(shù),即P(h)={i:i∈N},。u為收益函數(shù),表示博弈參與者的偏好。與博弈的基本式相比,擴展式?jīng)]有直接給出博弈參與者的行動集合,原因在于擴展式已經(jīng)隱含地定義了各參與者在行動時有些什么樣的行動可供選擇,根據(jù)全歷史和參與者函數(shù),能很容易地得到各參與者的行動集合。在歷史h之后,參與者P(h)所有可能的行動集合定義為AP(h)(h)={aP(h):(h,a)是一個子歷史,aP(h)是行動向量a的第P(h)個元素}例如,在取消管制博弈中,根據(jù)全歷史集合H和參與者函數(shù)P()=政府,P(取消)={1,2},可知A()={維持,取消},即政府有兩個行動——維持和取消;A1(取消)={進,退}和A2(取消)={進,退},即兩個企業(yè)各有兩個行動——進和退。需要注意的是,在完美信息下,擴展式有三個地方與完全但不完美信息不同。首先,歷史h由行動向量序列變?yōu)樾袆有蛄?,例如,在取消管制中,歷史(取消,[進,進])是一個向量序列,因為企業(yè)1和企業(yè)2是同時行動的,如果改成企業(yè)2后行動,那么就變成(取消,進,進),也就是由一個向量序列便成了單值序列,意思也完全不一樣了。其次,參與者函數(shù)P(h)都是單點映射,對應(yīng)著唯一一位參與者。最后,就是行動集合A可以省略下標,因為A(h)={a:(h,a)是一個子歷史}?,F(xiàn)在我們將例4.1和例4.2的擴展式表達如下:例4.1動態(tài)囚徒困境的擴展式為,其中(1)參與者集合:囚徒1和囚徒2,N={1,2}。(2)全歷史集合:招供為C,沉默為S,H={(C,C),(C,S),(S,C),(S,S)}。(3)參與者函數(shù):P()=1,P(C)=P(S)=2。(4)偏好:對于囚徒1而言,最好的歷史是(C,S),其次為(C,C),然后為(S,S),最倒霉的歷史為(S,C)。對囚徒2而言,最好的歷史是(S,C),其次為(C,C),第三為(S,S),最差為(C,S)。例4.2取消管制的擴展式為,其中(1)參與者集合:政府,企業(yè)1和企業(yè)2,N={1,2,3}。(2)全歷史集合:維持為C,取消為D,進入為E,退出為Q,那么全歷史集合H={(C),(D,[E,E]),(D,[E,Q]),(D,[Q,E]),(D,[Q,Q])。(3)參與者函數(shù):P()=1,P(D)={2,3}。(4)偏好:對于政府而言,根據(jù)五個歷史對應(yīng)的社會福利進行排序,對于企業(yè)1和企業(yè)2而言,則為五個歷史對應(yīng)的利潤排序。例4.3進入博弈在一個壟斷行業(yè),已經(jīng)存在一個壟斷企業(yè),我們將其稱為在位者,現(xiàn)在有一個新的企業(yè)決定是否進入該行業(yè),我們將其稱為挑戰(zhàn)者。挑戰(zhàn)者首先行動,決定進入(E)或是退出(Q),如果挑戰(zhàn)者進入,那么在位者將決定是與挑戰(zhàn)者和平共處(A)還是戰(zhàn)斗(F)。其博弈的擴展式如下:(1)參與者集合:挑戰(zhàn)者和在位者,N={1,2}。(2)全歷史集合:H={(Q),(E,A),(E,F)}。(3)參與者函數(shù):P()=1,P(E)=2。(4)偏好:如果挑戰(zhàn)者退出,那么挑戰(zhàn)者得到0的利潤,而在位者得到3的利潤;如果挑戰(zhàn)者進入,那么如在位者選擇戰(zhàn)斗,有可能兩敗俱傷,挑戰(zhàn)者的利潤為-1,在位者的利潤為0,如果在位者選擇和平共處,那么挑戰(zhàn)者得2的利潤,而在位者得1的利潤。因而,挑戰(zhàn)者偏好歷史(E,A)>(Q)>(E,F),而在位者偏好歷史(Q)>(E,A)>(E,F)。其擴展式也可用博弈樹來加以描述,如圖4-4所示。EEQ12(0,3)AF(-1,0)圖4-4進入博弈(2,1)例4.4蜈蚣博弈該博弈有兩位參與者。當參與者1行動時,他將決定是結(jié)束博弈還是繼續(xù),如果結(jié)束博弈,那么參與者1得2,參與者2得0;如果繼續(xù)博弈,那么輪到參與者2決定是結(jié)束博弈還是繼續(xù),如果結(jié)束博弈,那么參與者1得3,參與者2得1;如果繼續(xù)博弈,那么輪到參與者1行動,如果他選擇左(L),那么參與者1得1,參與者2得2,如果他選擇右(R),那么兩人都得0。該博弈的擴展式其博弈的擴展式如下:(1)參與者集合:N={1,2}。(2)全歷史集合:繼續(xù)為C,結(jié)束為D,H={(D),(C,D),(C,C,L),(C,C,R)}。(3)參與者函數(shù):P()=1,P(C)=2,P(C,C)=1。(4)偏好:如果全歷史為(D),那么參與者1得2,而參與者2得0;如果全歷史為(C,D),那么參與者1得3,參與者2得1;如果全歷史為(C,C,L),那么參與者1得1,參與者2得2;如果全歷史為(C,C,R),那么兩人都得0。參與者1最偏好歷史(C,D),而參與者2最偏好歷史(C,C,L)。該擴展式如圖4-5所示。CDCD12(2,0)CD(3,1)圖4-5蜈蚣博弈(1,2)(0,0)1LR

第三節(jié)策略和結(jié)果策略是“萬全之策”,而不再是單純的行動,如何理解這句話呢?1、動態(tài)囚徒困境中囚徒2的策略表4-1囚徒2的四個策略假如囚徒1選擇招供假如囚徒1選擇沉默策略1選擇招供選擇招供策略2選擇招供選擇沉默策略3選擇沉默選擇招供策略4選擇沉默選擇沉默2、蜈蚣博弈中參與者1的策略關(guān)鍵是理解DL,DR也是策略。所以說,策略是一個“萬全之策”。定義4.3對于博弈,參與者P(h)的一個策略sP(h)(h)就是一個函數(shù),它將每一個可能的歷史h映射成行動空間AP(h)(h)中的一個行動ap(h)。上述策略的定義實際上就是指當歷史進行到某個階段時,當輪到參與者i行動時,規(guī)定了他如何行動。例如,在蜈蚣博弈中,對于參與者1而言,一個策略就是當歷史為空歷史時,規(guī)定了參與者1如何行動,當歷史為(C,C)時,規(guī)定了參與者1又如何行動,因而DL和DR就是參與者1的策略,至于歷史(C,C)會不會發(fā)生那是另外一個問題,策略所要求的就是一旦出現(xiàn)了某個歷史我應(yīng)該如何做,而不能出現(xiàn)不知所措的情況。通過上面的說明我們看到,有什么樣的策略組合就會有什么樣的歷史,但歷史并不等于策略。為此,我們引入結(jié)果函數(shù),即對于任意,存在某個,使得O(s)=h。參與者的收益函數(shù)u就是定義在結(jié)果上的函數(shù)。例如,在蜈蚣博弈中,可知參與者1有四個策略CL、CR、DL和DR,參與者2有兩個策略C和D,因而策略組合有8個,其相應(yīng)的結(jié)果函數(shù)為O(CL,C)=(CCL)u1(O(CL,C))=1和u2(O(CL,C))=2;O(CR,C)=(CCR)u1(O(CR,C))=0和u2(O(CR,C))=0;O(Cx,D)=(CD)u1(O(Cx,D))=3和u2(O(Cx,D))=1;O(Dx,x)=(D)u1(O(Dx,x))=2和u2(O(Dx,x))=0。其中x代表任意行動。上面的結(jié)果函數(shù)給了我們兩點啟示:一是,要得到全歷史實際上只需行動計劃就可以了,不一定需要去考察所謂的“完全之策”,例如,O(D,x)=D=O(Dx,x)是一樣的,這樣做的好處是能夠簡化分析,但在觀念上,我們必須牢記策略是“萬全之策”。二是,圖4-5的蜈蚣博弈實際上與圖4-6中的博弈完全等價,這就更為直觀地指出了策略DL和DR的性質(zhì)。實際上,湯普森(Thompson,1952)論證了對于任意兩個等價的擴展式博弈,至少存在4種轉(zhuǎn)換方式,通過轉(zhuǎn)換,可以把復(fù)雜的擴展式博弈變成最簡單的形式去分析。CDCD12(2,0)CD(3,1)圖4-6與蜈蚣博弈等價的博弈(1,2)(0,0)1LRDLRC(2,0)(2,0)第四節(jié)納什均衡與子博弈完美均衡一、納什均衡納什均衡概念的核心就在于,每一個參與者的策略都是給定其他參與者策略下的最優(yōu)反應(yīng),并且對任意參與者成立。即便博弈是動態(tài)的,這一點也不會改變。那么,將靜態(tài)博弈中的納什均衡概念運用到動態(tài)博弈中應(yīng)該是一個不錯的思路,盡管這樣做可能存在問題。定義4.4擴展式博弈的納什均衡是一個策略組合,使得對任一參與者,,不等式成立。由于有什么樣的策略就會有什么樣的結(jié)果,因而收益函數(shù)又可直接看作是策略的函數(shù),這樣動態(tài)博弈就有了與之等價的策略式博弈。定義4.5G={N,S,u}稱為完全信息動態(tài)博弈的策略式(或基本式),其中S就是動態(tài)博弈定義的策略空間,并且u(s)=u(O(s))。112(2,1)(4,2)(5,2)(3,3)LRc1d1c2d2圖4-7完美動態(tài)博弈圖4-7所示的完美動態(tài)博弈的策略式是什么呢?其策略式G={N,S,u}如下:(1)參與者集合:N={1,2};(2)策略集合:S={{L,R},{c1c2,c1d2,d1c2,d1d(3)偏好:u1(L,c1c2)=2,u2(L,c1c參與者2c1cc1d2d1cd1d2參與者1L2,12,14,24,2R5,23,35,23,3圖4-8動態(tài)博弈的策略式根據(jù)納什均衡的定義,易知該動態(tài)博弈存在兩個納什均衡:(R,c1d2)和(L,d1d2)。對于均衡(R,c1d2),只要我們稍加考察,就會發(fā)現(xiàn)這個納什均衡含有不合理的因素,在現(xiàn)實中根本不會出現(xiàn),原因就在于參與者2在歷史(L)“威脅”出c1是不可置信的,因為出d1要比出c1優(yōu)(2>1)。之所以出現(xiàn)這種情況,是由于當參與者1的策略為R時,歷史進行到L的可能性為零,因此參與者2在歷史L下無論采取什么行動都不會對他的最終收益造成影響。這意味著,納什均衡這個概念對參與者2在不可能發(fā)生的歷史L下如何選擇并未做出規(guī)定,參與者2就有可能亂選(像一個非理性的人一樣),而納什均衡本身假設(shè)參與者是理性的,這就造成參與者2的策略是動態(tài)不一致的(Dynamicinconsistent)。一個動態(tài)不一致的策略肯定不會是一個最優(yōu)的策略。我們也可以這樣來理解參與者2的行動,參與者2之所以威脅當參與者1出L時,他要選擇c1,目的在于通過威脅使參與者1選擇有利于參與者2的R,因為在參與者1選擇R下,參與者2通過選擇d2,能得到3的報酬,明顯好于當參與者1選L,參與者2選d1時的收益2。但我們要問的是,如果參與者1不顧參與者2的威脅而選擇了L,參與者2可能會出c1嗎?在參與者2為理性是公共信息的條件下,參與者2選擇c1的報酬為1,而選擇d1的報酬為2。由于d1要優(yōu)于c1,因而參與者1沒有理由相信參與者2會實施他的威脅,也就是說,參與者2的策略c1d2是一個不可置信的威脅。如果威脅成真,c1d2就是一個動態(tài)不一致的策略,因為參與者2事前是理性的,但在博弈進行到(L)時,他卻成了一個非理性的人(選擇了c1,而不是d1)。出現(xiàn)上述問題的原因,在于一個納什均衡只要求在博弈的總體上,參與者的策略須為均衡,而對博弈進行到某個部分時是否仍為均衡沒有要求,這就可能導(dǎo)致總體和局部的沖突,產(chǎn)生不合理的結(jié)果。要消除動態(tài)博弈中的不可置信威脅,就需一個比納什均衡更強的均衡概念。它不僅在整個博弈中是均衡的,而且在局部也是均衡的;不但在現(xiàn)在是均衡的,在將來也應(yīng)是均衡的。只有滿足這個要求,博弈的參與者才能實現(xiàn)策略的動態(tài)一致性,這就導(dǎo)致了子博弈完美均衡概念的產(chǎn)生。二、子博弈完美均衡最早由經(jīng)濟學(xué)家塞爾騰(Selten)在1965年提出。定義4.6完全信息動態(tài)博弈的一個子博弈就是一個完整的動態(tài)博弈,其具有如下特征:(1)參與者集合;(2)給定真子歷史h,對于任意行動序列h*,,而Hs={h*};(3)Ps=P和us=u。例,如圖4-9。DD1CEF21圖4-9存在著5個子博弈圖4-9所示博弈存在5個子博弈:Γ(DE),Γ(DF),Γ(D),Γ(C)和原博弈Γ(N,H,P,u)。

圖4-10則給出了不是子博弈的情況。在圖4-10中,虛線圍起來的部分不是子博弈因為它不構(gòu)成一個完整的擴展式博弈。DD1C21圖4-10不是子博弈的例子不是子博弈不是子博弈定義4.7在擴展式博弈中,如果一個策略組合s*在所有該博弈的子博弈中都是納什均衡,那么我們就稱策略組合s*為子博弈完美均衡,即對任意參與者和任意si,成立。其中h為任意真子歷史,Oh(·)為子博弈的結(jié)果函數(shù)。根據(jù)定義4.7,可知子博弈完美均衡一定是納什均衡,但反之不成立。那么對于一個完全信息動態(tài)博弈我們?nèi)绾稳デ蠼馑淖硬┺耐昝谰饽兀恳粋€一般的方法就是所謂的逆推法(BackwardInduction)。定義4.8所謂逆推法是指如下程序:第一步,從擴展式博弈的終點開始,以找到該博弈的每一個最后子博弈(它不再包含任何其他更小的子博弈),然后求出納什均衡,并計算出相應(yīng)的收益。第二步,將每一個最后子博弈的起點變成結(jié)束點,將計算出的每一個最后子博弈在納什均衡下的收益寫在其下方,我們就獲得了一個新的擴展式博弈(或新的博弈樹),稱為壓縮的擴展式博弈。這樣經(jīng)過一次壓縮,就剔除了最后子博弈。第三步,重復(fù)第一步和第二步,并重新得到一個壓縮式博弈和相應(yīng)的納什均衡。這個過程一直進行到最后只剩下唯一一個子博弈為止,這時在逆推過程中找到的一系列子博弈的納什均衡組合就是該擴展式博弈的一個完美均衡。第四步,如果在逆推過程中沒有遇到多重均衡,那么這個策略組合就是唯一的完美均衡;如果遇到了多重均衡,就需要對子博弈中每一個可能的均衡重復(fù)以上步驟,從而得出所有的完美均衡。比如,一個擴展式博弈有兩個子博弈分別存在2個和3個納什均衡,其他子博弈只有1個納什均衡,那么該博弈就有2×3=6個完美均衡。例,在圖4-11所示的小蜈蚣博弈中,如果從正面求解子博弈完美均衡顯然非常困難,而用逆推法卻非常簡單。逆推到最后一個階段的結(jié)果如圖4-12。112121(1,0)(-1,3)(2,1)(0,4)(3,2)DCCCCCDDDD圖4-12小蜈蚣博弈2(1,5)DC(4,3)11(1,0)(-1,3)DC圖4-13小蜈蚣博弈的最后階段定理4.1存在性定理只要擴展式博弈是有限的,即參與者有限,行動空間有限,博弈的階段有限(不是無窮進行下去),那么擴展式博弈Γ至少存在一個子博弈完美均衡。定理4.2等價性定理{s*}為有限擴展式博弈的所有子博弈完美均衡的集合,{s#}為該擴展式博弈運用逆推法找到的所有子博弈完美均衡的集合,那么{s*}={s#},即子博弈完美均衡與逆推法是完全等價的。

例4.5一個簡單博弈的子博弈完美均衡112(4,0)(1,1)(2,1)(1,3)CEFGKL圖4-14一個簡單博弈(1,0)(2,2)HJ22D運用逆推法,可得子博弈(C)的納什均衡為F和G,子博弈(D)的納什均衡為H和J,子博弈(E)的納什均衡為L,由此可得參與者2的4個均衡策略:(FHL),(FJL),(GHL)和(GJL)?,F(xiàn)在,回到原博弈,尋找原博弈的納什均衡。分四種情況:(1)給定參與者2的策略(FHL),參與者1的最優(yōu)策略為C,因而(C,FHL)為完美均衡。(2)給定參與者2的策略(FJL),參與者1的最優(yōu)策略為C,因而(C,F(xiàn)JL)為完美均衡。(3)給定參與者2的策略(GHL),參與者1的最優(yōu)策略有三個:C,D和E。因而,完美均衡也有三個:(C,GHL),(D,GHL)和(E,GHL)。(4)給定參與者2的策略(GJL),參與者1的最優(yōu)策略為:D。因而,完美均衡為:(D,GJL)。綜上所述,即該博弈存在6個完美均衡。從上面這個例子,我們可以得出這樣一個判斷,即如果每一個全歷史的收益都不相等,那么擴展式博弈一定存在唯一的子博弈完美均衡。命題4.1在擴展式博弈中,如果每一個全歷史對應(yīng)的參與者的收益都不相等,那么存在唯一的子博弈完美均衡。逆推法雖然在求解完美均衡上非常有效,但也有缺陷,當博弈為無窮動態(tài)博弈時,我們將無法運用逆推法。第五節(jié)經(jīng)典舉例一、價格領(lǐng)先制該博弈的擴展式如下:(1)參與者集合:N={L,F},L代表領(lǐng)先廠商,F(xiàn)代表跟隨廠商;(2)全歷史集合:H={p,qL},p≥0;qL≥0;(3)參與者函數(shù):P()=1,P(p)=2;(4)偏好:壟斷企業(yè)的偏好可用各自的利潤函數(shù)表示。我們運用逆推法來解這個動態(tài)博弈的完美均衡。首先計算跟隨廠商在給定p*下的最優(yōu)產(chǎn)量qF(p),即一階條件為(4-J-1)即價格必須等于邊際成本。由于邊際成本函數(shù)為一一對應(yīng)的連續(xù)函數(shù),所以存在反函數(shù),即qF(p*)=MCF-1(p*),MCF為跟隨廠商的邊際成本。由于領(lǐng)先廠商也能夠像跟隨廠商一樣解出跟隨廠商的最優(yōu)反應(yīng),領(lǐng)先廠商就可以預(yù)測到他如選擇p*,跟隨廠商將根據(jù)MCF-1(p*)來選擇產(chǎn)量qF。因而,在博弈的第一階段,領(lǐng)先廠商的問題就可表述為解一階條件得(4-J-2)由于(需求定理),(供給定理),所以上式一定大于0。根據(jù)導(dǎo)數(shù)公式,上式又等于(4-J-3)(4-J-3)式實際上是一個隱函數(shù),要得出明確的解有一定難度,不過根據(jù)假設(shè),仍能得出一些認識:當qF越接近邊際成本的最低點(回憶邊際成本曲線為U型,停止營業(yè)點為可變平均成本的最低點,它最接近邊際成本最低點),,從而,即領(lǐng)導(dǎo)廠商的定價如果越接近跟隨廠商的停止營業(yè)點,跟隨廠商的產(chǎn)量就越小,從而領(lǐng)導(dǎo)廠商的市場份額就越大,當領(lǐng)導(dǎo)廠商的定價等于跟隨廠商的停止營業(yè)點(因為CF(q)>CL(q),所以存在這種可能),那么跟隨廠商的產(chǎn)量為零,而領(lǐng)導(dǎo)廠商占有整個市場,所以它的定價趨于邊際成本,即。因而[(4-J-2),(4-J-1)]就構(gòu)成了價格領(lǐng)先制的完美均衡。例如,假設(shè)CF(qF)=q2/2,CL(qL)=cqL,Q(p)=a–bp,可知,,,,因而(4-J-3)式等于已知,所以上式又等于因而(,qF=p)就是該博弈的子博弈完美均衡。如果我們把上述模型稍加改造——領(lǐng)先廠商不是選擇價格而是選擇產(chǎn)量,我們會得出一個有趣的現(xiàn)象,即領(lǐng)先廠商占有更多的信息反而帶來了不利,而這種情況在靜態(tài)博弈中不會出現(xiàn)。二、收買選票一個擁有k個議員的議會對兩個議案B1和B2進行投票表決,議會議員不能棄權(quán),只能投一次票,要么支持B1,要么支持B2,獲得過半票數(shù)的議案將獲得通過。假設(shè)存在兩個利益集團,如果B1獲得通過,那么將給利益集團1和利益集團2分別帶來v1和0的收益;如果B2獲得通過,那么將給利益集團1和利益集團2分別帶來0和v2的收益。利益集團可以向議會議員購買選票,議員則根據(jù)誰給的錢多投誰的票,如果兩個利益集團給的錢一樣,那么將把選票投給利益集團2。為了讓有利于自己的議案通過,利益集團1首先行動,即向議員收買選票,為x=(x1,…,xk),隨后利益集團2行動,為y=(y1,…,yk),其中x,y都是非負實數(shù)向量,并且x1<x2<…<xk。這里我們分析k=2n+1的情況(n為自然數(shù))。該博弈的擴展式:(1)參與者集合:N={1,2};(2)全歷史集合:H={x,y};(3)參與者函數(shù):P()=1,P(x)=2;(4)偏好:利益集團1的收益函數(shù)為u1=v1–x1–…–xk(當B1通過)或u1=–x1–…–xk(當B2通過),利益集團2的收益函數(shù)同理。那么該博弈的子博弈完美均衡是什么呢?運用逆推法。首先,考慮利益集團2的納什均衡策略。給定利益集團1的行動x,那么利益集團2在選擇最優(yōu)策略時應(yīng)當考慮三種情況:一種是有利可圖,這時第2利益集團應(yīng)收買前(k+1)/2=m個議員投B2的票(多了要花更多的錢,少了不過半),我們把這m個議員從利益集團1所得貨幣之和定義為mx,要有利可圖就意味著v2>mx,這時利益集團2的最優(yōu)行動為y=(x1,…,xm,0,…,0),即對前m個議員給與利益集團1一樣的錢,其他則不給。第二種是無利可圖,這時v2<mx,因而y=(0,…,0),即不給任何錢。第三種是v2=mx,這時利益集團2選y=(x1,…,xm,0,…,0)和y=(0,…,0)收益都一樣,因而無所謂。給定利益集團2的最優(yōu)策略,那么利益集團1又應(yīng)當如何選擇呢?顯然,如果利益集團1對于前m個議員給出的錢mx<v2,那么B1肯定不能通過,所以利益集團1最優(yōu)的策略是x=0(表示向量的每一個元素都等于0)。如果mx>v2,那么B1肯定通過,所以利益集團1的最優(yōu)策略就是使得給每一個議員的錢xi都等于mx/m(實際上,利益集團1給每一個議員一樣的錢比不一樣要嚴格優(yōu))。如果mx=v2,那么B1在利益集團2選擇y=(x1,…,xm,0,…,0)時不通過,在利益集團2選擇y=0時通過。對于利益集團1而言,是否有利可圖關(guān)鍵就在于v1的值。由于利益集團1給每一個議員的錢比不一樣要嚴格優(yōu),所以當v1>kmx/m,并且mx>v2,也就是v1>kv2/m時,那么利益集團1的最優(yōu)決策為x=mx/m,由于貨幣是連續(xù)可分的,所以mx=v2。如果v1<kv2/m,硬要讓B1通過,只會使得v1–kmx/m<0,其中mx>v2,所以不如選擇x=0。如果v1=kv2/m,那么情況就有點復(fù)雜。要讓B1通過除非mx=v2,這時x=0與x=v2/m對于利益集團1都一樣。如果x=0,那么y=0顯然是子博弈完美均衡。如果x=v2/m,要么y=0,要么y=(v2/m,…,v2/m,0,…,0)。如果是y=(v2/m,…,v2/m,0,…,0),那么將使B2通過,所以對于利益集團1而言,它有動機改變x=v2/m,例如,給每一個議員的錢增加一個Δ0,將使B1通過,付出的代價為v1–x1–…–xk–kΔ,顯然好于–x1–…–xk。實際上,無論是那種情況,[x=v2/m,y=(v2/m,…,v2/m,0,…,0)]都不可能是子博弈完美均衡。綜上所述,收買選票的子博弈完美均衡為:如v1>2kv2/(k+1),那么利益集團1選擇x=2v2/(k+1),利益集團2選擇y=0;如v1<2kv2/(k+1),那么利益集團1選擇x=0,利益集團2選擇y=0;如v1=2kv2/(k+1),那么利益集團1選擇x=0,利益集團2選擇y=0;或者x=2v2/(k+1),利益集團2選擇y=0。收買選票博弈最令人吃驚的地方在于:無論什么情況,子博弈完美均衡中利益集團2的最優(yōu)策略都是0,即只要存在利益集團2也會收買選票,就有可能使利益集團2不用付出任何代價就能獲得最大收益。先行動者總是不利,而后行動者總是具有優(yōu)勢,我們把這種現(xiàn)象稱為后發(fā)優(yōu)勢。三、賽跑前面分析的例子具有后發(fā)優(yōu)勢,那么存不存在先發(fā)優(yōu)勢呢?這里我們介紹賽跑博弈,賽跑博弈可以運用在各種各樣的具有先發(fā)優(yōu)勢的競爭模型中。選手1和選手2賽跑,他們離終點線的距離分別用k1和k2來表示,k表示距離終點線的步數(shù)。兩個選手輪流行動,選手的行動可以是不動,也可以移動1步或是2步,成本分別為c(0)<c(1)<c(2)。如果選手1先到達終點,那么得到v的獎勵,凈收益為v1–c1,而選手2的收益就為–c2,c為每階段選手走過的步數(shù)的成本之和,例如,選手1走過的步數(shù)為0,1,2,那么c1=c(0)+c(1)+c(2)。對于選手2同理。如果兩個選手都沒有移動,那么游戲結(jié)束。該博弈的擴展式如下:(1)參與者集合:N={1,2};(2)全歷史集合:H={(x1,y1,x2,y2,…,xm,ym)},其中x為選手1的步數(shù),y為選手2的步數(shù),,m<k1,m<k2。(3)參與者函數(shù):P()=1,P(…,x)=2,P(…,y)=1;(4)偏好:每個選手都希望贏得獎品v,同時收益為正,否則選擇不移動。我們可將不同的賽跑博弈表示成(k1,k2)。為便于說明,不妨假設(shè)7>v>6,k1=k2=6,c(x)=x2,那么賽跑博弈Γ(6,6)的子博弈完美均衡是什么?正面求解顯得十分繁瑣,不妨運用逆推法。我們首先考慮Γ(1,1)的情況,即兩位選手離終點線只差一步。在這種狀態(tài)下,誰先行動誰贏,移動一步將能收獲6而付出1,因而移動一步比不移動要優(yōu),而后行動者將不移動(移動的話同樣不能贏,但卻要多付出1)。當情況為Γ(1,2)時,誰先行動誰贏,如果是選手1先行動,他移動一步將得6而付出1,移動一步比不移動要優(yōu),而選手2不移動;如果是選手2先行動,那么它移動兩步將得6而付出4,移動兩步比移動一步或不移動要優(yōu),而選手1不移動。當情況為Γ(2,1)時,分析與Γ(1,2)完全一樣。當情況為Γ(2,2)時,誰先行動誰贏,如果選手1先行動,選手1移動兩步比移動一步或不移動要優(yōu),而選手2不移動。因而,上述四種情況都意味著,誰先行動誰贏,而后行動者不會移動。接下來考慮Γ(1,k>3)的情況,即使選手2首先行動,如果他走一步,那么博弈變?yōu)棣?1,k>2);如果他走兩步,那么博弈變?yōu)棣?1,k>1)。這都意味著選手1贏,因而選手2不會移動,而選手1必會移動一步。同理,Γ(k>3,1)也是一樣。當情況為Γ(2,k>3)時,即使選手2首先行動,如果他走一步,那么博弈變?yōu)棣?2,k>2);如果他走兩步,那么博弈變?yōu)棣?2,k>1)。這都意味著選手1會走兩步贏得比賽,因而選手2不會移動,而選手1必會移動一步。同理,Γ(k>3,2)也是一樣。其次考慮Γ(3,3)的情況,顯然如果選手1先行動(走一步比走兩步要好),那么博弈將變?yōu)棣?2,3);如果選手2先行動,那么博弈將變?yōu)棣?3,2),無論哪種情況都意味著誰先行動誰贏,先行動者每次移動一步,后行動者不移動。當情況為Γ(3,4)時,如果選手1先行動(走一步比走兩步要好),那么博弈變?yōu)棣?2,4),選手1肯定贏。所以選手1每次走一步,選手2不移動。如果選手2先行動,那么他會走兩步(因而走一步將使博弈變?yōu)棣?3,3),輪到選手1行動,所以選手2必輸),博弈變?yōu)棣?3,2),選手2會贏,所以選手2走兩步,然后走兩次一步,選手1不移動。同理,Γ(4,3)分析完全一樣。當情況為Γ(4,4)時,如果選手1先走,他必走兩步(因為走一步,博弈將變?yōu)棣?3,4),這時輪到選手2走,所以選手1必輸),這時博弈變?yōu)棣?2,4),選手2的最優(yōu)策略是不移動,然后選手1走兩次一步到達終點。總之,上述四種情況都意味著誰先走誰贏,后行動者不移動。Γ(k>5,3)和Γ(k>5,4)同理,不再贅述。實際上,當距離終點線不低于5步時,選手每次只能走一步,否則收益將為負,因而要么每次走一步,要么一步不走。最后考慮Γ(5,5)和Γ(6,6)的情況,那么誰先走一步誰贏,后行動者不移動。當情況為Γ(5,6)和Γ(6,5)時,將是距離終點線最近的選手每次移動一步,另一位選手不移動。賽跑博弈整個分析的結(jié)果如圖4-15所示。圖4-15中的f表示誰先行動誰贏,1表示無論誰先移動,選手1都會贏,2同理,實線箭頭表示選手1需要先走兩步才能贏,虛線箭頭則表示選手2需要先走兩步才能贏。實際上,只有滿足條件k1<v/c(1)和k2<v/c(1),賽跑博弈才有意義,因為如果選手每次移動一步,達到終點線所費成本大于v,那么還不如不移動。選手1的終點線選手1的終點線選手2的終點線k16k212345123456ffff2222222211111111圖4-15賽跑的子博弈完美結(jié)果1111122222ffffff四、工會與企業(yè)博弈在一個勞動力市場上存在一個壟斷性質(zhì)的工會,工會首先決定工資率,而后企業(yè)根據(jù)工資來決定需要雇傭多少工人。工會的效用函數(shù)為U(w,L),其中w為工會向企業(yè)開出的工資水平,L為就業(yè)量。假定U(w,L)都是w和L的增函數(shù),即工資率越高,就業(yè)量越高,工會取得的成績越大。企業(yè)的利潤函數(shù)為,其中R(L)為企業(yè)雇傭L名工人在最優(yōu)的生產(chǎn)和產(chǎn)品市場決策下可獲得的收入,假定R(L)為凹函數(shù),即,,如圖4-16。該博弈的擴展式Γ={N,H,P,u}如下:(1)參與者集合:N={工會,企業(yè)};(2)全歷史集合:H={w,L}:(3)參與者函數(shù):P()=工會,P(w)=企業(yè);(4)偏好:工會和企業(yè)的收益函數(shù)分別為效用函數(shù)U(w,L)以及利潤函數(shù)。LLRR(L)w*L*(w*)圖4-16R(L)是凹函數(shù)L(w2)L(w1)w1w2我們?nèi)匀焕媚嫱品▉砬蠼庠搫討B(tài)博弈的子博弈完美均衡。首先,在給定工會工資率w,企業(yè)應(yīng)選擇L(w)以使利潤最大化:一階條件為由于R(L)為凹函數(shù),上式必有解,并且一階條件也是充分條件。利用一階條件的反函數(shù),我們就能得到L(w),它實際上表示在利潤最大化下,企業(yè)如何根據(jù)工資率w來選擇L。根據(jù)圖4-16可知,當L>L*時,(這表明當L保持不變時,工資率w降低會使企業(yè)的利潤提高);當L<L*時,,所以企業(yè)的等利潤曲線是一個倒U型,L(w)必定過各等利潤曲線的最高點,較低的等利潤曲線代表較高的利潤水平,如圖4-17所示。最后我們分析工會的最大化問題。工會在第一階段的問題是根據(jù)企業(yè)的決策L(w),選擇工資率以使工會的效用函數(shù)最大化,即。wwL等利潤曲線L(w)w1L1圖4-17企業(yè)的等利潤曲線w*L*w2L2由于我們不知道效用函數(shù)的具體形式,因而我們用工會的無差異曲線來代替上述公式最大化。根據(jù)微觀經(jīng)濟學(xué)的知識,當無差異曲線與預(yù)算線相切時,切點所代表的組合將使效用最大化。而圖4-16中的L(w)就是工會面臨的預(yù)算線。在圖4-18中,工會的最優(yōu)選擇就是使得它的無差異曲線與L(w)曲線相切。從而,(w*,L*)就是工會和企業(yè)博弈的完美均衡。L#L#L(w)wLw*L*工會的無差異曲線等利潤曲線w#圖4-18最優(yōu)選擇與無效率但這個子博弈完美均衡則不滿足帕累托效率。因為如果w和L位于陰影部分之內(nèi),則工會和企業(yè)的福利都能得到改善。例如,(w#,L#)在保證企業(yè)利潤不變的情況下,使得工會的收益高于完美均衡(w*,L*)下的收益,因而存在帕累托改善。上述分析的結(jié)論成為批評工會控制工資率導(dǎo)致無效率的一個重要理由。在第五章重復(fù)博弈中,我們將看到如果博弈無限期地重復(fù)進行(或不知道博弈什么時候結(jié)束),那么完美均衡就有可能在陰影部分之內(nèi)出現(xiàn)。以上例子都是完美信息動態(tài)博弈,下面的例子則是非完美信息博弈。五、開放式基金贖回潮中國2006年最熱的怕就屬“基金熱”了,但基金的存在卻可能加大股市的波動。通常,當股市出現(xiàn)大幅下跌時,基金購買者為了保住基金凈值,有可能出現(xiàn)大面積的基金贖回,這反過來又進一步加大股市的下跌。這里我們分析一個簡單的基金贖回潮模型。這個博弈的擴展式={N,H,P,u}如下:(1)參與者集合:N={1,2}。(2)全歷史集合:設(shè)W表示贖回,S表示不贖回,H={(W,W),(W,S),(S,W),[(S,S),(W,W)],[(S,S),(W,S)],[(S,S),(S,W)],[(S,S),(S,S)]}。(3)參與者函數(shù):P()={1,2},P(S,S)={1,2}。(4)偏好:對于任一投資人而言,收益越大越好,相應(yīng)收益如圖4-19。很明顯,這個模型存在兩個子博弈。根據(jù)逆推法,我們先從最后一個子博弈開始分析。顯然,在長期內(nèi),對于任一投資人而言,無論對手如何行動,選擇贖回都是最優(yōu)策略,即贖回是投資人的嚴格優(yōu)策略。因而最后一個子博弈的納什均衡為(贖回,贖回),相應(yīng)的收益為(R,R)。利用上述結(jié)論,將其結(jié)果帶入到短期,就得到圖4-20。112WSWSWS(r,r)(D,2r-D)(2r-D,D)(R,R)(2R-D,D)(D,2R-D)(R,R)WWSWSS12圖4-19基金贖回1112WSWSWS(r,r)(D,2r-D)(2r-D,D)(R,R)圖4-20基金贖回2現(xiàn)在分析短期的情況,從圖4-20可以看出,這個子博弈存在兩個納什均衡:一個是(贖回,贖回),一個是(不贖回,不贖回)。這說明在基金贖回這個模型中,存在著兩個子博弈完美均衡解:(1)在短期和長期,兩個投資人都贖回,即{(W,W),(W,W)],收益為(r,r)。實際上由于短期都贖回,所以長期并不會發(fā)生,但我們?nèi)孕枰该鲄⑴c者(如果走到了長期)的納什均衡策略。(2)在短期,兩個投資人都不贖回,而在長期都贖回,即{(S,W),(S,W)},收益為(R,R)。第一個完美均衡實際上就是對基金公司的一次贖回潮,伴隨著的就是股市的暴跌和基金公司總資產(chǎn)的加倍縮水。需要指出的是,這個模型雖然簡單但卻說明了開放式基金的存在會加大股市的波動,如果開放式基金控制的資金非常龐大,那么這種可能性產(chǎn)生的后果有可能會非常嚴重。六、國際貿(mào)易與關(guān)稅各國間的貿(mào)易政策和關(guān)稅協(xié)定實際上是一個博弈的結(jié)果,中國加入世貿(mào)組織的談判過程就清楚地表明了這一點。這里我們考慮一個簡單的關(guān)稅博弈模型。假設(shè)有兩個的國家,每個國家有一個企業(yè),定義為i=1和2。每個國家的政府制定關(guān)稅稅率,各國企業(yè)為國內(nèi)市場和國外市場生產(chǎn)某種產(chǎn)品。如果i(=1,2)國的市場總需求為Qi,則反需求函數(shù)為pi(Qi)=a–Qi,國家i中的企業(yè)為國內(nèi)市場生產(chǎn)hi,出口ei,則Qi=hi+ej,即i國的總需求量為國內(nèi)產(chǎn)量加進口。企業(yè)的邊際成本為常數(shù)c,沒有固定成本,那么企業(yè)i的成本函數(shù)為Ci(hi,ei)=c(hi+ei),另外,產(chǎn)品出口時需要負擔(dān)關(guān)稅成本:如果政府j制定的關(guān)稅為tj,那么企業(yè)i向j國出口ei必須支付的關(guān)稅就為tjei。首先,兩國政府同時選擇關(guān)稅稅率t1和t2,然后,兩國的企業(yè)觀察到關(guān)稅,并確定產(chǎn)量hi和ei。該博弈的擴展式Γ={N,H,P,u}為:(1)參與者集合:N={國1,國2,企業(yè)1,企業(yè)2};(2)全歷史集合:H={(t1,t2),[(h1,e1),(h2,e2)]};(3)參與者函數(shù):P()={國1,國2},P(t1,t2)={企業(yè)1,企業(yè)2};(4)偏好:兩國政府的收益函數(shù)為社會福利函數(shù),福利由消費者剩余、企業(yè)利潤和關(guān)稅組成。根據(jù)微觀經(jīng)濟學(xué)的知識,消費者剩余為消費者獲得的總效用減去支出。由于需求曲線是線性的,消費者剩余等于==。因而第i國政府的福利函數(shù)為:。企業(yè)的收益函數(shù)則為利潤函數(shù),第i國企業(yè)的利潤函數(shù)為:。因為該博弈是對稱的,所以只需考查i國和i企業(yè)即可。根據(jù)逆推法,我們首先考慮在給定兩國政府制定的關(guān)稅稅率t1和t2下,兩個企業(yè)的納什均衡。對于企業(yè)i,(hi,ei)必須滿足由于企業(yè)的利潤是兩個市場利潤之和,企業(yè)i在市場i的利潤只是hi和ej*的函數(shù),而在市場j的利潤卻是hj*,ei和tj的函數(shù),企業(yè)i的利潤最大化函數(shù)可以拆分為兩個問題,即在每一個市場分別求最大化。國內(nèi)市場hi必須滿足國外市場ei必須滿足假設(shè)ej*≤a–c和hj*≤a–c–tj,可得利用對稱性,對于每一個企業(yè)i=1,2,都必須滿足(4-T-1)和(4-T-2)這兩個最優(yōu)反應(yīng)函數(shù),從而對四個未知數(shù)(h1,e1,h2,e2)存在四個方程式。求解非常容易。其解為和(4-T-3)從上述兩個解可以看出如果沒有關(guān)稅,那么兩個企業(yè)生產(chǎn)的產(chǎn)量等于古諾模型中的產(chǎn)量,即在國內(nèi)和國外都生產(chǎn)1/3的市場容量。但由于關(guān)稅的存在,使得國內(nèi)企業(yè)的生產(chǎn)多增加了ti/3的產(chǎn)量,即受到了國內(nèi)關(guān)稅的保護。相反,在國外則由于關(guān)稅的保護而受到了損失,產(chǎn)量減少2tj/3。此外,hi*隨著國內(nèi)關(guān)稅ti的提高而增加,進口ej*則隨著國內(nèi)關(guān)稅的提高而減少,因而關(guān)稅的提高實際上會增加國家間的鎖國性,而不會是外向性,這實際上是一個囚徒困境。在第一階段,政府要解出最優(yōu)的稅率以使福利最大化。由于(h1*,e1*,h2*,e2*)都是稅率的函數(shù),所以社會福利是ti和tj的函數(shù)。求一階條件,得利用對稱性,這一結(jié)果對每一個i都成立,并不依賴于tj,這表明各國政府選擇(a–c)/3的稅率是嚴格優(yōu)策略。把t1=t2=(a-c)/3帶入(4-T-3)式可得和這就得到企業(yè)在第二階段所選擇的產(chǎn)量。因而,關(guān)稅博弈中的子博弈完美均衡解為:第一階段各國政府選擇(a–c)/3的關(guān)稅,第二階段企業(yè)在國內(nèi)生產(chǎn)4(a–c)/9,在國外生產(chǎn)(a–c)/9,即[(a–c)/3,(a–c)/3,(4(a–c)/9,(a–c)/9),(4(a–c)/9,(a–c)/9)]。實行關(guān)稅對一國的福利存在什么樣的影響呢?不妨假設(shè)關(guān)稅為零,那么各國市場上的商品總量為2(a–c)/3,消費者剩余為4(a–c)2/9=32(a–c)2/81,而在稅率為(a–c)/3的情況下,各國的商品總量為5(a–c)/9,消費者剩余為25(a–c)2/81,即0關(guān)稅帶來更大的消費者剩余。其次,我們求各國福利之和的最大值,即利用我們前面分析的結(jié)果,解一階條件,得由于稅率不可能為負數(shù),所以t1=t2=0。即實行0關(guān)稅,不僅能增加各國的福利,而且能夠增加兩國的總體福利。由此我們看到,實行關(guān)稅是一個完美均衡,但對各國和國際社會而言卻是無效率的。因而,各國政府就有充分的理由來簽定一個相互承諾0關(guān)稅的協(xié)定,這就是為什么WTO能夠不斷發(fā)展的根本原因。七、工作競賽考慮有兩個工人,每一個工人i的產(chǎn)出取決于努力程度ei和隨機擾動項,即。生產(chǎn)的程序如下:第一,兩個工人同時選擇非負的努力水平ei≥0;第二,隨機擾動項和相互獨立,服從期望值為0,密度函數(shù)為的概率分布;第三,工人的產(chǎn)出可以觀察到,但工人的努力水平無法觀察,從而工人的工資只能決定于個人的產(chǎn)出,而無法直接取決于其努力水平。假設(shè)企業(yè)主為了激勵工人努力工作,而在他們之間開展工作競賽。產(chǎn)出高的工人即是工作競賽的優(yōu)勝者,獲得高工資wH,而失敗者獲得低工資wL。工人獲得工資水平w并付出努力程度e時的收益為u(w,e)=w–g(e),其中g(shù)(e)表示努力工作帶來的負效用,是遞增的凸函數(shù),即,且。企業(yè)主的收益為y1+y2–wH–wL。定義企業(yè)主為參與者1,他的行動是選擇工作競賽中的工資水平wH和wL,兩個工人為參與者2和參與者3,他們觀察到第一階段選定的工資水平,然后同時選擇努力程度e1和e2。最后,參與者各自的收益如前面所給出。由于產(chǎn)出不僅是參與者行動的函數(shù),而且還受到隨機擾動因素的影響,因而參與者的收益為期望值。該博弈的擴展式Γ={N,H,P,u}為:(1)參與者集合:N={1,2,3};(2)全歷史集合:H={(wH,wL),[e1,e2]};(3)參與者函數(shù):P()=1,P(wH,wL)={2,3};(4)偏好:企業(yè)主的收益函數(shù)為U=y1+y2–wH–wL,工人的收益函數(shù)為u(w,e)=w–g(e)。運用逆推法。給定企業(yè)主選定的工資率wH和wL,如果努力水平(e1*,e2*)為第二階段的納什均衡,則對每一工人i而言,ei*一定使他的期望工資減去努力帶來的負效用后的凈收益最大化,即=(wH–wL)Prob{yi(ei)>yj(ej)}+wL–g(ei)(4-R-1)其中。(4-R-1)式的一階條件為(4-R-2)(4-R-2)式實際上就是邊際收益等于邊際成本,邊際收益為獎勵工資(wH-wL)與獲得獎勵工資的概率的乘積(期望值),而邊際成本就是邊際負效用。根據(jù)貝葉斯法則==于是(4-R-2)式可化為由于我們不清楚具體的函數(shù)形式,因而這里我們要運用到一個技巧:即由于隨機擾動項對兩個工人的影響的期望值都等于0,因而如果給定工人j的努力程度為ej,那么工人i的努力程度ei只要比ej大一個無窮小正數(shù)就能獲勝(從期望值來看),因而最優(yōu)的努力程度是ei=ej,所以第二階段的納什均衡意味著ei*=ej*=e*。從而上式可化為(4-R-3)由于g(e)是凸函數(shù),優(yōu)勝者獲得的獎勵越高(即wH–wL越大),就會激勵工人更大的努力,這和我們的直覺是一致的。另一方面,在同樣的獎勵水平下,隨機擾動因素越大,就越不值得努力工作,因為這時工作競賽的最終結(jié)果很大程度上取決于運氣而不是努力。不妨設(shè)服從正態(tài)分布,則有利用反函數(shù),得(4-R-4)給定工人的最優(yōu)選擇,企業(yè)主如何決定wH和wL?根據(jù)題意,企業(yè)主的期望收益為E[U]=2e*-wH-wL(隨機擾動項的期望值為0)一階條件為(4-R-5)(4-R-6)(4-R-6)意味著wL越小,企業(yè)主的收益越大,但wL不可能小于0,所以wL=0。這時,e*就是wH的函數(shù),只要給出具體的函數(shù)g(e*),就能解出wH和e*。因而該博弈的子博弈完美均衡為:[((4-R-5),0),(4-R-4),(4-R-4)]。如果我們對該博弈稍作修改,例如允許工人退出,那么只要有一個工人退出,競賽將無法進行,企業(yè)主得0,工人得到保留收益R。如果工人同意參與工作競賽而不是另謀高就,他們將根據(jù)(4-R-4)來選擇努力水平。因為在對稱的納什均衡中(ei*=ej*),每個工人在競賽中獲勝的概率就為Prob{yi>yj}=1/2,因而企業(yè)主要使工人有積極性參加工作競賽,則他選擇的工資率必須滿足下式(4-R-7)(4-R-7)式被稱為參與約束,它表示要吸引工人參與博弈必須滿足的條件。假如R足夠低,以致于工人愿意參加競賽,則企業(yè)主在(4-R-7)式的約束下,選擇使自己期望收益2e*-wH-wL最大的工資水平。由于在最優(yōu)條件下,(4-R-7)中的等號成立,所以(4-R-8)則企業(yè)主的期望利潤就成為2e*–2R–2g(e*),于是企業(yè)主要考慮的問題就是使e*–g(e*)最大化,這時他選擇的工資水平應(yīng)激勵工人選擇e*以滿足這一條件。從而最優(yōu)條件下的努力水平滿足一階條件=1,將其代入(4-R-3)則意味著最優(yōu)激勵wH–wL滿足即,與(4-R-8)一起,如果知道g(e*)的具體形式,就可解出wH*和wL*的值。因而該博弈的完美均衡解為[(wH*,wL*),e1*,e2*],其中=1。八、退出衰落行業(yè)設(shè)一個行業(yè)的市場需求函數(shù)為Pt(Q),t=1,2,3,…,并且Pt(Q)<Pt+1(Q),即該行業(yè)是一個衰落行業(yè)。在該行業(yè)存在兩個壟斷企業(yè),不失一般性,q1代表第1個企業(yè)的產(chǎn)能,q2代表第2個企業(yè)的產(chǎn)能,其中q1>q2,壟斷企業(yè)i要么不生產(chǎn),要么選擇產(chǎn)量qi,生產(chǎn)的總成本為cqi,壟斷企業(yè)不生產(chǎn)就意味著退出該行業(yè),退出之后不可能再進入。任何一個時期,市場上的商品總量為兩個企業(yè)的產(chǎn)量之和,即Q=q1+q2。隨著時間的推移,市場逐漸萎縮,因而企業(yè)會陸續(xù)退出,那么企業(yè)在什么時候退出?誰先退出?為了回答這些問題,我們先將其概括為擴展式,然后再尋找其子博弈完美均衡。該博弈的擴展式該博弈的擴展式Γ={N,H,P,u}為:(1)參與者集合:N={1,2}。(2)全歷史集合:H={(X1,X2,…,Xt)}。令退出=E,繼續(xù)=S。全歷史可能出現(xiàn)三種情況

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論