運(yùn)籌學(xué)-10、對(duì)策論_第1頁(yè)
運(yùn)籌學(xué)-10、對(duì)策論_第2頁(yè)
運(yùn)籌學(xué)-10、對(duì)策論_第3頁(yè)
運(yùn)籌學(xué)-10、對(duì)策論_第4頁(yè)
運(yùn)籌學(xué)-10、對(duì)策論_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,對(duì)策論又稱博弈論,是運(yùn)籌學(xué)的一個(gè)重要分支。對(duì)策論所研究的主要對(duì)象是帶有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)的現(xiàn)象。由于對(duì)策論研究的對(duì)象與政治、軍事、工業(yè)、農(nóng)業(yè)、交通、運(yùn)輸?shù)阮I(lǐng)域有密切關(guān)系,處理問(wèn)題的方法又有著明顯的特色,所以越來(lái)越受到人們的重視。,第一節(jié) 引言,一、對(duì)策行為與對(duì)策論,第五章 對(duì)策論,2,在日常生活中,我們經(jīng)??吹揭恍┫嗷ブg的競(jìng)爭(zhēng)、比賽性質(zhì)的現(xiàn)象,如下棋、打撲克、體育競(jìng)賽等。,在經(jīng)濟(jì)領(lǐng)域,各國(guó)之間的貿(mào)易談判,各公司、企業(yè)之間的市場(chǎng)爭(zhēng)奪,各公司、企業(yè)之間的加工、訂貨、合作談判等等,都是競(jìng)爭(zhēng)現(xiàn)象。,在政治方面,國(guó)際上政府間的各種外交談判,各方都想在談判中處于有利地位,爭(zhēng)取到對(duì)自己有利的結(jié)果。各國(guó)之間

2、或國(guó)內(nèi)各集團(tuán)之間的戰(zhàn)爭(zhēng),是一種你死我活的斗爭(zhēng),雙方都千方百計(jì)要戰(zhàn)勝對(duì)方。,3,例:兩個(gè)兒童玩的“石頭剪子布”游戲和我國(guó)古代的“齊王賽馬”就是典型的對(duì)策論研究的例子。,在這類行為中,參加斗爭(zhēng)或競(jìng)爭(zhēng)的各方各自具有不同的目標(biāo)和利益,為了達(dá)到各自的目標(biāo)和利益各方必須考慮對(duì)手的各種可能的行動(dòng)方案,并力圖選取對(duì)自己最為有利或最為合理的方案,對(duì)策論就是研究對(duì)策行為中斗爭(zhēng)各方是否存在著最合理的行動(dòng)方案,以及如何找到這個(gè)合理的行動(dòng)方案的數(shù)學(xué)理論和方法。,4,二、對(duì)策問(wèn)題的三個(gè)基本要素,(1)局中人:在一場(chǎng)競(jìng)賽或斗爭(zhēng)中,每一個(gè)有決策權(quán)的參與者(個(gè)人或集團(tuán))稱為一個(gè)局中人。只有兩個(gè)局中人的對(duì)策現(xiàn)象稱為“兩人對(duì)策”,

3、而多于兩個(gè)局中人的對(duì)策稱為“多人對(duì)策”。,(2)策略:一個(gè)對(duì)策中,每個(gè)局中人都有供他選擇的實(shí)際可行的完整的行動(dòng)方案,我們把一個(gè)局中人一個(gè)可行的自始至終通盤(pán)籌劃的行動(dòng)方案,稱為這個(gè)局中人的一個(gè)策略。如果在一個(gè)對(duì)策中,每個(gè)局中人都只有有限個(gè)策略,則稱為“有限對(duì)策問(wèn)題”,否則稱為 “無(wú)限對(duì)策問(wèn)題”。,5,(3)贏得函數(shù)(支付函數(shù)):一局對(duì)策結(jié)束時(shí)的結(jié)果(如收入或支出)稱為得失。每個(gè)局中人在一局對(duì)策結(jié)束時(shí)的得失,不僅與該局中人自身所選擇的策略有關(guān),而且與全體局中人所取定的一組策略有關(guān)。所以,一局對(duì)策結(jié)束時(shí)每個(gè)局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱作贏得函數(shù)(支付函數(shù))。把每個(gè)局中人

4、各自所取的一個(gè)策略所組成的策略組稱為“局勢(shì)”,于是“得失”是“局勢(shì)”的函數(shù)。,6,第二節(jié) 矩陣對(duì)策的基本定理,特點(diǎn):局中人只有兩人,分別用局中人和局中人表示,雙方都只有有限個(gè)策略可供選擇,,局中人的“得失”相加等于零,這種對(duì)策稱為“零和對(duì)策”。在兩人有限零和對(duì)策中,局中人的所獲等于局中人的所失。假定在局勢(shì) (i, j )下(即局中人取策略i ,局中人取策略j 時(shí)所形成的局勢(shì)),局中人的收入或贏得是ai j(“aij”是負(fù)數(shù)時(shí),表示局中人是支出)。,的策略集為: 的策略集為:,一、矩陣對(duì)策的數(shù)學(xué)模型,7,用矩陣表示為(稱為局中人的贏得矩陣或局中人的支付矩陣):,我們稱兩人有限零和對(duì)策為矩陣對(duì)策,

5、記為:G, ;S1,S2;A 或 GS1,S2;A。,8,例1:設(shè)有矩陣對(duì)策,局中人的支付矩陣如下:,如果各局中人都不想冒險(xiǎn),必須考慮對(duì)方會(huì)選擇策略使他得到最差的收入。因此各局中人都選擇理智的決策行為。,解: 3, 3, 1, 4, 3,9,局中人的各種策略的最差收入是支付陣中各種策略所對(duì)應(yīng)行的最小數(shù)。如果不存僥幸心理,他對(duì)每個(gè)策略只能期望得到最差的收入。即:,那么為了得到盡可能好的結(jié)局,只能從這些最小數(shù)之中的找最大者(最大的最小者),即選擇能在最差的可能結(jié)果中得到最好結(jié)果的策略。即:,8,2,9,3,即選擇策略2。,10,同樣,局中人的各種策略的最差收入(最大支出)是支付矩陣中各列的最大數(shù),

6、即:,局中人選擇這些最大數(shù)中的最小者。即:,16,2,5,即選擇策略2。,的最優(yōu)策略為2, 的最優(yōu)策略為2 。,11,定義:設(shè)GS1,S2;A為矩陣對(duì)策,其中S11,2,m,S21,2,n。A=(aij) mn,若滿足等式:,則稱純局勢(shì)(i*,j*)為G在純策略下的解(或平衡局勢(shì))。記VGai*j*,稱VG為對(duì)策G的值, i*,j*分別稱為局中人I、II的最優(yōu)純策略。,例1的對(duì)策G的解為(2,2),2,2分別是局中人I和II的最優(yōu)純策略, VG =2。,從例1中可以看出,矩陣的元素a22既是所在行的最小元素,又是所在列的最大元素,即:,12,定理1:矩陣對(duì)策A =(aij) mn有解的充分必要

7、條件是: 存在純局勢(shì)(i*,j*),使得對(duì)一切 i=1,2,m,j=1,2,n均有:,i=1,2,3,4;j=1,2,3,將這一事實(shí)推廣到一般矩陣對(duì)策,可得如下定理:,證明:先證充分性,由于對(duì)任意i,j均有:,故:,13,另一方面,對(duì)任意i,j均有:,所以:,于是:,所以:,14,再證必要性,若G有解。,而對(duì)于所有的 i 而言,必存在一個(gè)i*使:,對(duì)于所有的 j 而言,必存在一個(gè)j*使:,因?yàn)椋?于是:,15,稱滿足條件 的 (i*, j* ) 為矩陣對(duì)策G的一個(gè)鞍點(diǎn)。,但:,于是有:,故對(duì)一切的 i ,j 都有:,意義:如果局中人I選擇策略i* ,局中人II不選擇策略 j* ,而選擇策略j,

8、則局中人II的支付只會(huì)增多。也就是說(shuō):策略j*是II的最優(yōu)策略。,16,注意:一個(gè)矩陣對(duì)策G如果存在鞍點(diǎn),鞍點(diǎn)可能不止一個(gè)。但是在不同的鞍點(diǎn)處,支付值相等,都等于對(duì)策的值。(無(wú)差異性),如果(i , j ) 以及(k , l)都是對(duì)策G的鞍點(diǎn),則(k , j ) 與(i , l)也是該問(wèn)題的鞍點(diǎn)。(可交換性),同樣,如果局中人II選擇策略j* ,局中人I不選擇策略 i* ,而選擇策略 i,則局中人I的所獲只會(huì)減少。也就是說(shuō):策略i*是局中人I的最優(yōu)策略。,17,G有四個(gè)鞍點(diǎn):,對(duì)策的值為VG 5。,例2:給定矩陣對(duì)策GS1,S2;A,其中:,18,二、矩陣對(duì)策的混合策略,矩陣對(duì)策G有鞍點(diǎn)時(shí),就

9、存在最優(yōu)解(最優(yōu)純策略),但是否一切矩陣對(duì)策問(wèn)題中,各局中人都有上述意義的最優(yōu)純策略呢?答案是否定的。,例1:石頭、剪刀、布,不存在上述純策略意義下的解。,19,對(duì)于該例而言,直觀的看:雙方采用三個(gè)純策略的頻率均應(yīng)為 13 :13 :13。由于每個(gè)局中人在一局對(duì)策中必取某個(gè)純策略,因此采取任何一個(gè)純策略的概率都應(yīng)是13。,一般地,設(shè)局中人I以概率x1 , x2 , ,xm來(lái)分別選取他的純策略1,2,m ;而局中人II以概率y1 , y2 , ,yn來(lái)選用自己的純策略1,2,n 。于是:,令x = ( x1 , x2 , ,xm)T , y = ( y1 , y2 , ,yn)T,則稱這樣的x和

10、y為局中人I、II的混合策略。,20,記:,此時(shí),當(dāng)局中人I以概率 xi采用i 時(shí),局中人II以概率 yj 采用 j 時(shí) ,支付 ai j 出現(xiàn)的概率為xi yj 。,于是局中人I收入(贏得)的期望值為:,則稱 GS1,S2;E為 GS1,S2;A的混合擴(kuò)充。,21,混合策略對(duì)策矩陣可表示如下:,混合策略問(wèn)題的解也是以最大最小化和最小最大化標(biāo)準(zhǔn)為根據(jù)的。,22,當(dāng)局中人I選擇某個(gè)混合策略 x 時(shí),對(duì)于局中人II的任意選擇 y, I的期望所獲至少是:,于是局中人I希望選擇x,使上式最大,保證局中人I的期望所獲不小于:,這就是局中人I的最大最小化標(biāo)準(zhǔn)。,同理:當(dāng)局中人II選擇某個(gè)混合策略 y 時(shí),

11、對(duì)于I的任意選擇 x,II的期望支付至多是:,于是局中人II希望選擇 y,使上式最小,保證局中人II的期望支付不多于:,這就是局中人II的最小最大化標(biāo)準(zhǔn)。,23,例1:求解矩陣對(duì)策GS1,S2;A ,其中:,如果令: 則得問(wèn)題的最優(yōu)解。,解:設(shè) X= ( x, 1x )T , Y= ( y, 1y )T,且對(duì)策的值為:,24,另解: (用微分求極值的方法),且對(duì)策的值為:,25,定義 : GS1,S2;E為矩陣對(duì)策GS1,S2;A的混合擴(kuò)充,若存在(x*,y*)滿足等式:,則稱(x*,y*)為G在混合策略下的解。稱VGE (x*,y*) 為對(duì)策G的值, x*,y*分別稱為I、II的最優(yōu)混合策略

12、。,定理2:混合策略 x*和 y*是G的解的充分必要條件是:對(duì)一切混合策略 x, y有:,稱( x* , y*)是對(duì)策問(wèn)題在混合策略意義下的鞍點(diǎn)。,26,當(dāng)局中人I 取純策略i時(shí),記其贏得函數(shù)為,于是,三、矩陣對(duì)策的基本定理,當(dāng)局中人II取純策略j時(shí),記其贏得函數(shù)為,于是,27,則有:,定理3:混合策略 x*和 y*是G的解的充分必要條件是:對(duì)任意的i, j有:,28,則,證明:必要性顯然,只需證充分性,若對(duì)任意i,j均有:,即:,所以x*和 y*是G的解。,29,注意到:,可以寫(xiě)成:,于是定理3可以改述為:,定理4:矩陣對(duì)策GS1,S2;A有解的充要條件是存在數(shù)v,使得 x, y 分別是下述

13、兩個(gè)不等式組的解:,30,定理5:(對(duì)策基本定理)任何矩陣對(duì)策G在混合策略下一定有解。,證明:由定理3,只需證明存在混合策略 x*和 y*,使得(3)式成立,為此考慮如下兩個(gè)線性規(guī)劃:,31,容易驗(yàn)證(P)和(D)是互為對(duì)偶規(guī)劃,而且,是(P)的一個(gè)可行解,,是(D)的一個(gè)可行解,由線性規(guī)劃對(duì)偶理論可知,(P)和(D)是都存在最優(yōu)解( x*,w*) 和(y*,v*) ,且最優(yōu)值w*= v*,即:,i=1,2,m , j=1,2,n .,32,又由:,可得:,定理5的證明是構(gòu)造性的證明,同時(shí)給出了求解方法。,33,定理6:設(shè)(x*, y*)是矩陣對(duì)策G解,v =VG,則,34,矩陣對(duì)策GS1,S

14、2;A。,(1)若,(即A中第k行的每個(gè)元素 A中第 l 行的每個(gè)元素),稱局中人I的策略k優(yōu)超于策略 l ;則可在A中去掉第 l 行,矩陣對(duì)策G的解不變。,(2)如果:,(即A中第k列的每個(gè)元素 A中第l列的每個(gè)元素),稱局中人II的策略k 優(yōu)超于策略l 。則可在A中去掉第第 l 列,矩陣對(duì)策G的解不變。,優(yōu)超定理:,35,第三節(jié) 矩陣對(duì)策的求解,一、22對(duì)策的方程法,則稱G為22對(duì)策。,若G沒(méi)有純策略下的解,則G的最優(yōu)混合策略x*= ( x1, x2 )T , y* = ( y1, y2 )T 滿足下列方程組:,且其中v =VG .,36,例1:求解求解矩陣對(duì)策GS1,S2;A ,其中:,

15、解:在A中由于:第3行第2行, 第4行第1行,,因此從A中劃去1,2兩行,得:,37,在A1中由于:第1列第3列, 第2列第4列,,因此從A1中劃去3,4兩列,得:,在A2中由于:第1行第3行,,因此從A2中劃去第3行,得:,在A3中由于:第2列第3列,,因此從A3中劃去第3列,得:,38,分別求解方程組得:,得 x3=1/3 , x4 =2/3, y1=1/2 , y2 =1/2 ,v = 5.,由此對(duì)于原問(wèn)題A而言,最優(yōu)解為:,39,二、2n和m2對(duì)策的圖解法,解:設(shè)局中人I 的混合策略為( x, 1x )T , 局中人I 的最少得益為如下圖中由局中人II 選擇1,2,3 時(shí)所確定的三條直

16、線2 x 7(1x)v, 3 x 5(1x)v,11x 2(1x)v在x處縱坐標(biāo)的最小者,即如圖中折線B1BB2B3。,例2:求解求解矩陣對(duì)策GS1,S2;A ,其中:,40,3,1,2,B1,B,B2,B3,A,所以對(duì)局中人I來(lái)說(shuō),他的策略就是確定x使他的得益達(dá)到最大。按最大最小原則應(yīng)選擇xOA,而AB即為對(duì)策的值。為求出x和對(duì)策的值 VG ,可聯(lián)立過(guò)B點(diǎn)的兩條直線2和3所確定的方程。,41,解得: x 3/11, VG=49/11。,此外從圖中可看出,局中人II的最優(yōu)策略只由2和3組成(不選1),可由方程組所確定:,解得: y2=9/11,y3 =2/11。,所以最優(yōu)解為:,42,例3:求

17、解矩陣對(duì)策GS1,S2;A,其中:,解:設(shè)局中人II 的混合策略為( y, 1y )T , 局中人II 的最大支付為如下圖中由局中人 I選擇1,2, 3 時(shí)所確定的三條直線2y7(1y)v,9y6(1y)v,11y2(1y)v在y處縱坐標(biāo)的最小者,即如圖中折線上的B點(diǎn)。,43,0,1,2,6,11,2,9,7,y,V,V,B,A,1,2,3,對(duì)局中人II來(lái)說(shuō),他的策略就是確定y使他的支付達(dá)到最小。按最小最大原則應(yīng)選擇y OA,為求出y和對(duì)策的值 VG ,可聯(lián)立過(guò)B 點(diǎn)的兩條直線1和2所確定的方程。,44,解得: y 1/8, VG=51/8。,此外從圖中可看出,局中人II的最優(yōu)策略只由1和2組

18、成(不選3),可由方程組所確定:,解得: x1=3/8,x2 =5/8。,所以最優(yōu)解為:,45,三、線性規(guī)劃法,由前面定理可知,對(duì)策G的解滿足下列線性規(guī)劃:,作變量替換:,46,則,于是上述線性規(guī)劃等價(jià)于下面的線性規(guī)劃問(wèn)題。,由此求解一個(gè)對(duì)策問(wèn)題,就相當(dāng)于求解上面的對(duì)偶問(wèn)題:,47,例4:利用線性規(guī)劃法求解矩陣對(duì)策GS1,S2;A.,【注】如果ai j不滿足非負(fù)性,則存在一個(gè)正數(shù)k,使得ai j +k0,令B =(bi j ) =(ai j +k),求解對(duì)策問(wèn)題 S1,S2;B ,可以證明:?jiǎn)栴}S1,S2;B與問(wèn)題S1,S2;A的最優(yōu)策略相同,且有:,其中:,48,解:,建立相應(yīng)的線性規(guī)劃模型

19、,及,用單純形法求解后一個(gè)問(wèn)題,先標(biāo)準(zhǔn)化為:,49,用單純形表求解如下:,50,51,由此最優(yōu)解為:,52,第四節(jié) 兩人有限非零和對(duì)策,例1:“囚徒困境” 甲乙是同案囚犯,被隔離審訊。如果兩個(gè)都抵賴,因?yàn)樽C據(jù)不充分,兩人都只能判1年。如果只有一方坦白,則無(wú)罪釋放;而另一方則屬抗拒從嚴(yán),判10年。但如果兩人都坦白,則各判5年。,下表給出了“囚徒困境”博弈問(wèn)題的戰(zhàn)略式表述,為了實(shí)現(xiàn)各自的效用最大化,雙方格采取何種策略呢?,53,假設(shè)該博弈是一次性的,對(duì)于囚犯甲而言,不管乙選擇坦白還是抵賴,他選擇坦白都比選擇抵賴更好。這種不管對(duì)方選擇何種策略,局中人的最優(yōu)選擇總是不變的那個(gè)策略被稱為該局中人的優(yōu)超策

20、略。此例中坦白為甲的優(yōu)超策略,同樣道理坦白也是乙的優(yōu)超策略。結(jié)果是,兩個(gè)囚徒爭(zhēng)先恐后地都選擇坦白,各判刑5年。從而(坦白,坦白)也就構(gòu)成了該博弈的優(yōu)超策略均衡(稱為納什均衡)。,54,囚犯困境反映了一個(gè)深刻的問(wèn)題,這就是個(gè)人理性與集體理性的矛盾,如果兩個(gè)人都抵賴,對(duì)局中人組成的集體而言,可謂帕累托最優(yōu),但是這并不滿足個(gè)人理性導(dǎo)致的納什均衡(坦白,坦白),因而,這個(gè)帕累托改進(jìn)在靜態(tài)博弈中辦不到。囚徒困境說(shuō)明納什均衡并不一定導(dǎo)致帕累托最優(yōu),從而動(dòng)搖了傳統(tǒng)經(jīng)濟(jì)學(xué)中個(gè)人效用最大化行為必然導(dǎo)致社會(huì)福利最優(yōu)的基本命題。,對(duì)囚犯困境問(wèn)題作進(jìn)一步分析,不難發(fā)現(xiàn),盡管甲與乙各自的最佳選擇都是坦白,如果雙方均選擇

21、抵賴,各判刑1年,顯然比雙方均坦白時(shí)答判刑5年的結(jié)局要好,因此,其最佳選擇與最優(yōu)結(jié)局并不一致。出現(xiàn)所謂的“囚徒困境”。,55,設(shè)對(duì)策G的局中人和,雙方都只有有限個(gè)策略,其中,在局勢(shì) (i, j )下(即局中人取策略,局中人取策略j 時(shí)所形成的策略組合),局中人的贏得值是ai j,局中人的贏得值是bij。分別用矩陣表示為A和B。,的策略集為: 的策略集為:,非合作兩人對(duì)策,56,定義:對(duì)于非合作兩人對(duì)策G,如果i*是局中人對(duì)的策略j*的最優(yōu)策略,j*是局中人對(duì)的策略i*的最優(yōu)策略,則稱局勢(shì)(i*,j*)是該問(wèn)題的一個(gè)納什均衡(即誰(shuí)都不愿單獨(dú)改變策略) 。,57,本博弈的納什均衡為(大豬按,小豬等

22、待)。,例2:“智豬博弈” 豬圈有一頭大豬、一頭小豬,按一下按鈕會(huì)有10個(gè)單位的飼料,但按按鈕需要2個(gè)單位成本。,58,例3:“夫妻博弈” 丈夫喜歡看球賽,妻子喜歡逛商場(chǎng)。他們都寧愿在一起,也不愿分開(kāi)行動(dòng)。,本例有兩個(gè)納什均衡結(jié)果會(huì)出現(xiàn),要么一起去看球賽,要么一起去逛商場(chǎng),但在一次博弈中究竟會(huì)出現(xiàn)哪一種?,59,這個(gè)博弈也有兩個(gè)納什均衡,一個(gè)是(進(jìn)攻,退卻),另一個(gè)是(退卻,進(jìn)攻)。,例4 :“斗雞博弈” 有兩個(gè)斗雞A、B,它們各有兩個(gè)策略:進(jìn)攻或退卻。,60,這個(gè)博弈也有兩個(gè)納什均衡,一個(gè)是(進(jìn)入,默許),另一個(gè)是(不進(jìn)入,斗爭(zhēng)),而(不進(jìn)入,默許)卻不是一個(gè)納什均衡。,例5: “市場(chǎng)進(jìn)入壁

23、壘” 設(shè)想一個(gè)壟斷企業(yè)已占領(lǐng)市場(chǎng)(稱為“在位者”),另一個(gè)企業(yè)很想進(jìn)入市場(chǎng)(稱為“進(jìn)入者”),在位者想保持其壟斷地位,就要阻撓進(jìn)入者進(jìn)入假定雙方在各種策賂組合下的贏得短陣如表所示:,61,非合作兩人對(duì)策的解法,對(duì)其他局中人的任一策略組合,找出局中人i的最佳策略,并在其得益值下劃線。若存在一個(gè)策略組合,使得所有局中人的得益值下都劃了線,則該策略組合就是一個(gè)納什均衡。,求納什均衡的方法如下:,62,例1:囚犯困境,因此(坦白,坦白) 構(gòu)成了該博弈的納什均衡。,63,例3:夫妻博弈,這個(gè)博弈有兩個(gè)納什均衡,一個(gè)是(看球賽,看球賽),另一個(gè)是(逛商場(chǎng),逛商場(chǎng))。,64,例5: 市場(chǎng)進(jìn)入壁壘,因此(進(jìn)入

24、,默許)和 (不進(jìn)入,阻撓)是該問(wèn)題的兩個(gè)鈉什均衡。,65,混合策略納什均衡,上面介紹了在純策略意義下非合作兩人對(duì)策納什均衡的概念及求解方法,但有些對(duì)策不存在純策略意義下的納什均衡,考慮下面的例子。,66,例6: 局中人是政府和一個(gè)流浪漢,流浪漢有兩個(gè)策略:尋找工作或游蕩;政府也有兩個(gè)策略:救濟(jì)或不救濟(jì)。政府幫助流浪漢的前提是后者必須試圖尋找工作;否則,政府不予以幫助;而流浪漢只在得不到救濟(jì)時(shí)才會(huì)尋找工作,如表給出了對(duì)策的贏得雙矩陣:,67,同樣局中人可以考慮按照一定的隨機(jī)方式來(lái)確定一個(gè)策略組合的混合策略。每個(gè)局中人作出決策時(shí),不是只選用一個(gè)純策略,而是按照預(yù)先確定的一組概率來(lái)選取他們所有可能

25、采用的策略。,容易理解:當(dāng)流浪漢選擇尋找工作時(shí),政府的最優(yōu)策略是救濟(jì);當(dāng)流浪者選擇游蕩時(shí),政府的最優(yōu)策略是不救濟(jì);當(dāng)政府策略為不救濟(jì)時(shí),流浪漢的最優(yōu)策略是尋找工作;當(dāng)政府選擇救濟(jì)時(shí),流浪漢的最優(yōu)策略是游蕩。總之,在純策略下,沒(méi)有一個(gè)策略組合構(gòu)成納什均衡。,68,局中人I以概率x1, x2 , ,xm來(lái)分別選取純策略1, 2 , m ;而局中人II以概率y1 , y2 , ,yn來(lái)選用自己的純策略1 , 2 , , n 。于是:,稱 x = ( x1 , x2 , ,xm)T , y = ( y1 , y2 , ,yn)T 分別為I和II的混合策略。,設(shè)A,B分別為局中人I和II的贏得矩陣,且都

26、是為mn矩陣。,69,則局中人I和II的混合策略集為:,當(dāng)局中人I和II的混合策略分別為x和y時(shí),局中人I和II的期望贏得值分別為:,70,如果一個(gè)混合策略組合(x*, y*)同時(shí)滿足:,且,則稱策略組合(x*, y*) 是一個(gè)混合策賂納什均衡,其中(x, y) 分別是局中人I和II的任意混合策略。,例6中假定政府以概率x選擇救濟(jì)概率1x選擇不救濟(jì),即政府的混合策略為 ( x, 1x );流浪漢以概率y選擇尋找工作,以概率1y選擇游蕩,即流浪漢的混合策略為( y, 1y )。那么政府的期望贏得函數(shù)為:,71,同樣,流浪漢的期望贏得函數(shù)為:,令,得,令,得,72,這就是說(shuō),在混合策略均衡中,流浪

27、漢在對(duì)付政府給定的混合策略下,最優(yōu)策略是以15 的概率選擇尋找工作,而以45 的概率選擇游蕩,即:,在混合策略均衡中,政府在對(duì)付給定流浪漢的混合策略下,最優(yōu)策略是:,由于納什均衡要求每個(gè)局中人的混合策略是在給定對(duì)方的混合策略下的最優(yōu)選擇,因此策略組(X,Y)構(gòu)成唯一的納什均衡,73,對(duì)于上述的混合策略納什均衡,可以這樣來(lái)理解:如果政府認(rèn)為流浪漢選擇工作的概率 y1/5,那么政府的唯一最優(yōu)選擇策略是不救濟(jì);但當(dāng)政府以 1 的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟(jì),此時(shí)流浪漢則又會(huì)選擇游蕩,如此等等,因此y1/5不構(gòu)成納什均衡。,同樣,如果政府認(rèn)為y1/5,政府的唯一最優(yōu)選擇是救濟(jì);但當(dāng)政府以x1選擇救濟(jì)時(shí),流浪漢的最優(yōu)選擇則是游蕩,因此y1/5 也不構(gòu)成納什均衡;類似地,可以驗(yàn)證x1/2和x1/2都不構(gòu)成納什均衡。,74,無(wú)限策略博弈分析,在有無(wú)限策略、連續(xù)策略空間的博弈中,納什均衡的概念同樣適用。我們通過(guò)具體模型來(lái)說(shuō)明這種博弈的納什均衡分析方法。,古諾(Cournot)模型:古諾模型是研究寡頭壟斷市場(chǎng)的經(jīng)典模型,在古諾模型中,假設(shè)一個(gè)市場(chǎng)有兩家生產(chǎn)同一種產(chǎn)品廠商。如果廠商1的產(chǎn)量為q1,廠商2的產(chǎn)量為q2,則市場(chǎng)總產(chǎn)量為Qq1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論