運(yùn)籌學(xué)-10、對(duì)策論_第1頁
運(yùn)籌學(xué)-10、對(duì)策論_第2頁
運(yùn)籌學(xué)-10、對(duì)策論_第3頁
運(yùn)籌學(xué)-10、對(duì)策論_第4頁
運(yùn)籌學(xué)-10、對(duì)策論_第5頁
已閱讀5頁,還剩76頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1 對(duì)策論又稱博弈論對(duì)策論又稱博弈論,是運(yùn)籌學(xué)的一個(gè)重要分,是運(yùn)籌學(xué)的一個(gè)重要分支。對(duì)策論所研究的主要對(duì)象是帶有斗爭(zhēng)或競(jìng)爭(zhēng)性支。對(duì)策論所研究的主要對(duì)象是帶有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)的現(xiàn)象。由于對(duì)策論研究的對(duì)象與政治、軍事、質(zhì)的現(xiàn)象。由于對(duì)策論研究的對(duì)象與政治、軍事、工業(yè)、農(nóng)業(yè)、交通、運(yùn)輸?shù)阮I(lǐng)域有密切關(guān)系,處理工業(yè)、農(nóng)業(yè)、交通、運(yùn)輸?shù)阮I(lǐng)域有密切關(guān)系,處理問題的方法又有著明顯的特色,所以越來越受到人問題的方法又有著明顯的特色,所以越來越受到人們的重視。們的重視。 一、對(duì)策行為與對(duì)策論一、對(duì)策行為與對(duì)策論2 在日常生活中,我們經(jīng)??吹揭恍┫嗷ブg的在日常生活中,我們經(jīng)??吹揭恍┫嗷ブg的競(jìng)爭(zhēng)、比賽性質(zhì)的現(xiàn)象,

2、如下棋、打撲克、體育競(jìng)競(jìng)爭(zhēng)、比賽性質(zhì)的現(xiàn)象,如下棋、打撲克、體育競(jìng)賽等賽等。 在經(jīng)濟(jì)領(lǐng)域,各國之間的貿(mào)易談判,各公司、在經(jīng)濟(jì)領(lǐng)域,各國之間的貿(mào)易談判,各公司、企業(yè)之間的市場(chǎng)爭(zhēng)奪,各公司、企業(yè)之間的加工、企業(yè)之間的市場(chǎng)爭(zhēng)奪,各公司、企業(yè)之間的加工、訂貨、合作談判等等,都是競(jìng)爭(zhēng)現(xiàn)象。訂貨、合作談判等等,都是競(jìng)爭(zhēng)現(xiàn)象。 在政治方面,國際上政府間的各種外交談判,在政治方面,國際上政府間的各種外交談判,各方都想在談判中處于有利地位,爭(zhēng)取到對(duì)自己有各方都想在談判中處于有利地位,爭(zhēng)取到對(duì)自己有利的結(jié)果。各國之間或國內(nèi)各集團(tuán)之間的戰(zhàn)爭(zhēng),是利的結(jié)果。各國之間或國內(nèi)各集團(tuán)之間的戰(zhàn)爭(zhēng),是一種你死我活的斗爭(zhēng),雙方都千

3、方百計(jì)要戰(zhàn)勝對(duì)方。一種你死我活的斗爭(zhēng),雙方都千方百計(jì)要戰(zhàn)勝對(duì)方。3 例:例:兩個(gè)兒童玩的兩個(gè)兒童玩的“石頭石頭剪子剪子布布”游戲游戲和我國古代的和我國古代的“齊王賽馬齊王賽馬”就是典型的對(duì)策論研就是典型的對(duì)策論研究的例子。究的例子。 在這類行為中,參加斗爭(zhēng)或競(jìng)爭(zhēng)的各方各自在這類行為中,參加斗爭(zhēng)或競(jìng)爭(zhēng)的各方各自具有不同的目標(biāo)和利益,為了達(dá)到各自的目標(biāo)和具有不同的目標(biāo)和利益,為了達(dá)到各自的目標(biāo)和利益各方必須考慮對(duì)手的各種可能的行動(dòng)方案,利益各方必須考慮對(duì)手的各種可能的行動(dòng)方案,并力圖選取對(duì)自己最為有利或最為合理的方案,并力圖選取對(duì)自己最為有利或最為合理的方案,對(duì)策論就是研究對(duì)策行為中斗爭(zhēng)各方是否存

4、在著對(duì)策論就是研究對(duì)策行為中斗爭(zhēng)各方是否存在著最合理的行動(dòng)方案,以及如何找到這個(gè)合理的行最合理的行動(dòng)方案,以及如何找到這個(gè)合理的行動(dòng)方案的數(shù)學(xué)理論和方法。動(dòng)方案的數(shù)學(xué)理論和方法。4二、二、對(duì)策問題的三個(gè)基本要素對(duì)策問題的三個(gè)基本要素 (1 1)局中人局中人:在一場(chǎng)競(jìng)賽或斗爭(zhēng)中,每一個(gè)有在一場(chǎng)競(jìng)賽或斗爭(zhēng)中,每一個(gè)有決策權(quán)的參與者決策權(quán)的參與者( (個(gè)人或集團(tuán)個(gè)人或集團(tuán)) )稱為一個(gè)局中人。只稱為一個(gè)局中人。只有兩個(gè)局中人的對(duì)策現(xiàn)象稱為有兩個(gè)局中人的對(duì)策現(xiàn)象稱為“兩人對(duì)策兩人對(duì)策”,而多,而多于兩個(gè)局中人的對(duì)策稱為于兩個(gè)局中人的對(duì)策稱為“多人對(duì)策多人對(duì)策”。 (2)策略策略:一個(gè)對(duì)策中,每個(gè)局中人

5、都有供他:一個(gè)對(duì)策中,每個(gè)局中人都有供他選擇的實(shí)際可行的完整的行動(dòng)方案,我們把一個(gè)局選擇的實(shí)際可行的完整的行動(dòng)方案,我們把一個(gè)局中人一個(gè)可行的自始至終通盤籌劃的行動(dòng)方案,稱中人一個(gè)可行的自始至終通盤籌劃的行動(dòng)方案,稱為這個(gè)局中人的一個(gè)為這個(gè)局中人的一個(gè)策略策略。如果在一個(gè)對(duì)策中,每。如果在一個(gè)對(duì)策中,每個(gè)局中人都只有有限個(gè)策略,則稱為個(gè)局中人都只有有限個(gè)策略,則稱為“有限對(duì)策問有限對(duì)策問題題”,否則稱為,否則稱為 “無限對(duì)策問題無限對(duì)策問題”。5 (3)贏得函數(shù)(支付函數(shù))贏得函數(shù)(支付函數(shù)):一局對(duì)策結(jié)束時(shí):一局對(duì)策結(jié)束時(shí)的結(jié)果(如收入或支出)稱為的結(jié)果(如收入或支出)稱為得失得失。每個(gè)局中

6、人在。每個(gè)局中人在一局對(duì)策結(jié)束時(shí)的得失,不僅與該局中人自身所選一局對(duì)策結(jié)束時(shí)的得失,不僅與該局中人自身所選擇的策略有關(guān),而且與全體局中人所取定的一組策擇的策略有關(guān),而且與全體局中人所取定的一組策略有關(guān)。所以,一局對(duì)策結(jié)束時(shí)每個(gè)局中人的略有關(guān)。所以,一局對(duì)策結(jié)束時(shí)每個(gè)局中人的“得得失失”是全體局中人所取定的一組策略的函數(shù),通常是全體局中人所取定的一組策略的函數(shù),通常稱作稱作贏得函數(shù)贏得函數(shù)(支付函數(shù))(支付函數(shù))。把每個(gè)局中人各自所。把每個(gè)局中人各自所取的一個(gè)策略所組成的策略組稱為取的一個(gè)策略所組成的策略組稱為“局勢(shì)局勢(shì)”,于是,于是“得失得失”是是“局勢(shì)局勢(shì)”的函數(shù)。的函數(shù)。6第二節(jié)第二節(jié) 矩

7、陣對(duì)策的基本定理矩陣對(duì)策的基本定理 特點(diǎn)特點(diǎn):局中人只有局中人只有兩人兩人,分別用分別用局中人局中人和和局局中人中人表示,表示,雙方都只有有限個(gè)策略可供選擇,雙方都只有有限個(gè)策略可供選擇, 局中人的局中人的“得失得失”相加等于零,這種對(duì)策稱為相加等于零,這種對(duì)策稱為“零和對(duì)策零和對(duì)策”。在兩人有限零和對(duì)策中,。在兩人有限零和對(duì)策中,局中人局中人的的所獲等于所獲等于局中人局中人的所失。假定在局勢(shì)的所失。假定在局勢(shì) (i, j )下下(即即局中人局中人取策略取策略i ,局中人局中人取策略取策略j 時(shí)所形成的局時(shí)所形成的局勢(shì)勢(shì)),局中人局中人的收入或贏得是的收入或贏得是ai j(“aij”是負(fù)數(shù)時(shí),

8、是負(fù)數(shù)時(shí),表示表示局中人局中人是支出)。是支出)。的策略集為:的策略集為: 的策略集為:的策略集為:112(,) mS212(,) nS一、矩陣對(duì)策的數(shù)學(xué)模型一、矩陣對(duì)策的數(shù)學(xué)模型7111212122212nnmmmnaaaaaaAaaa 用矩陣表示為用矩陣表示為(稱為稱為局中人局中人的的贏得矩陣贏得矩陣或局中人或局中人的的支付矩陣支付矩陣): 我們稱兩人有限零和對(duì)策為矩陣對(duì)策,我們稱兩人有限零和對(duì)策為矩陣對(duì)策,記為:記為:G G, , ;S S1 1,S,S2 2;AA 或或 G GSS1 1,S S2 2;AA。8例例1:設(shè)有設(shè)有矩陣對(duì)策矩陣對(duì)策,局中人,局中人的支付矩陣如下:的支付矩陣如

9、下: 7183241619305A 如果各局中人都不想冒險(xiǎn),必須考慮對(duì)方會(huì)如果各局中人都不想冒險(xiǎn),必須考慮對(duì)方會(huì)選擇策略使他得到最差的收入。因此各局中人都選擇策略使他得到最差的收入。因此各局中人都選擇理智的決策行為。選擇理智的決策行為。解:解: 3 3 1 4 39 局中人局中人的各種策略的最差收入是支付陣中各的各種策略的最差收入是支付陣中各種策略所對(duì)應(yīng)行的最小數(shù)。如果不存僥幸心理,他種策略所對(duì)應(yīng)行的最小數(shù)。如果不存僥幸心理,他對(duì)每個(gè)策略只能期望得到最差的收入。即:對(duì)每個(gè)策略只能期望得到最差的收入。即: 那么為了得到盡可能好的結(jié)局,只能從這些最那么為了得到盡可能好的結(jié)局,只能從這些最小數(shù)之中的

10、找最大者(小數(shù)之中的找最大者(最大的最小者最大的最小者),即選擇能),即選擇能在最差的可能結(jié)果中得到最好結(jié)果的策略。即:在最差的可能結(jié)果中得到最好結(jié)果的策略。即:min:ijja8,2,9,322max minmax 8,2, 9, 32ijjiaa即選擇策略即選擇策略2。10 同樣,局中人同樣,局中人的各種策略的最差收入(最的各種策略的最差收入(最大支出)是支付矩陣中各列的最大數(shù),即:大支出)是支付矩陣中各列的最大數(shù),即:局中人局中人選擇這些最大數(shù)中的最小者。即:選擇這些最大數(shù)中的最小者。即:max:ijia16,2,522min maxmin16,2,52ijjiaa即選擇策略即選擇策略2

11、。的最優(yōu)策略為的最優(yōu)策略為2, 的最優(yōu)策略為的最優(yōu)策略為2 。11 定義定義:設(shè)設(shè)G GSS1 1,S S2 2;AA為矩陣對(duì)策為矩陣對(duì)策, ,其中其中S S1 11 1,2 2, ,m m ,S S2 21 1,2 2, ,n n 。A=A=(aij) m mn n,若滿足等式若滿足等式:*max minmin maxijiji jjjiiaaa 則稱純局勢(shì)則稱純局勢(shì)(i i* *,j j* *) )為為G G在純策略下的解在純策略下的解(或平衡局勢(shì))。記(或平衡局勢(shì))。記V VG Gai i* *j j* *,稱,稱V VG G為對(duì)策為對(duì)策G G的值的值, , i i* *,j j* *分

12、別稱為局中人分別稱為局中人I I、IIII的最優(yōu)純策略。的最優(yōu)純策略。 例例1的對(duì)策的對(duì)策G G的解為的解為(2 2,2 2),),2 2,2 2分別是局中人分別是局中人I I和和IIII的最優(yōu)純策略,的最優(yōu)純策略, V VG G =2 =2。 從例從例1 1中可以看出,矩陣的元素中可以看出,矩陣的元素a2222既是所在行既是所在行的最小元素,又是所在列的最大元素,即:的最小元素,又是所在列的最大元素,即:12 定理定理1:矩陣對(duì)策矩陣對(duì)策A =(aij) m mn n有解的充分必要有解的充分必要條件是:條件是: 存在存在純局勢(shì)純局勢(shì)(i i* *,j j* *) ),使得對(duì)一切使得對(duì)一切 i

13、=1,2,i=1,2,m,j=1,2,m,j=1,2,n,n均有均有:2222ijaaai=1,2,3,4;j=1,2,3 將這一事實(shí)推廣到一般矩陣對(duì)策,可得如下定理:將這一事實(shí)推廣到一般矩陣對(duì)策,可得如下定理:證明:證明:先證充分性,由于對(duì)任意先證充分性,由于對(duì)任意i,j均有:均有: 故:故:jijiijaaa*jijiijaaa*jijjiijiaaa*minmax13另一方面,對(duì)任意另一方面,對(duì)任意i,j均有:均有:所以:所以:minmaxmaxmin(1)ijijjjiiaa于是:于是:所以:所以:minmaxijijijjiaaamaxminmaxijijjiiaamaxminmin

14、max(2)ijijjjiiaa*max minmin maxijiji jjjiiaaa*maxmaxminjiijiijijaaaijjijijjiaaaminmaxmin*14再證必要性,若再證必要性,若G有解。有解。而對(duì)于所有的而對(duì)于所有的 i 而言,必存在一個(gè)而言,必存在一個(gè)i*使:使:對(duì)于所有的對(duì)于所有的 j 而言,必存在一個(gè)而言,必存在一個(gè)j*使:使:*max minminiji jjjiaa*min maxmaxijijjiiaamax minmin maxijijjjiiaa因?yàn)椋阂驗(yàn)椋?maxminiji jjiaa于是:于是:15稱滿足條件稱滿足條件 的的 (i*, j*

15、 )為矩陣對(duì)策為矩陣對(duì)策G的一個(gè)的一個(gè)鞍點(diǎn)鞍點(diǎn)。但:但:于是有:于是有:*maxminiji ji jjiaaa=故對(duì)一切的故對(duì)一切的 i ,j 都有:都有: 意義:意義:如果如果局中人局中人I I選擇策略選擇策略i* ,局中人局中人IIII不不選擇策略選擇策略 j* ,而選擇策略,而選擇策略j,則,則局中人局中人IIII的支付的支付只會(huì)增多。也就是說:策略只會(huì)增多。也就是說:策略j*是是IIII的最優(yōu)策略。的最優(yōu)策略。jijjiijiaaa*minmaxjijiijaaa*jijiijaaa*16 注意:注意:一個(gè)矩陣對(duì)策一個(gè)矩陣對(duì)策G如果存在鞍點(diǎn),鞍點(diǎn)如果存在鞍點(diǎn),鞍點(diǎn)可能不止一個(gè)。但是在

16、不同的鞍點(diǎn)處,支付值相可能不止一個(gè)。但是在不同的鞍點(diǎn)處,支付值相等,都等于對(duì)策的值。(等,都等于對(duì)策的值。(無差異性無差異性) 如果如果(i , j ) 以及以及(k , l l)都是對(duì)策都是對(duì)策G的鞍的鞍點(diǎn),則點(diǎn),則(k , j ) 與與(i , l l)也是該問題的鞍點(diǎn)。也是該問題的鞍點(diǎn)。(可交換性可交換性) 同樣,如果同樣,如果局中人局中人IIII選擇策略選擇策略j* ,局中人局中人I I不選擇策略不選擇策略 i* ,而選擇策略,而選擇策略 i,則,則局中人局中人I I的所獲只會(huì)減少。也就是說:策略的所獲只會(huì)減少。也就是說:策略i*是是局中人局中人I I的最優(yōu)策略。的最優(yōu)策略。17G有四

17、個(gè)鞍點(diǎn):有四個(gè)鞍點(diǎn):12143234(,), (,), (,), (,) 對(duì)策的值為對(duì)策的值為V VG G 5。例例2:給定矩陣對(duì)策給定矩陣對(duì)策G GSS1 1,S S2 2;AA,其中:,其中:*123412*34 min65651421-1 857502620 max 8 7 55 55A18 矩陣對(duì)策矩陣對(duì)策G有鞍點(diǎn)時(shí),就存在最優(yōu)解有鞍點(diǎn)時(shí),就存在最優(yōu)解(最優(yōu)純最優(yōu)純策略策略),但是否一切矩陣對(duì)策問題中,各局中人都,但是否一切矩陣對(duì)策問題中,各局中人都有上述意義的最優(yōu)純策略呢有上述意義的最優(yōu)純策略呢?答案是否定的。答案是否定的。例例1:石頭、剪刀、布石頭、剪刀、布011101110Ama

18、xmin1minmax1ijijjjiiaa 不存在上述純策略意義下的解。不存在上述純策略意義下的解。19 對(duì)于該例而言,直觀的看:雙方采用三個(gè)純對(duì)于該例而言,直觀的看:雙方采用三個(gè)純策略的頻率均應(yīng)為策略的頻率均應(yīng)為 13 :13 :13。由于。由于每個(gè)局中人在一局對(duì)策中必取某個(gè)純策略,因此每個(gè)局中人在一局對(duì)策中必取某個(gè)純策略,因此采取任何一個(gè)純策略的概率都應(yīng)是采取任何一個(gè)純策略的概率都應(yīng)是13。 一般地,設(shè)局中人一般地,設(shè)局中人I I以概率以概率x1 , x2 , ,xm來分來分別選取他的純策略別選取他的純策略1 1,2 2,m m ;而局中人;而局中人IIII以概率以概率y1 , y2 ,

19、 ,yn來選用自己的純策略來選用自己的純策略1 1,2 2,n n 。于是:。于是:令令x = ( x1 , x2 , ,xm)T , y = ( y1 , y2 , ,yn)T 則稱這樣的則稱這樣的x和和y為為局中人局中人I I、IIII的的混合策略混合策略。10, 10, 1, 111jinjjmiiyxyx20*11 |1 , 01miiiSxxx*21 |1,01njjjSyyy記:記: 此時(shí),當(dāng)局中人此時(shí),當(dāng)局中人I I以概率以概率 xi采用采用i 時(shí),局中人時(shí),局中人IIII以概率以概率 yj 采用采用 j 時(shí)時(shí) ,支付,支付 ai j 出現(xiàn)的概率為出現(xiàn)的概率為xi yj 。于是局

20、中人于是局中人I I收入(贏得)的期望值為:收入(贏得)的期望值為:1111( ,)mnmnTijijijijijijE x ya x yx Aya x y或 則稱則稱 G GSS1 1,S S2 2;EE為為 G GSS1 1,S S2 2;AA的的混合擴(kuò)充?;旌蠑U(kuò)充。21混合策略對(duì)策矩陣可表示如下:混合策略對(duì)策矩陣可表示如下:111212122212nnmmmnaaaaaaaaa12nyyy12mxxx 混合策略問題的解也是以混合策略問題的解也是以最大最小最大最小化化和和最最小最大化小最大化標(biāo)準(zhǔn)為根據(jù)的。標(biāo)準(zhǔn)為根據(jù)的。22 當(dāng)局中人當(dāng)局中人I I選擇某個(gè)混合策略選擇某個(gè)混合策略 x 時(shí),對(duì)

21、于局中人時(shí),對(duì)于局中人IIII的任意選擇的任意選擇 y, I I的期望所獲至少是:的期望所獲至少是: 于是局中人于是局中人I I希望選擇希望選擇x,使上式最大,保證局,使上式最大,保證局中人中人I I的期望所獲不小于:的期望所獲不小于:max min( , )yxE x y 這就是局中人這就是局中人I I的的最大最小化標(biāo)準(zhǔn)最大最小化標(biāo)準(zhǔn)。 同理:當(dāng)局中人同理:當(dāng)局中人IIII選擇某個(gè)混合策略選擇某個(gè)混合策略 y 時(shí),對(duì)時(shí),對(duì)于于I I的任意選擇的任意選擇 x,IIII的期望支付至多是:的期望支付至多是: 于是局中人于是局中人IIII希望選擇希望選擇 y,使上式最小,保證,使上式最小,保證局中人

22、局中人IIII的期望支付不多于:的期望支付不多于:min max( , )yxE x y這就是局中人這就是局中人IIII的的最小最大化標(biāo)準(zhǔn)最小最大化標(biāo)準(zhǔn)。min( , )yE x ymax( , )xE x y23例例1:求解矩陣對(duì)策求解矩陣對(duì)策G GSS1 1,S S2 2;AA ,其中:,其中:1342A13(,)( ,1)421TyE X YXA Yxxy115=4224242xyxyxy 如果令:如果令: 則得問題的最優(yōu)解。則得問題的最優(yōu)解。11,24xy解:解:設(shè)設(shè) X= ( x, 1x )T , Y= ( y, 1y )T *1/ 21/ 4,.1/ 23/ 4XY*5(,)2E

23、XY且對(duì)策的值為:且對(duì)策的值為:24另解另解: (用微分求極值的方法)(用微分求極值的方法)(,)422 E X Yxyxy :(,)410E X Yyx 令(, )420E X Yxy 11:,24xy得*1/ 21/ 4,.1/ 23/ 4XY*5(,)2E XY且對(duì)策的值為:且對(duì)策的值為:25 定義定義 : G GSS1 1,S,S2 2;EE為為矩陣對(duì)策矩陣對(duì)策G GSS1 1,S,S2 2;AA的混合擴(kuò)充的混合擴(kuò)充,若存在,若存在( (x* *,y,y* *) )滿足等式滿足等式:*max min( ,)min max( ,)(,)yyxxE x yE x yE xy則稱則稱( (x

24、* *,y,y* *) )為為G G在混合策略下的解。稱在混合策略下的解。稱V VG GE ( (x* *,y,y* *) ) 為為對(duì)策對(duì)策G G的值的值, , x* *,y,y* *分別稱為分別稱為I I、IIII的最優(yōu)混合策略。的最優(yōu)混合策略。 定理定理2:混合策略混合策略 x*和和 y*是是G的解的充分必要條的解的充分必要條件是:對(duì)一切混合策略件是:對(duì)一切混合策略 x, y有:有:稱稱( x* , y*)是對(duì)策問題在混合策略意義下的鞍點(diǎn)。是對(duì)策問題在混合策略意義下的鞍點(diǎn)。yxEyxEyxE*,*,*,26當(dāng)局中人當(dāng)局中人I I 取純策略取純策略i時(shí),記其贏得函數(shù)為時(shí),記其贏得函數(shù)為( ,

25、 )E i y于是于是1( , )nijjjE i ya y三、矩陣對(duì)策的基本定理三、矩陣對(duì)策的基本定理當(dāng)局中人當(dāng)局中人IIII取純策略取純策略j時(shí),記其贏得函數(shù)為時(shí),記其贏得函數(shù)為( , )E x j1( , )mijiiE x ja x于是于是27則有:則有: 定理定理3:混合策略混合策略 x*和和 y*是是G的解的充分必要條的解的充分必要條件是:對(duì)任意的件是:對(duì)任意的i, j有:有:11111( , )( , )mnmnmijijijjiiijijiE x ya x ya yxE i y x 11111( , )( , )mnnmnijijijijjijjijE x ya x ya xy

26、E x j y 3*,*,*,jxEyxEyiE28則則*11( ,)( ,)(,)(,)mmiiiiE x yE i y xE xyxE xy證明:證明:必要性顯然,只需證充分性,若對(duì)任意必要性顯然,只需證充分性,若對(duì)任意i,j均有:均有:*11(, )(, )(,)(,)mnjjijE xyE x i yE xyyE xy即:即:所以所以x*和和 y*是是G的解。的解。jxEyxEyiE*,*,*,yxEyxEyxE*,*,*,29注意到:注意到:可以寫成:可以寫成:于是于是定理定理3可以改述為:可以改述為: 定理定理4:矩陣對(duì)策矩陣對(duì)策GS1,S2;A有解的充要條件有解的充要條件是存在數(shù)

27、是存在數(shù)v,使得,使得 x, y 分別是下述兩個(gè)不等式組的解:分別是下述兩個(gè)不等式組的解: 11(1,2, )1,04mijiimiiijna xvxx 11(1,2,)1,05nijjjnjjjima yvyyjxEyxEyiE*,*,*,vyayiEnjjij1*,vxajxEmiiij1*,30 定理定理5:(對(duì)策基本定理對(duì)策基本定理)任何矩陣對(duì)策)任何矩陣對(duì)策G G在混合在混合策略下一定有解。策略下一定有解。證明:證明:由由定理定理3,只需證明存在混合策略,只需證明存在混合策略 x*和和 y*,使得(使得(3)式成立,為此考慮如下兩個(gè)線性規(guī)劃:)式成立,為此考慮如下兩個(gè)線性規(guī)劃:11(

28、1,2, )max( )1,0mijiimiiijnwa xwPxx11(1,2,)min( )1,0nijjjnjjjimva yvDyy31容易驗(yàn)證(容易驗(yàn)證(P)和()和(D)是互為對(duì)偶規(guī)劃,而且)是互為對(duì)偶規(guī)劃,而且 是(是(P)的一個(gè)可行解,)的一個(gè)可行解,1(1,0,0),minTjixwa是是(D)的一個(gè)可行解,由線性規(guī)劃對(duì)偶理論可知,的一個(gè)可行解,由線性規(guī)劃對(duì)偶理論可知,(P)和和(D)是都存在最優(yōu)解是都存在最優(yōu)解( x*,w*) 和和(y*,v*) ,且最優(yōu),且最優(yōu)值值w*= v*,即,即:i=1i=1,2,2,m , j=1,m , j=1,2,2,n .,n .1(1,0

29、,0),maxTiiyva*11( ,)(,)nmijjijijiE i ya yva xE xj32又由:又由:可得:可得:*11(,)( ,)mmiiiiE xyE i yxvxv*11(,)(, )mnjjijE xyE xi yvyv*(,)vE xy 定理定理5的證明是構(gòu)造性的證明,同時(shí)給出了求解的證明是構(gòu)造性的證明,同時(shí)給出了求解方法。方法。33 定理定理6:設(shè)(設(shè)(x*, y*)是矩陣對(duì)策)是矩陣對(duì)策G G解,解,v =V=VG G,則,則1111100*( ),(2)y,(3),0(4),y0niijjjmjijiinijjijmijijixa yva xva yvxa xv若

30、若則則若若則則若若則則若若則則=34矩陣對(duì)策矩陣對(duì)策G GSS1 1,S S2 2;AA。(1)若)若(即(即A中第中第k行的每個(gè)元素行的每個(gè)元素 A中第中第 l 行的每個(gè)元素)行的每個(gè)元素)稱局中人稱局中人I I的策略的策略k優(yōu)超于策略優(yōu)超于策略 l ;則可在;則可在A中中去掉第去掉第 l 行行,矩陣對(duì)策矩陣對(duì)策G G的解不變。的解不變。(2)如果:)如果:(即(即A中第中第k列的每個(gè)元素列的每個(gè)元素 A中第中第l列的每個(gè)元素)列的每個(gè)元素)稱局中人稱局中人IIII的策略的策略k 優(yōu)超于策略優(yōu)超于策略l 。則可在。則可在A中中去掉第第去掉第第 l 列列,矩陣對(duì)策矩陣對(duì)策G G的解不變。的解不

31、變。優(yōu)超定理:優(yōu)超定理:njaaljkj, 2 , 1miaailik, 2 ,aaAaa則稱則稱G G為為 若若G沒有純沒有純策略下的解,策略下的解,則則G的的最優(yōu)混合策最優(yōu)混合策略略x* *= ( x1, x2 )T , y y* * = ( y1, y2 )T 滿足下列方程組:滿足下列方程組:11 121 212 122212( ):1a xa xvIa xa xvxx11112221122212():1a ya yvIIa ya yvyy且其中且其中v =V=VG G . .36例例1:求解求解矩陣對(duì)策求解求解矩陣對(duì)策G GSS1 1,S S2 2;AA ,其

32、中:其中:解:解:在在A中由于:中由于:第第3行行第第2行行, 第第4行行第第1行行,因此從因此從A中中劃去劃去1,2兩行兩行,得:,得:3403050259739594687460883A37在在A1中由于:中由于:第第1列列第第3列列, 第第2列列第第4列列,因此從因此從A1中中劃去劃去3,4兩列兩列,得:得:在在A2中由于:中由于:第第1行行第第3行行,因此從因此從A2中中劃去第劃去第3行行,得:,得:1739594687460883A2739464603A3739464A在在A3中由于:中由于:第第2列列第第3列列,因此從因此從A3中中劃去第劃去第3列列,得:,得:3847346A分別

33、求解方程組得:分別求解方程組得:得得 x3=1/3 , x4 =2/3, y1=1/2 , y2 =1/2 ,v = 5.34343474( ): 361xxvIxxvxx12121273(): 461yyvIIyyvyy*1 2110, 0, 0,0,0, 0,53 322TTGxyV由此對(duì)于原問題由此對(duì)于原問題A而言,最優(yōu)解為:而言,最優(yōu)解為:39解:解:設(shè)局中人設(shè)局中人I I 的的混合策略為混合策略為( x, 1x )T , 局中人局中人I I 的最少得益為如下圖中由局中人的最少得益為如下圖中由局中人IIII 選擇選擇1 1,2 2,3 3 時(shí)所確定的三條直線時(shí)所確定的三條直線2 x 7

34、(1x)v, 3 x 5(1x)v,11x 2(1x)v在在x處縱坐標(biāo)的處縱坐標(biāo)的最小者,即如最小者,即如圖中折線圖中折線B B1 1BBBB2 2B B3 3。例例2:求解求解矩陣對(duì)策求解求解矩陣對(duì)策G GSS1 1,S S2 2;AA ,其中:,其中:2311752A40012511237xVV3 31 12 2B B1 1B BB B2 2B B3 3A 所以對(duì)局中人所以對(duì)局中人I I來說,他來說,他的的策略就是確定策略就是確定x使他使他的得益達(dá)到最大。按最大最小原則應(yīng)選擇的得益達(dá)到最大。按最大最小原則應(yīng)選擇xOA,而而AB即為對(duì)策的值。為求出即為對(duì)策的值。為求出x和對(duì)策的值和對(duì)策的值

35、V VG G ,可,可聯(lián)立過聯(lián)立過B點(diǎn)的兩條直線點(diǎn)的兩條直線2 2和和3 3所確定的方程。所確定的方程。41解得:解得: x 3/11, V VG G=49/11。此外從圖中可看出,局中人此外從圖中可看出,局中人IIII的最的最優(yōu)策略只由優(yōu)策略只由2 2和和3 3組成(不選組成(不選1 1),可由方程組所確定:),可由方程組所確定:35(1)112(1)GGxxVxxV23232331149/115249/111yyyyyy解得:解得: y y2 2=9/11,y y3 3 =2/11。所以最優(yōu)解為:所以最優(yōu)解為:*3/118/11,09/111/11,49/11TTGxyV42例例3:求解矩

36、陣對(duì)策求解矩陣對(duì)策GS1,S2;A,其中:,其中:2796112A 解:解:設(shè)局中人設(shè)局中人IIII 的的混合策略為混合策略為( y, 1y )T , 局中人局中人II 的最大支付為如下圖中由局中人的最大支付為如下圖中由局中人 I I選擇選擇1 1, ,2 2, , 3 3 時(shí)所確定的三條直線時(shí)所確定的三條直線2y7(1y)v,9y6(1y)v,11y2(1y)v在在y處縱坐標(biāo)的處縱坐標(biāo)的最小者,即如圖最小者,即如圖中折線上的中折線上的B B點(diǎn)。點(diǎn)。43012611297yVVB BA A1 12 23 3 對(duì)局中人對(duì)局中人IIII來說,他來說,他的的策略就是確定策略就是確定y使他的使他的支付

37、達(dá)到最小。按最小最大原則應(yīng)選擇支付達(dá)到最小。按最小最大原則應(yīng)選擇y OA,為求出為求出y和對(duì)策的值和對(duì)策的值 V VG G ,可聯(lián)立過,可聯(lián)立過B 點(diǎn)的兩條直線點(diǎn)的兩條直線1 1和和2 2所確定的方程。所確定的方程。4427(1)96(1)GGyyVyyV解得:解得: y 1/8, V VG G=51/8。 此外從圖中可看出,局中人此外從圖中可看出,局中人IIII的最的最優(yōu)策略只由優(yōu)策略只由1 1和和2 2組成(不選組成(不選3 3),可由方程組所確定:),可由方程組所確定:1212122951/87651/81xxxxxx解得:解得: x1 1=3/8,x2 2 =5/8。所以最優(yōu)解為:所以

38、最優(yōu)解為:*3 / 85 / 80,1/ 87 / 8,51/ 8TTGxyV45由前面定理可知,對(duì)策由前面定理可知,對(duì)策G的解滿足下列線性規(guī)劃:的解滿足下列線性規(guī)劃:11(1,2, )max( )1,0mijiimiiijnwa xwPxx11(1,2,)min( )1,0nijjjnjjjimva yvDyy作變量替換:作變量替換:(1,2,;1,2, ),jiijim jnyxxyvv46111111,mmnnjiijiijjyxxyvvvv則則于是上述于是上述線性規(guī)劃線性規(guī)劃等價(jià)于下面的線性規(guī)劃問題。等價(jià)于下面的線性規(guī)劃問題。11(1,2, )min10miimijiiijnzxa x

39、x11(1,2,)max10njjnijjjjimwya yy 由此求解一個(gè)對(duì)策問題,就相當(dāng)于求解上面的由此求解一個(gè)對(duì)策問題,就相當(dāng)于求解上面的對(duì)偶問題:對(duì)偶問題:47例例4:利用線性規(guī)劃法求解矩陣對(duì)策利用線性規(guī)劃法求解矩陣對(duì)策G GSS1 1,S,S2 2;A.A.【注注】如果如果ai j不滿足非負(fù)性,則存在一個(gè)正數(shù)不滿足非負(fù)性,則存在一個(gè)正數(shù)k,使得使得ai j +k0 令令B =(bi j ) =(ai j +k),求解對(duì)策問題,求解對(duì)策問題 SS1 1,S S2 2;BB ,可以證明:?jiǎn)栴},可以證明:?jiǎn)栴}SS1 1,S S2 2;BB與問題與問題SS1 1,S S2 2;AA的最優(yōu)策略

40、相同,且有:的最優(yōu)策略相同,且有:*(,)(,)ABExyExyk121210102A 其中:其中:48解:解:1012012320ijBa令建立相應(yīng)的線性規(guī)劃模型建立相應(yīng)的線性規(guī)劃模型123132312123min z 31 21.2 1 ,0 xxxxxxxs txxxxx 123132312123max 1 21.32 1 ,0wyyyyyyys tyyyyy 及及用單純形法求解后一個(gè)問題,先標(biāo)準(zhǔn)化為:用單純形法求解后一個(gè)問題,先標(biāo)準(zhǔn)化為:49123456134235126123456max 1 2 1.32 1 ,0wyyyyyyyyyyyys tyyyyyyyyy 用單純形表用單純形

41、表求解求解如下:如下:5051156 65vv*611320, , 0, , 52355TTx*6 1123, 0, , 0, 5 3255TTy由此最優(yōu)解為:由此最優(yōu)解為:123115 , 0, ,326yyyw123110 , , 23xxx64255Gv 52 例例1:“囚徒困境囚徒困境” 甲乙是同案囚犯,被隔甲乙是同案囚犯,被隔離審訊。如果兩個(gè)都抵賴,因?yàn)樽C據(jù)不充分,兩離審訊。如果兩個(gè)都抵賴,因?yàn)樽C據(jù)不充分,兩人都只能判人都只能判1年。如果只有一方坦白,則無罪釋放;年。如果只有一方坦白,則無罪釋放;而另一方則屬抗拒從嚴(yán),判而另一方則屬抗拒從嚴(yán),判10年。但如果兩人都年。但如果兩人都坦白

42、,則各判坦白,則各判5年。年。 下表給出了下表給出了“囚徒困境囚徒困境”博弈問題的戰(zhàn)略式表述,博弈問題的戰(zhàn)略式表述,為了實(shí)現(xiàn)各自的效用最大化,雙方格采取何種策略呢為了實(shí)現(xiàn)各自的效用最大化,雙方格采取何種策略呢? 53 假設(shè)該博弈是一次性的,對(duì)于囚犯甲而言,不假設(shè)該博弈是一次性的,對(duì)于囚犯甲而言,不管乙選擇坦白還是抵賴,他選擇坦白都比選擇抵賴管乙選擇坦白還是抵賴,他選擇坦白都比選擇抵賴更好。這種不管對(duì)方選擇何種策略,局中人的最優(yōu)更好。這種不管對(duì)方選擇何種策略,局中人的最優(yōu)選擇總是不變的那個(gè)策略被稱為該局中人的選擇總是不變的那個(gè)策略被稱為該局中人的優(yōu)超策優(yōu)超策略略。此例中坦白為甲的優(yōu)超策略,同樣道

43、理坦白也。此例中坦白為甲的優(yōu)超策略,同樣道理坦白也是乙的優(yōu)超策略。結(jié)果是,兩個(gè)囚徒爭(zhēng)先恐后地都是乙的優(yōu)超策略。結(jié)果是,兩個(gè)囚徒爭(zhēng)先恐后地都選擇坦白,各判刑選擇坦白,各判刑5年。從而年。從而(坦白,坦白坦白,坦白)也就構(gòu)成也就構(gòu)成了該博弈的優(yōu)超策略均衡(稱為了該博弈的優(yōu)超策略均衡(稱為納什均衡納什均衡)。)。54 囚犯困境反映了一個(gè)深刻的問題,這就是囚犯困境反映了一個(gè)深刻的問題,這就是個(gè)人理個(gè)人理性性與與集體理性集體理性的矛盾,如果兩個(gè)人都抵賴,對(duì)局中人的矛盾,如果兩個(gè)人都抵賴,對(duì)局中人組成的集體而言,可謂組成的集體而言,可謂帕累托最優(yōu)帕累托最優(yōu),但是這并不滿足,但是這并不滿足個(gè)人理性導(dǎo)致的納什

44、均衡個(gè)人理性導(dǎo)致的納什均衡(坦白,坦白坦白,坦白),因而,這個(gè),因而,這個(gè)帕累托改進(jìn)在靜態(tài)博弈中辦不到。囚徒困境說明納什帕累托改進(jìn)在靜態(tài)博弈中辦不到。囚徒困境說明納什均衡并不一定導(dǎo)致帕累托最優(yōu),從而動(dòng)搖了傳統(tǒng)經(jīng)濟(jì)均衡并不一定導(dǎo)致帕累托最優(yōu),從而動(dòng)搖了傳統(tǒng)經(jīng)濟(jì)學(xué)中學(xué)中個(gè)人效用最大化行為必然導(dǎo)致社會(huì)福利最優(yōu)個(gè)人效用最大化行為必然導(dǎo)致社會(huì)福利最優(yōu)的基的基本命題。本命題。 對(duì)囚犯困境問題作進(jìn)一步分析,不難發(fā)現(xiàn),盡對(duì)囚犯困境問題作進(jìn)一步分析,不難發(fā)現(xiàn),盡管甲與乙各自的最佳選擇都是坦白,如果雙方均選管甲與乙各自的最佳選擇都是坦白,如果雙方均選擇抵賴,各判刑擇抵賴,各判刑1年,顯然比雙方均坦白時(shí)答判刑年,顯

45、然比雙方均坦白時(shí)答判刑5年的結(jié)局要好,因此,其最佳選擇與最優(yōu)結(jié)局并不年的結(jié)局要好,因此,其最佳選擇與最優(yōu)結(jié)局并不一致。出現(xiàn)所謂的一致。出現(xiàn)所謂的“囚徒困境囚徒困境”。55 設(shè)對(duì)策設(shè)對(duì)策G的的局中人局中人和和,雙方都只有有限個(gè)策,雙方都只有有限個(gè)策略,其中略,其中 在局勢(shì)在局勢(shì) (i, j )下下(即局中人即局中人取策略取策略,局中人,局中人取策略取策略j 時(shí)所形成的策略組合時(shí)所形成的策略組合),局中人,局中人的贏得值的贏得值是是ai j,局中人,局中人的的贏得值是贏得值是bij。分別用矩陣表示為。分別用矩陣表示為A和和B。的策略集為:的策略集為: 的策略集為:的策略集為:112(,)mS212

46、(,)nS非合作兩人對(duì)策非合作兩人對(duì)策56 定義:定義:對(duì)于非合作兩人對(duì)策對(duì)于非合作兩人對(duì)策G,如果,如果i i* *是局是局中人中人對(duì)對(duì)的策略的策略j j* *的的最優(yōu)策略,最優(yōu)策略,j j* *是局中人是局中人對(duì)對(duì)的策略的策略i i* *的的最優(yōu)策略,則稱局勢(shì)最優(yōu)策略,則稱局勢(shì)(i i* *,j j* *) )是該問題的一個(gè)是該問題的一個(gè)納什均衡納什均衡(即誰都不愿單獨(dú)(即誰都不愿單獨(dú)改變策略)改變策略) 。57 本博弈的本博弈的納什均衡納什均衡為為(大豬按,小豬等待大豬按,小豬等待)。 例例2:“智豬博弈智豬博弈” 豬圈有一頭大豬、一頭小豬,豬圈有一頭大豬、一頭小豬,按一下按鈕會(huì)有按一下

47、按鈕會(huì)有10個(gè)單位的飼料,但按按鈕需要個(gè)單位的飼料,但按按鈕需要2個(gè)個(gè)單位成本。單位成本。58 例例3:“夫妻博弈夫妻博弈” 丈夫喜歡看球賽,妻子喜歡丈夫喜歡看球賽,妻子喜歡逛商場(chǎng)。他們都寧愿在一起,也不愿分開行動(dòng)。逛商場(chǎng)。他們都寧愿在一起,也不愿分開行動(dòng)。 本例有兩個(gè)本例有兩個(gè)納什納什均衡結(jié)果會(huì)出現(xiàn),要么一起均衡結(jié)果會(huì)出現(xiàn),要么一起去看球賽,要么一起去逛商場(chǎng),但在一次博弈中去看球賽,要么一起去逛商場(chǎng),但在一次博弈中究竟會(huì)出現(xiàn)哪一種?究竟會(huì)出現(xiàn)哪一種?59 這個(gè)博弈也有兩個(gè)這個(gè)博弈也有兩個(gè)納什納什均衡,一個(gè)是均衡,一個(gè)是(進(jìn)攻,退進(jìn)攻,退卻卻),另一個(gè)是,另一個(gè)是(退卻,進(jìn)攻退卻,進(jìn)攻)。 例

48、例4 :“斗雞博弈斗雞博弈” 有兩個(gè)斗雞有兩個(gè)斗雞A、B,它們各,它們各有兩個(gè)策略:進(jìn)攻或退卻。有兩個(gè)策略:進(jìn)攻或退卻。60( 0,300 )(0,300 )不進(jìn)入不進(jìn)入2( 10, 0 )( 40 , 50 )進(jìn)入進(jìn)入1阻撓阻撓2默許默許1 進(jìn)入者進(jìn)入者在位者在位者 這個(gè)博弈也有兩個(gè)納什均衡,一個(gè)是這個(gè)博弈也有兩個(gè)納什均衡,一個(gè)是(進(jìn)入,進(jìn)入,默許默許),另一個(gè)是,另一個(gè)是(不進(jìn)入,斗爭(zhēng)不進(jìn)入,斗爭(zhēng)),而,而(不進(jìn)入,默不進(jìn)入,默許許)卻不是一個(gè)納什均衡。卻不是一個(gè)納什均衡。 例例5: “市場(chǎng)進(jìn)入壁壘市場(chǎng)進(jìn)入壁壘” 設(shè)想一個(gè)壟斷企業(yè)已占設(shè)想一個(gè)壟斷企業(yè)已占領(lǐng)市場(chǎng)領(lǐng)市場(chǎng)(稱為稱為“在位者在位者

49、”),另一個(gè)企業(yè)很想進(jìn)入市場(chǎng),另一個(gè)企業(yè)很想進(jìn)入市場(chǎng)(稱為稱為“進(jìn)入者進(jìn)入者”),在位者想保持其壟斷地位,就要,在位者想保持其壟斷地位,就要阻撓進(jìn)入者進(jìn)入假定雙方在各種策賂組合下的贏阻撓進(jìn)入者進(jìn)入假定雙方在各種策賂組合下的贏得短陣如表所示:得短陣如表所示:61非合作兩人對(duì)策的解法非合作兩人對(duì)策的解法 對(duì)其他局中人的任一策略組合,找出對(duì)其他局中人的任一策略組合,找出局中人局中人i的的最佳策略最佳策略,并在其,并在其得益得益值下值下劃線劃線。若存在一個(gè)。若存在一個(gè)策略組合,使得所有局中人的得益值下都劃了線,策略組合,使得所有局中人的得益值下都劃了線,則該策略組合就是一個(gè)則該策略組合就是一個(gè)納什均衡

50、納什均衡。求納什均衡的方法如下求納什均衡的方法如下:62例例1:囚犯困境囚犯困境(1,1 )(10,0 )抵賴抵賴2( 0, 10 )( 5 , 5 )坦白坦白1抵賴抵賴2坦白坦白1 甲甲乙乙因此因此(坦白,坦白坦白,坦白) 構(gòu)成了該博弈的納什均衡。構(gòu)成了該博弈的納什均衡。63例例3:夫妻博弈夫妻博弈 這個(gè)博弈有兩個(gè)這個(gè)博弈有兩個(gè)納什均衡納什均衡,一個(gè)是,一個(gè)是(看球賽,看球賽,看球賽看球賽),另一個(gè)是,另一個(gè)是(逛商場(chǎng),逛商場(chǎng)逛商場(chǎng),逛商場(chǎng))。64( 0,300 )(0,300 )不進(jìn)入不進(jìn)入2( 10, 0 )( 40 , 50 )進(jìn)入進(jìn)入1阻撓阻撓2默許默許1 進(jìn)入者進(jìn)入者在位者在位者例

51、例5: 市場(chǎng)進(jìn)入壁壘市場(chǎng)進(jìn)入壁壘 因此因此(進(jìn)入,默許進(jìn)入,默許)和和 (不進(jìn)入,阻撓不進(jìn)入,阻撓)是該是該問題的兩個(gè)鈉什均衡。問題的兩個(gè)鈉什均衡。65混合策略納什均衡混合策略納什均衡 上面介紹了在純策略意義下非合作兩人對(duì)策上面介紹了在純策略意義下非合作兩人對(duì)策納什均衡的概念及求解方法,但有些對(duì)策不存在納什均衡的概念及求解方法,但有些對(duì)策不存在純策略意義下的納什均衡,考慮下面的例子。純策略意義下的納什均衡,考慮下面的例子。 66( 0,0 )(1,1 )不救濟(jì)不救濟(jì)2( 1, 3 )( 3 , 2 )救濟(jì)救濟(jì)1游蕩游蕩2尋找工作尋找工作1 政府政府流浪漢流浪漢 例例6: 局中人是政府和一個(gè)流浪

52、漢,流浪漢有局中人是政府和一個(gè)流浪漢,流浪漢有兩個(gè)策略:尋找工作或游蕩;政府也有兩個(gè)策略:兩個(gè)策略:尋找工作或游蕩;政府也有兩個(gè)策略:救濟(jì)或不救濟(jì)。政府幫助流浪漢的前提是后者必須救濟(jì)或不救濟(jì)。政府幫助流浪漢的前提是后者必須試圖尋找工作;否則,政府不予以幫助;而流浪漢試圖尋找工作;否則,政府不予以幫助;而流浪漢只在得不到救濟(jì)時(shí)才會(huì)尋找工作,如表給出了對(duì)策只在得不到救濟(jì)時(shí)才會(huì)尋找工作,如表給出了對(duì)策的贏得雙矩陣:的贏得雙矩陣:67 同樣局中人可以考慮按照一定的隨機(jī)方式來確同樣局中人可以考慮按照一定的隨機(jī)方式來確定一個(gè)策略組合的混合策略。每個(gè)局中人作出決策定一個(gè)策略組合的混合策略。每個(gè)局中人作出決策

53、時(shí),不是只選用一個(gè)純策略,而是按照預(yù)先確定的時(shí),不是只選用一個(gè)純策略,而是按照預(yù)先確定的一組概率來選取他們所有可能采用的策略。一組概率來選取他們所有可能采用的策略。 容易理解:當(dāng)流浪漢選擇尋找工作時(shí),政府的最容易理解:當(dāng)流浪漢選擇尋找工作時(shí),政府的最優(yōu)策略是救濟(jì);當(dāng)流浪者選擇游蕩時(shí),政府的最優(yōu)策優(yōu)策略是救濟(jì);當(dāng)流浪者選擇游蕩時(shí),政府的最優(yōu)策略是不救濟(jì);當(dāng)政府策略為不救濟(jì)時(shí),流浪漢的最優(yōu)略是不救濟(jì);當(dāng)政府策略為不救濟(jì)時(shí),流浪漢的最優(yōu)策略是尋找工作;當(dāng)政府選擇救濟(jì)時(shí),流浪漢的最優(yōu)策略是尋找工作;當(dāng)政府選擇救濟(jì)時(shí),流浪漢的最優(yōu)策略是游蕩??傊诩儾呗韵?,沒有一個(gè)策略組合策略是游蕩。總之,在純策略下

54、,沒有一個(gè)策略組合構(gòu)成納什均衡。構(gòu)成納什均衡。68 局中人局中人I以概率以概率x1, x2 , ,xm來分別選取純策略來分別選取純策略1, 2 , m ;而;而局中人局中人II以概率以概率y1 , y2 , ,yn來選用來選用自己的純策略自己的純策略1 , 2 , , n 。于是:。于是:111 ,1, 01, 01mnijijijxyxy 稱稱 x = ( x1 , x2 , ,xm)T , y = ( y1 , y2 , ,yn)T 分別為分別為I和和II的的混合策略混合策略。 設(shè)設(shè)A,B分別為局中人分別為局中人I和和II的贏得矩陣,且都的贏得矩陣,且都是為是為mn矩陣。矩陣。69*11

55、|1 , 01miiiSxxx*21 |1,01njjjSyyy則局中人則局中人I和和II的混合策略集為:的混合策略集為: 當(dāng)局中人當(dāng)局中人I和和II的混合策略分別為的混合策略分別為x和和y時(shí),局中時(shí),局中人人I和和II的期望贏得值分別為:的期望贏得值分別為:11( ,)mnTAijijijEx ya x yx Ay11( , )mnTBijijijEx yb x yx By70如果一個(gè)混合策略組合如果一個(gè)混合策略組合(x*, y*)同時(shí)滿足:同時(shí)滿足:*( ,)( ,)AAE x yE x y*(, )(,)BBExyExy且且 則稱策略組合則稱策略組合(x*, y*) 是一個(gè)混合策賂納什均

56、衡,是一個(gè)混合策賂納什均衡,其中其中(x, y) 分別是局中人分別是局中人I和和II的任意混合策略。的任意混合策略。 例例6中假定政府以概率中假定政府以概率x選擇救濟(jì)概率選擇救濟(jì)概率1x選擇不救濟(jì),即政府的混合策略為選擇不救濟(jì),即政府的混合策略為 ( x, 1x );流;流浪漢以概率浪漢以概率y選擇尋找工作,以概率選擇尋找工作,以概率1y選擇游蕩,選擇游蕩,即流浪漢的混合策略為即流浪漢的混合策略為( y, 1y )。那么政府的期。那么政府的期望贏得函數(shù)為:望贏得函數(shù)為:7131(,)( ,1)5101AyEX Yxxxyxyy同樣,流浪漢的期望贏得函數(shù)為:同樣,流浪漢的期望贏得函數(shù)為:23(,

57、)( ,1)23101ByEX Yxxxyxyy 令令510 ,AEyx得得*15y令令210 ,BExy 得得*1.2x 72 這就是說,在混合策略均衡中,流浪漢在對(duì)付這就是說,在混合策略均衡中,流浪漢在對(duì)付政府給定的混合策略下,最優(yōu)策略是以政府給定的混合策略下,最優(yōu)策略是以15 的概率的概率選擇尋找工作選擇尋找工作,而以而以45 的概率選擇游蕩,即:的概率選擇游蕩,即:*14,55TY 在混合策略均衡中,政府在對(duì)付給定流浪漢的在混合策略均衡中,政府在對(duì)付給定流浪漢的混合策略下,最優(yōu)策略是:混合策略下,最優(yōu)策略是:*11,22TX 由于納什均衡要求每個(gè)局中人的混合策略是在由于納什均衡要求每個(gè)

58、局中人的混合策略是在給定對(duì)方的混合策略下的最優(yōu)選擇,因此策略組給定對(duì)方的混合策略下的最優(yōu)選擇,因此策略組(X,Y)構(gòu)成唯一的納什均衡)構(gòu)成唯一的納什均衡73 對(duì)于上述的混合策略納什均衡,可以這樣來理對(duì)于上述的混合策略納什均衡,可以這樣來理解:如果政府認(rèn)為流浪漢選擇工作的概率解:如果政府認(rèn)為流浪漢選擇工作的概率 y1/5,那么政府的唯一最優(yōu)選擇策略是不救濟(jì);但當(dāng)政府那么政府的唯一最優(yōu)選擇策略是不救濟(jì);但當(dāng)政府以以 1 的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟(jì),此時(shí)流浪漢則又工作,這又將導(dǎo)致政府選擇救濟(jì),此時(shí)流浪漢則又會(huì)選擇游蕩,

59、如此等等,因此會(huì)選擇游蕩,如此等等,因此y1/5不構(gòu)成納什均不構(gòu)成納什均衡。衡。 同樣,如果政府認(rèn)為同樣,如果政府認(rèn)為y1/5,政府的唯一最優(yōu),政府的唯一最優(yōu)選擇是救濟(jì);但當(dāng)政府以選擇是救濟(jì);但當(dāng)政府以x1選擇救濟(jì)時(shí),流浪漢選擇救濟(jì)時(shí),流浪漢的最優(yōu)選擇則是游蕩,因此的最優(yōu)選擇則是游蕩,因此y1/5 也不構(gòu)成納什均也不構(gòu)成納什均衡;類似地,可以驗(yàn)證衡;類似地,可以驗(yàn)證x1/2和和x1/2都不構(gòu)成納都不構(gòu)成納什均衡。什均衡。74無限策略博弈分析無限策略博弈分析 在有無限策略、連續(xù)策略空間的博弈中,納什在有無限策略、連續(xù)策略空間的博弈中,納什均衡的概念同樣適用。我們通過具體模型來說明這均衡的概念同樣適用。我們通過具體模型來說明這種博弈的納什均衡分析方法。種博弈的納什均衡分析方法。 古諾(古諾(Cournot)模型:)模型:古諾模型是研究寡頭古諾模型是研究寡頭壟斷市場(chǎng)的經(jīng)典模型,在古諾模型中,假設(shè)一個(gè)市壟斷市場(chǎng)的經(jīng)典模型,在古諾模型中,假設(shè)一個(gè)市場(chǎng)有兩家生產(chǎn)同一種產(chǎn)品廠商。如果廠商場(chǎng)有兩家生產(chǎn)同一種產(chǎn)品廠商。如果廠商1的產(chǎn)量的產(chǎn)量為為q1,廠商,廠商2的產(chǎn)量為的產(chǎn)量為q2,則市

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論