混合策略納什均衡課件_第1頁(yè)
混合策略納什均衡課件_第2頁(yè)
混合策略納什均衡課件_第3頁(yè)
混合策略納什均衡課件_第4頁(yè)
混合策略納什均衡課件_第5頁(yè)
已閱讀5頁(yè),還剩101頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三講混合策略納什均衡主講人:李美娟

第三講混合策略納什均衡引言◆有些博弈不存在納什均衡,或者納什均衡不唯一,如猜硬幣博弈,前述納什均衡分析就無(wú)法對(duì)博弈方的選擇和博弈結(jié)果作明確的預(yù)測(cè)。◆這部分對(duì)不存在納什均衡和存在多個(gè)納什均衡的博弈作一些討論。引言◆有些博弈不存在納什均衡,或者納什均衡不唯一,如猜硬幣博混合策略的引進(jìn)一、撲克牌對(duì)色游戲-1,11,-11,-1-1,1紅黑乙甲紅黑不存在前面定義的納什均衡策略組合。這類博弈很多,引出混合策略納什均衡概念。混合策略的引進(jìn)一、撲克牌對(duì)色游戲-1,11,-11,-混合策略的相關(guān)概念◆混合策略是一種按照什么概率選擇這個(gè)純策略、按照什么概率選擇那種純策略的策略選擇指示。◆混合策略表明:參與人可以按照一定的概率,隨機(jī)地從純策略集合中選擇一種純策略的實(shí)際行動(dòng)?!羝谕担杭俣ù嬖趥€(gè)可能的取值,并且這些取值發(fā)生的概率分別為:,則期望值為:

混合策略的相關(guān)概念◆混合策略是一種按照什么概率選擇這個(gè)純策略

小孩玩的游戲“石頭,剪子,布”,也是一種博弈。但是,這個(gè)博弈有一種有趣的特征,即給定一方的任何選擇,另一方都有制勝對(duì)方的戰(zhàn)略,因而這個(gè)戰(zhàn)略不是最優(yōu)的。任何“純戰(zhàn)略”都不是最優(yōu)的,純戰(zhàn)略是“石頭,剪子,布”中的任何一個(gè)。

混合策略博弈小孩玩的游戲“石頭,剪子,布”,也是石頭、剪刀、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石頭剪子布博弈方2石頭剪子布博弈方1石頭、剪刀、布0,01,-1-1,1-1,11,-

但是,我們知道,玩這個(gè)游戲總是以對(duì)方不易猜出的隨機(jī)方式出招。事實(shí)上,可以通過(guò)數(shù)學(xué)證明,當(dāng)雙方都以每個(gè)戰(zhàn)略按1/3的概率出招時(shí),達(dá)成一種雙方都不愿改變這種概率分布的局面。這被稱為“混合戰(zhàn)略納什均衡”,而這種以隨機(jī)方式選擇純戰(zhàn)略的博弈被稱為“混合戰(zhàn)略博弈”。以混合戰(zhàn)略博弈我們來(lái)看下面幾個(gè)例子。但是,我們知道,玩這個(gè)游戲總是以對(duì)方

例子1為什么一般人總是小錯(cuò)不斷,大錯(cuò)不犯;偷稅漏稅的一般是中小企業(yè),大企業(yè)會(huì)老老實(shí)實(shí)地交稅?

稅務(wù)部門不會(huì)對(duì)所有企業(yè)的交稅情況每一次都去檢查,因?yàn)檫@樣做的成本太高,得不償失。所以,稅務(wù)部門總是隨機(jī)地對(duì)企業(yè)的交稅情況進(jìn)行檢查。例子1為什么一般人總是小錯(cuò)不斷,大錯(cuò)不犯;偷稅漏

企業(yè)也是隨機(jī)地在交稅與偷漏稅之間進(jìn)行選擇。稅收部門與企業(yè)間進(jìn)行的是混合戰(zhàn)略博弈。因?yàn)槿绻髽I(yè)總是交稅,稅務(wù)部門就最好不檢查;但給定不檢查,企業(yè)就會(huì)偷漏稅。所以,兩者只有在隨機(jī)地檢查與不檢查,企業(yè)隨機(jī)地在偷漏稅與交稅之間選擇,才會(huì)達(dá)成均衡。

企業(yè)也是隨機(jī)地在交稅與偷漏稅之間進(jìn)行選

對(duì)于大企業(yè),因一旦偷稅數(shù)額就巨大,所以,稅務(wù)部門在隨機(jī)檢查時(shí)放在大企業(yè)上的可能性就大一些;而給定稅務(wù)部門檢查大企業(yè)的可能性較大,大企業(yè)偷漏稅的行為就較少,否則就容易被逮個(gè)正著。所以,偷漏稅較多的就是一些中小企業(yè),大企業(yè)納稅的積極性較高。同樣的道理,在犯罪或?qū)﹀e(cuò)誤的監(jiān)督懲罰博弈中,也是混合博弈,人們可能總是大錯(cuò)不犯小錯(cuò)不斷。對(duì)于大企業(yè),因一旦偷稅數(shù)額就巨大,所以,

例子2田忌賽馬新編

春秋戰(zhàn)國(guó)時(shí)期,齊威王常與旗下大將田忌賽馬。規(guī)則是:每次賽三局,每一局齊威王與田忌各出一匹馬比賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田忌有上、中、下三匹馬,而齊威王也有上、中、下三匹馬。每次比賽,第一局田忌出上馬,齊威王也出上馬;第二局田忌出中馬,齊威王也出中馬;第三局,田忌出下馬,齊威王也出下馬。齊威王的上馬比田忌的上馬好,齊威王的中馬也比田忌的中馬好,齊威王的下馬還是比田忌的下馬好。于是,每次比賽的結(jié)果都是田忌連輸三局。例子2田忌賽馬新編

田忌的謀士孫臏了解了田忌的困境后,就打聽(tīng)到這樣一個(gè)消息:盡管齊威王的上、中、下三匹馬都要比田忌的對(duì)應(yīng)上、中、下三匹馬好,但碰巧的是田忌的上馬可勝齊威王的中馬,田忌的中馬可勝齊威王的下馬。于是,孫臏為田忌獻(xiàn)計(jì):下一次比賽中第一局時(shí)田忌出下馬對(duì)齊威王的上馬輸一局,第二局田忌出上馬對(duì)齊威王的中馬,第三局田忌出中馬對(duì)齊威王的下馬,這樣可連贏兩局,最后凈勝一千斤銅。田忌依計(jì)而行,果真贏回一千斤銅。田忌的謀士孫臏了解了

這個(gè)故事曾經(jīng)被很多人當(dāng)作博弈論的例子來(lái)演繹,但實(shí)際上這個(gè)故事與博弈論無(wú)關(guān)。博弈論會(huì)假定所有局中人都是理性的,不能假定一些局中人聰明而另一些局中人卻是傻子。當(dāng)田忌出下馬時(shí),齊威王最好的選擇是出下馬而不是上馬。孫臏的計(jì)謀中假定齊威王是傻子,當(dāng)田忌出下、上、中馬時(shí),他仍然按上、中、下馬出,當(dāng)然要輸了。事實(shí)上,當(dāng)田忌出下馬時(shí),齊威王應(yīng)出下馬,但齊威王出下馬時(shí),田忌不應(yīng)出下馬而是出中馬,但此時(shí)齊威王又應(yīng)出中馬而不是下馬了,……。這樣,博弈不會(huì)有純戰(zhàn)略的均衡。這個(gè)故事曾經(jīng)被很多人當(dāng)作博弈論的例子

兩人只能玩混合戰(zhàn)略博弈,齊威王分別以1/6隨機(jī)的概率選擇出上、中、下馬的任一排列,田忌也如此。由于齊威王存在絕對(duì)優(yōu)勢(shì),他平均看來(lái)仍然會(huì)贏田忌一千斤銅。

兩人只能玩混合戰(zhàn)略博弈,齊威王分別以1混合策略均衡◆純策略與純策略納什均衡純策略:肯定會(huì)被選擇——以100%的概率——被選擇的策略?!艋旌喜呗曰旌喜呗裕阂砸欢ǖ母怕史植歼x擇某幾個(gè)行動(dòng)的策略?;旌喜呗跃狻艏儾呗耘c純策略納什均衡◆混合策略定義:在n人博弈的策略式表述中,假定參與人有K個(gè)純策略:,那么,概率分布稱為的一個(gè)混合策略,這里是選擇的概率,對(duì)于所有的?!?/p>

顯然,純策略可以理解為混合策略的特例,比如說(shuō),純策略等價(jià)于混合策略,即選擇純策略的概率為1,選擇任何其他純策略的概率為0。◆混合策略納什均衡:包含混合策略的策略組合,構(gòu)成納什均衡?;旌喜呗浴艋旌喜呗远x:在n人博弈的策略式表述混合策略均衡設(shè)是n人策略式博弈的一個(gè)混合策略組合。如果對(duì)于所有的,

對(duì)于每一個(gè)都成立,則稱混合策略組合是這個(gè)博弈的一個(gè)納什均衡。

混合策略均衡設(shè)是n人策略式博弈期望支付

例:◆參與人1的混合策略:(p,1-p)參與人2的混合策略:(q,1-q)◆參與人1的期望支付:如果參與人1選擇S11:如果參與人1選擇S12:EV1(p,q)=◆參與人2的期望支付:EV2(p,q)=u1,u2u3,u4u5,u6u7,u8參與人2S11pS121-pS21S22參與人2q1-q期望支付例:◆參與人1的混合策略:(p,1-p)u1,u2混合策略均衡

例:監(jiān)督博弈給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;如此循環(huán)。1,-1-1,2-2,32,2老板監(jiān)督不監(jiān)督偷懶不偷懶工人混合策略均衡例:監(jiān)督博弈給定工人偷懶,老板的最優(yōu)1,-1-混合策略均衡監(jiān)督不監(jiān)督偷懶不偷懶工人老板

假定老板選擇混合戰(zhàn)略(0.5,0.5)

工人選擇“偷懶”期望支付為(-1)×0.5+3×0.5=1

工人選擇“不偷懶”期望支付為2×0.5+2×0.5=2

工人應(yīng)選擇“不偷懶”老板選擇“不監(jiān)督”工人選擇“偷懶’……0.50.5

假定老板選擇混合戰(zhàn)略(0.2,0.8)

工人選擇“偷懶”期望支付為(-1)×0.2+3×0.8=2.2

工人選擇“不偷懶”(期望)支付為2×0.2+2×0.8=2

工人應(yīng)選擇“偷懶”老板選擇“監(jiān)督”工人選擇“不偷懶’……1,-1-1,2-2,32,2混合策略均衡監(jiān)督不監(jiān)督偷懶不偷懶工人老板假定老板選擇混合混合策略均衡

什么情況下達(dá)到納什均衡狀態(tài)?假定存在一個(gè)概率q,老板選擇混合策略(q,1-q)工人選擇“偷懶”期望收益為(-1)×q+3×(1-q)=3-4q工人選擇“不偷懶”收益為2如果老板真的以概率q選擇監(jiān)督,1-q選擇不監(jiān)督,那么意味著他不會(huì)始終重復(fù)地選擇某個(gè)純策略,而他不重復(fù)選擇的條件必須是工人也不會(huì)重復(fù)地選擇純策略。因此,老板以概率q選擇監(jiān)督必然意味著在這種情況下工人沒(méi)有合適的純策略選擇。====老板的選擇必須使工人在兩個(gè)純策略之間隨機(jī)選擇。工人什么情況下隨機(jī)選擇?混合策略均衡什么情況下達(dá)到納什均衡狀態(tài)?混合策略均衡◆當(dāng)工人選擇任何一個(gè)策略的期望支付相等時(shí),只能隨機(jī)選擇。于是,3-4q=2,即q*=1/4,1-q*=3/4。這樣,當(dāng)老板選擇(1/4,3/4)的混合戰(zhàn)略時(shí),可以使工人在兩個(gè)純戰(zhàn)略之間無(wú)差異?!敉?,假設(shè)工人選擇(p,1-p),(p,1-p)成為其最優(yōu)混合戰(zhàn)略的條件是老板在選擇監(jiān)督與選擇不監(jiān)督之間無(wú)差異,即1×p+(-1)(1-p)=(-2)p+2(1-p),即p*=1/2,1-p*=1/2。◆當(dāng)老板選擇(1/4,3/4),工人選擇(1/2,1/2)時(shí),剛好互為彼此的最優(yōu)反應(yīng),達(dá)到納什均衡狀態(tài),稱為混合戰(zhàn)略納什均衡?;旌喜呗跃狻舢?dāng)工人選擇任何一個(gè)策略的期望支付相等時(shí),只能隨混合策略均衡◆參與人1和參與人2的混合策略組合構(gòu)成均衡的必要條件:混合策略均衡◆參與人1和參與人2的混合策略組合構(gòu)成均混合戰(zhàn)略均衡的求解方法◆方法1:支付最大化法

給定其他參與人的混合戰(zhàn)略,自己選擇行動(dòng)的概率分布要使自己期望支付最大化?;旌蠎?zhàn)略均衡的求解方法◆方法1:支付最大化法q1-q1-pp工人的期望支付函數(shù)為(-1)pq+2(1-p)q+3p(1-q)+2(1-p)(1-q)=-4pq+p-2q+2最優(yōu)化一階條件為:-4q+1=0q*=1/4給定工人的混合戰(zhàn)略為(p,1-p),老板的混合戰(zhàn)略為(q,1-q)支付最大化法求混合戰(zhàn)略納什均衡1,-1-1,2-2,32,2老板監(jiān)督不監(jiān)督偷懶不偷懶工人q1-q1-pp工人的期望支付函數(shù)為給定工人的混合戰(zhàn)略為(p混合戰(zhàn)略均衡的求解方法◆方法2:支付等值法

自己選擇策略概率分布使對(duì)方不會(huì)偏好于任何行動(dòng),即選擇每一個(gè)策略都會(huì)得到相同的收益?;旌蠎?zhàn)略均衡的求解方法◆方法2:支付等值法例子例:博弈方1的混合策略(p,1-p)

博弈方2的混合策略(q,1-q)博弈方1:由可得:q=0.8博弈方2:由可得:p=0.8

2,35,23,11,5CDAB博弈方2博弈方1例子例:博弈方1的混合策略(p,1-p)2,35,23,得雙方的策略及相應(yīng)得益:其中,博弈方1的期望得益為:博弈方2的期望得益為:策略期望得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6得雙方的策略及相應(yīng)得益:策略期望得益博弈方1(0.8,0.2多重均衡博弈和混合策略一、夫妻之爭(zhēng)的混合策略納什均衡◆首先,該博弈有兩個(gè)納什均衡,本博弈的兩個(gè)博弈方不會(huì)害怕對(duì)方猜到自己的選擇,他們主觀上并不想隱藏自己的選擇。因此,該博弈中兩博弈方的決策思路和原則應(yīng)該與沒(méi)有納什均衡的嚴(yán)格競(jìng)爭(zhēng)博弈有所不同。2,10,00,01,3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭(zhēng)多重均衡博弈和混合策略一、夫妻之爭(zhēng)的混合策略納什均衡2,1◆但顯然,雙方的偏好不同,妻子喜歡前一個(gè),丈夫喜歡后一個(gè)。故在純策略的范圍內(nèi),該博弈也是無(wú)法對(duì)兩博弈方的選擇提出確定性建議,因此也需要考慮博弈方采用混合策略的可能性?!粼O(shè)p和1-p分別為妻子選擇時(shí)裝表演和足球的概率;◆如果妻子不想讓丈夫利用自己的選擇傾向占上風(fēng),則自己的概率選擇應(yīng)使丈夫選擇兩種策略的期望得益相同:得:p=3/4◆但顯然,雙方的偏好不同,妻子喜歡前一個(gè),丈夫喜歡后一個(gè)。故◆設(shè)q和1-q分別為丈夫選擇時(shí)裝表演和足球的概率。同樣,如果丈夫不想讓妻子利用自己的選擇傾向占上風(fēng),則自己的概率選擇應(yīng)使妻子選擇兩種策略的期望得益相同:得:q=1/3夫妻之爭(zhēng)博弈的混合策略納什均衡

策略

得益妻子

(0.75,0.25)0.67丈夫

(1/3,2/3)0.75◆設(shè)q和1-q分別為丈夫選擇時(shí)裝表演和足球的概率。同樣,如果◆可見(jiàn),這個(gè)結(jié)果明顯不如夫妻雙方能交流協(xié)商時(shí),任何一方遷就另一方的得益好。這是因?yàn)槿狈贤〞r(shí)可能出現(xiàn)最差的結(jié)果造成的?!粢簿褪钦f(shuō),如果不強(qiáng)行設(shè)定雙方不能交流串通的博弈規(guī)則,雙方?jīng)Q策時(shí)沒(méi)有被客觀或人為的原因隔離開(kāi)來(lái),也沒(méi)有因?yàn)橘€氣而采取不理性的態(tài)度,那么這種夫妻之間的決策問(wèn)題一般不應(yīng)該用上述博弈方式解決。◆可見(jiàn),這個(gè)結(jié)果明顯不如夫妻雙方能交流協(xié)商時(shí),任何一方遷就另二、制式問(wèn)題◆電器和電子設(shè)備往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn),稱之為不同的制式?!羧绻a(chǎn)相關(guān)電器或電子設(shè)備的廠商采用相同的制式,那么產(chǎn)品之間就能相互匹配,零配件也可能相互通用,這對(duì)于推廣各自的產(chǎn)品和在生產(chǎn)經(jīng)營(yíng)中進(jìn)行合作很有幫助。◆設(shè)有兩個(gè)廠商同時(shí)計(jì)劃引進(jìn)彩電生產(chǎn)線,而彩電有A、B兩種不同的制式,那么這時(shí)候兩個(gè)廠商之間就有一個(gè)選擇制式的博弈問(wèn)題。二、制式問(wèn)題◆電器和電子設(shè)備往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn),二、制式問(wèn)題1,30,00,02,2ABAB廠商2廠商1制式問(wèn)題

制式問(wèn)題混合策略納什均衡

AB得益廠商1:0.40.60.664廠商2:0.670.331.296假定兩廠商采用不同的制式所能獲取的各自好處如下圖所示:二、制式問(wèn)題1,30,00,02,2ABAB廠商2廠三、市場(chǎng)機(jī)會(huì)博弈-50,-50100,00,1000,0進(jìn)不進(jìn)進(jìn)不進(jìn)廠商2廠商1市場(chǎng)機(jī)會(huì)

進(jìn)

不進(jìn)

得益廠商1:2/31/30廠商2:2/31/30兩廠商同時(shí)發(fā)現(xiàn)一個(gè)市場(chǎng)機(jī)會(huì),但這個(gè)市場(chǎng)的容量并不大,兩個(gè)廠商該如何選擇呢?廠商1的混合策略必須使廠商2選擇進(jìn)與不進(jìn)的期望得益相同,廠商2的情形類似。三、市場(chǎng)機(jī)會(huì)博弈-50,-50100,00,1000,混合策略反應(yīng)函數(shù)◆反應(yīng)函數(shù):一博弈方對(duì)另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù)。在純策略的范疇內(nèi),反應(yīng)函數(shù)是各博弈方選擇的純策略對(duì)其他博弈方純策略的反應(yīng);在混合策略的范疇內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是一方對(duì)另一方的概率分布的反應(yīng),也是一定的概率分布。由于純策略可理解為混合策略,因此實(shí)際上反應(yīng)函數(shù)的概念,可以在混合策略概率分布之間反應(yīng)的意義上統(tǒng)一起來(lái)?;旌喜呗苑磻?yīng)函數(shù)◆反應(yīng)函數(shù):一博弈方對(duì)另一博弈方每種可能的決法三:混合策略反應(yīng)函數(shù)猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布當(dāng)q<0.5時(shí),取r為1;當(dāng)q>0.5時(shí),取r為0當(dāng)r<0.5時(shí),取q為0;當(dāng)r>0.5時(shí),取q為1法三:混合策略反應(yīng)函數(shù)猜硬幣博弈-1,11,-11,-夫妻之爭(zhēng)博弈2,10,00,01,3時(shí)裝足球丈夫時(shí)裝足球妻子夫妻之爭(zhēng)rq111/33/4(r,1-r):妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布當(dāng)q<1/3時(shí),取r為0;當(dāng)q>1/3時(shí),取r為1當(dāng)r<3/4時(shí),取q為0;當(dāng)r>3/4時(shí),取q為1夫妻之爭(zhēng)博弈2,10,00,01,3時(shí)裝足球丈夫時(shí)裝混合戰(zhàn)略均衡

混合戰(zhàn)略要求人們以隨機(jī)的方式選擇自己的行動(dòng),由于隨機(jī)性行為無(wú)法準(zhǔn)確預(yù)期,因此很多人認(rèn)為混合戰(zhàn)略并非一個(gè)令人滿意的均衡概念?,F(xiàn)實(shí)生活中人們真會(huì)這樣采取行動(dòng)嗎?◆如何解釋混合戰(zhàn)略?參與人試圖通過(guò)選擇混合戰(zhàn)略給對(duì)手造成一種不確定性,使對(duì)手不能預(yù)測(cè)自己的行動(dòng)。如,猜硬幣、劃拳?;旌蠎?zhàn)略均衡混合戰(zhàn)略要求人們以隨機(jī)的方式選擇自己混合戰(zhàn)略均衡對(duì)參與人類型的一種推斷。如監(jiān)督博弈,老板不知道工人的類型,只知道“勤奮”、“懶惰”型工人各占50%。老板在選擇自己戰(zhàn)略時(shí)仿佛面臨的是一個(gè)選擇混合戰(zhàn)略的工人。混合戰(zhàn)略均衡對(duì)參與人類型的一種推斷。如監(jiān)督博弈,老板不知道工◆納什定理:在一個(gè)由n個(gè)博弈方的博弈中,如果n是有限的,且Si都是有限集(對(duì)i=1,…,n),則該博弈至少存在一個(gè)納什均衡,但可能包含混合策略?!羝鏀?shù)定理(Wilson,1971):幾乎所有有限博弈都有有限奇數(shù)個(gè)納什均衡。納什均衡的存在性◆納什定理:在一個(gè)由n個(gè)博弈方的博弈納什均衡的存在性

占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡純戰(zhàn)略NE

混合戰(zhàn)略NE前一個(gè)均衡是后一個(gè)均衡的特例,后一個(gè)均衡是前一個(gè)的擴(kuò)展。上述四個(gè)均衡概念統(tǒng)稱為納什均衡。占優(yōu)均衡重復(fù)剔除占優(yōu)均衡純戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡納什均衡的存在性占優(yōu)均衡占優(yōu)均衡重復(fù)剔除占優(yōu)均衡純戰(zhàn)多重均衡與協(xié)調(diào)

多重均衡的概念很多博弈具有多個(gè)納什均衡,比如以上講到的麥琪的禮物、性別戰(zhàn)等,稱為多重均衡。多重均衡降低博弈的解釋力——一方面無(wú)法知道哪個(gè)均衡會(huì)出現(xiàn),另一方面會(huì)發(fā)生真正出現(xiàn)的結(jié)果與均衡結(jié)果不一致在某些具有多重均衡的博弈中,各個(gè)博弈方偏好于不同的均衡結(jié)果,如麥琪的禮物和性別博弈。那么,博弈方如何使自己偏好的均衡成為實(shí)際的均衡結(jié)果呢?這就是多重均衡的協(xié)調(diào)問(wèn)題。多重均衡與協(xié)調(diào)◆多重均衡的概念多重均衡與協(xié)調(diào)

◆帕累托上策均衡◆風(fēng)險(xiǎn)上策均衡◆聚點(diǎn)均衡◆相關(guān)均衡多重均衡與協(xié)調(diào)◆帕累托上策均衡一、帕累托上策均衡◆有些博弈,雖然存在多個(gè)納什均衡,但這些納什均衡可能有明顯的優(yōu)劣差異,所有博弈方都偏好其中同一個(gè)納什均衡。換句話說(shuō),可能有這些納什均衡中的某一個(gè),給所有博弈方帶來(lái)的利益,都大于其他所有納什均衡會(huì)帶來(lái)的利益,此時(shí),博弈方的選擇傾向性就會(huì)是一致的,各個(gè)博弈方不僅自己會(huì)選擇該納什均衡的策略,而且可以預(yù)料其他博弈方也會(huì)選擇該納什均衡的策略,因此不會(huì)有選擇困難。◆用這種方法選擇出來(lái)的納什均衡,也稱為“帕累托上策均衡”。一、帕累托上策均衡◆有些博弈,雖然存在多個(gè)納什均衡,但這些納一、帕累托上策均衡◆這個(gè)博弈中有兩個(gè)純策略納什均衡,(戰(zhàn)爭(zhēng),戰(zhàn)爭(zhēng))和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個(gè)帕累托上策均衡。-5,-5-10,88,-1010,10戰(zhàn)爭(zhēng)和平國(guó)家2戰(zhàn)爭(zhēng)和平國(guó)家1戰(zhàn)爭(zhēng)與和平一、帕累托上策均衡-5,-5-10,88,-1010,◆為什么理性的國(guó)家之間不會(huì)選擇戰(zhàn)爭(zhēng),但歷史上會(huì)有那么多戰(zhàn)爭(zhēng)呢?決策者考慮短期利益、個(gè)人或小集團(tuán)利益;決策者確實(shí)缺乏理性和理智;局部地區(qū)或特定時(shí)期的利益比上述博弈中所假設(shè)的要大等;◆為什么理性的國(guó)家之間不會(huì)選擇戰(zhàn)爭(zhēng),但歷史上會(huì)有那么多戰(zhàn)爭(zhēng)呢二、風(fēng)險(xiǎn)上策均衡◆帕累托上策均衡并不是有強(qiáng)制力的法則?!粲袝r(shí)候其他某種同樣是合理的選擇邏輯的作用會(huì)超過(guò)帕累托效率的選擇邏輯,因此完全理性的決策者也不一定會(huì)選擇帕累托上策均衡。二、風(fēng)險(xiǎn)上策均衡◆帕累托上策均衡并不是有強(qiáng)制力的法則。二、風(fēng)險(xiǎn)上策均衡獵鹿博弈,如下圖。雖然(鹿,鹿)是帕累托上策均衡,但在另一個(gè)人選擇抓兔子的情況下,選擇抓鹿的人會(huì)一無(wú)所獲,而選擇抓兔子的人的利益則是有保障的。因此,選擇抓鹿有較大的風(fēng)險(xiǎn),并不一定是最好的選擇。5,53,00,33,3鹿兔子獵人2鹿兔子獵人1獵鹿博弈風(fēng)險(xiǎn)上策均衡(兔子,兔子)二、風(fēng)險(xiǎn)上策均衡獵鹿博弈,如下圖。5,53,00,33◆當(dāng)合作人數(shù)增加時(shí),相互信任的難度增加,風(fēng)險(xiǎn)上策均衡就會(huì)更可能出現(xiàn)。◆風(fēng)險(xiǎn)上策均衡是人們經(jīng)濟(jì)決策和行為的重要規(guī)律之一。如果我們忽視這種均衡或行為規(guī)律的存在,忽略人們選擇風(fēng)險(xiǎn)上策均衡的可能性,就可能無(wú)法對(duì)許多決策問(wèn)題進(jìn)行準(zhǔn)確的分析判斷,無(wú)法對(duì)許多經(jīng)濟(jì)現(xiàn)象作出合理的解釋?!舢?dāng)合作人數(shù)增加時(shí),相互信任的難度增加,風(fēng)險(xiǎn)上策均衡就會(huì)更可三、聚點(diǎn)均衡◆利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡?!粑幕⒘?xí)慣或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù)。◆城市博弈(城市分組相同)是聚點(diǎn)均衡的典型例子。三、聚點(diǎn)均衡◆利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡?!舫鞘胁┺模阂髢刹┺恼吒髯元?dú)立將上海、南京、長(zhǎng)春、哈爾濱等4個(gè)城市分為兩組,每組兩個(gè)城市。若二人相同則各得100元,否則沒(méi)有獎(jiǎng)金。雖然,這個(gè)博弈有多個(gè)納什均衡,但如果是兩個(gè)中國(guó)人參加博弈,結(jié)果往往相同?!暨@種以地理位置給城市分類的方法是具有基本地理常識(shí)的人都容易想到的,因此它是一個(gè)聚點(diǎn)。◆城市博弈:要求兩博弈者各自獨(dú)立將上海、南京、長(zhǎng)春、哈爾濱等四、相關(guān)均衡

◆人們?cè)诂F(xiàn)實(shí)中遇到選擇困難時(shí),特別是在長(zhǎng)期中反復(fù)遇到相似的選擇難題時(shí),常會(huì)可以根據(jù)觀察到一個(gè)共同的信號(hào)來(lái)選擇行動(dòng),相關(guān)均衡就是這樣的一種均衡選擇機(jī)制。比如司機(jī)與行人的博弈。-1,-12,00,20,0行駛停車穿越等待行人司機(jī)四、相關(guān)均衡◆人們?cè)诂F(xiàn)實(shí)中遇到選擇困難時(shí),特別是在長(zhǎng)期中反第三講混合策略納什均衡主講人:李美娟

第三講混合策略納什均衡引言◆有些博弈不存在納什均衡,或者納什均衡不唯一,如猜硬幣博弈,前述納什均衡分析就無(wú)法對(duì)博弈方的選擇和博弈結(jié)果作明確的預(yù)測(cè)?!暨@部分對(duì)不存在納什均衡和存在多個(gè)納什均衡的博弈作一些討論。引言◆有些博弈不存在納什均衡,或者納什均衡不唯一,如猜硬幣博混合策略的引進(jìn)一、撲克牌對(duì)色游戲-1,11,-11,-1-1,1紅黑乙甲紅黑不存在前面定義的納什均衡策略組合。這類博弈很多,引出混合策略納什均衡概念。混合策略的引進(jìn)一、撲克牌對(duì)色游戲-1,11,-11,-混合策略的相關(guān)概念◆混合策略是一種按照什么概率選擇這個(gè)純策略、按照什么概率選擇那種純策略的策略選擇指示?!艋旌喜呗员砻鳎簠⑴c人可以按照一定的概率,隨機(jī)地從純策略集合中選擇一種純策略的實(shí)際行動(dòng)?!羝谕担杭俣ù嬖趥€(gè)可能的取值,并且這些取值發(fā)生的概率分別為:,則期望值為:

混合策略的相關(guān)概念◆混合策略是一種按照什么概率選擇這個(gè)純策略

小孩玩的游戲“石頭,剪子,布”,也是一種博弈。但是,這個(gè)博弈有一種有趣的特征,即給定一方的任何選擇,另一方都有制勝對(duì)方的戰(zhàn)略,因而這個(gè)戰(zhàn)略不是最優(yōu)的。任何“純戰(zhàn)略”都不是最優(yōu)的,純戰(zhàn)略是“石頭,剪子,布”中的任何一個(gè)。

混合策略博弈小孩玩的游戲“石頭,剪子,布”,也是石頭、剪刀、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石頭剪子布博弈方2石頭剪子布博弈方1石頭、剪刀、布0,01,-1-1,1-1,11,-

但是,我們知道,玩這個(gè)游戲總是以對(duì)方不易猜出的隨機(jī)方式出招。事實(shí)上,可以通過(guò)數(shù)學(xué)證明,當(dāng)雙方都以每個(gè)戰(zhàn)略按1/3的概率出招時(shí),達(dá)成一種雙方都不愿改變這種概率分布的局面。這被稱為“混合戰(zhàn)略納什均衡”,而這種以隨機(jī)方式選擇純戰(zhàn)略的博弈被稱為“混合戰(zhàn)略博弈”。以混合戰(zhàn)略博弈我們來(lái)看下面幾個(gè)例子。但是,我們知道,玩這個(gè)游戲總是以對(duì)方

例子1為什么一般人總是小錯(cuò)不斷,大錯(cuò)不犯;偷稅漏稅的一般是中小企業(yè),大企業(yè)會(huì)老老實(shí)實(shí)地交稅?

稅務(wù)部門不會(huì)對(duì)所有企業(yè)的交稅情況每一次都去檢查,因?yàn)檫@樣做的成本太高,得不償失。所以,稅務(wù)部門總是隨機(jī)地對(duì)企業(yè)的交稅情況進(jìn)行檢查。例子1為什么一般人總是小錯(cuò)不斷,大錯(cuò)不犯;偷稅漏

企業(yè)也是隨機(jī)地在交稅與偷漏稅之間進(jìn)行選擇。稅收部門與企業(yè)間進(jìn)行的是混合戰(zhàn)略博弈。因?yàn)槿绻髽I(yè)總是交稅,稅務(wù)部門就最好不檢查;但給定不檢查,企業(yè)就會(huì)偷漏稅。所以,兩者只有在隨機(jī)地檢查與不檢查,企業(yè)隨機(jī)地在偷漏稅與交稅之間選擇,才會(huì)達(dá)成均衡。

企業(yè)也是隨機(jī)地在交稅與偷漏稅之間進(jìn)行選

對(duì)于大企業(yè),因一旦偷稅數(shù)額就巨大,所以,稅務(wù)部門在隨機(jī)檢查時(shí)放在大企業(yè)上的可能性就大一些;而給定稅務(wù)部門檢查大企業(yè)的可能性較大,大企業(yè)偷漏稅的行為就較少,否則就容易被逮個(gè)正著。所以,偷漏稅較多的就是一些中小企業(yè),大企業(yè)納稅的積極性較高。同樣的道理,在犯罪或?qū)﹀e(cuò)誤的監(jiān)督懲罰博弈中,也是混合博弈,人們可能總是大錯(cuò)不犯小錯(cuò)不斷。對(duì)于大企業(yè),因一旦偷稅數(shù)額就巨大,所以,

例子2田忌賽馬新編

春秋戰(zhàn)國(guó)時(shí)期,齊威王常與旗下大將田忌賽馬。規(guī)則是:每次賽三局,每一局齊威王與田忌各出一匹馬比賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田忌有上、中、下三匹馬,而齊威王也有上、中、下三匹馬。每次比賽,第一局田忌出上馬,齊威王也出上馬;第二局田忌出中馬,齊威王也出中馬;第三局,田忌出下馬,齊威王也出下馬。齊威王的上馬比田忌的上馬好,齊威王的中馬也比田忌的中馬好,齊威王的下馬還是比田忌的下馬好。于是,每次比賽的結(jié)果都是田忌連輸三局。例子2田忌賽馬新編

田忌的謀士孫臏了解了田忌的困境后,就打聽(tīng)到這樣一個(gè)消息:盡管齊威王的上、中、下三匹馬都要比田忌的對(duì)應(yīng)上、中、下三匹馬好,但碰巧的是田忌的上馬可勝齊威王的中馬,田忌的中馬可勝齊威王的下馬。于是,孫臏為田忌獻(xiàn)計(jì):下一次比賽中第一局時(shí)田忌出下馬對(duì)齊威王的上馬輸一局,第二局田忌出上馬對(duì)齊威王的中馬,第三局田忌出中馬對(duì)齊威王的下馬,這樣可連贏兩局,最后凈勝一千斤銅。田忌依計(jì)而行,果真贏回一千斤銅。田忌的謀士孫臏了解了

這個(gè)故事曾經(jīng)被很多人當(dāng)作博弈論的例子來(lái)演繹,但實(shí)際上這個(gè)故事與博弈論無(wú)關(guān)。博弈論會(huì)假定所有局中人都是理性的,不能假定一些局中人聰明而另一些局中人卻是傻子。當(dāng)田忌出下馬時(shí),齊威王最好的選擇是出下馬而不是上馬。孫臏的計(jì)謀中假定齊威王是傻子,當(dāng)田忌出下、上、中馬時(shí),他仍然按上、中、下馬出,當(dāng)然要輸了。事實(shí)上,當(dāng)田忌出下馬時(shí),齊威王應(yīng)出下馬,但齊威王出下馬時(shí),田忌不應(yīng)出下馬而是出中馬,但此時(shí)齊威王又應(yīng)出中馬而不是下馬了,……。這樣,博弈不會(huì)有純戰(zhàn)略的均衡。這個(gè)故事曾經(jīng)被很多人當(dāng)作博弈論的例子

兩人只能玩混合戰(zhàn)略博弈,齊威王分別以1/6隨機(jī)的概率選擇出上、中、下馬的任一排列,田忌也如此。由于齊威王存在絕對(duì)優(yōu)勢(shì),他平均看來(lái)仍然會(huì)贏田忌一千斤銅。

兩人只能玩混合戰(zhàn)略博弈,齊威王分別以1混合策略均衡◆純策略與純策略納什均衡純策略:肯定會(huì)被選擇——以100%的概率——被選擇的策略?!艋旌喜呗曰旌喜呗裕阂砸欢ǖ母怕史植歼x擇某幾個(gè)行動(dòng)的策略?;旌喜呗跃狻艏儾呗耘c純策略納什均衡◆混合策略定義:在n人博弈的策略式表述中,假定參與人有K個(gè)純策略:,那么,概率分布稱為的一個(gè)混合策略,這里是選擇的概率,對(duì)于所有的?!?/p>

顯然,純策略可以理解為混合策略的特例,比如說(shuō),純策略等價(jià)于混合策略,即選擇純策略的概率為1,選擇任何其他純策略的概率為0?!艋旌喜呗约{什均衡:包含混合策略的策略組合,構(gòu)成納什均衡。混合策略◆混合策略定義:在n人博弈的策略式表述混合策略均衡設(shè)是n人策略式博弈的一個(gè)混合策略組合。如果對(duì)于所有的,

對(duì)于每一個(gè)都成立,則稱混合策略組合是這個(gè)博弈的一個(gè)納什均衡。

混合策略均衡設(shè)是n人策略式博弈期望支付

例:◆參與人1的混合策略:(p,1-p)參與人2的混合策略:(q,1-q)◆參與人1的期望支付:如果參與人1選擇S11:如果參與人1選擇S12:EV1(p,q)=◆參與人2的期望支付:EV2(p,q)=u1,u2u3,u4u5,u6u7,u8參與人2S11pS121-pS21S22參與人2q1-q期望支付例:◆參與人1的混合策略:(p,1-p)u1,u2混合策略均衡

例:監(jiān)督博弈給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;如此循環(huán)。1,-1-1,2-2,32,2老板監(jiān)督不監(jiān)督偷懶不偷懶工人混合策略均衡例:監(jiān)督博弈給定工人偷懶,老板的最優(yōu)1,-1-混合策略均衡監(jiān)督不監(jiān)督偷懶不偷懶工人老板

假定老板選擇混合戰(zhàn)略(0.5,0.5)

工人選擇“偷懶”期望支付為(-1)×0.5+3×0.5=1

工人選擇“不偷懶”期望支付為2×0.5+2×0.5=2

工人應(yīng)選擇“不偷懶”老板選擇“不監(jiān)督”工人選擇“偷懶’……0.50.5

假定老板選擇混合戰(zhàn)略(0.2,0.8)

工人選擇“偷懶”期望支付為(-1)×0.2+3×0.8=2.2

工人選擇“不偷懶”(期望)支付為2×0.2+2×0.8=2

工人應(yīng)選擇“偷懶”老板選擇“監(jiān)督”工人選擇“不偷懶’……1,-1-1,2-2,32,2混合策略均衡監(jiān)督不監(jiān)督偷懶不偷懶工人老板假定老板選擇混合混合策略均衡

什么情況下達(dá)到納什均衡狀態(tài)?假定存在一個(gè)概率q,老板選擇混合策略(q,1-q)工人選擇“偷懶”期望收益為(-1)×q+3×(1-q)=3-4q工人選擇“不偷懶”收益為2如果老板真的以概率q選擇監(jiān)督,1-q選擇不監(jiān)督,那么意味著他不會(huì)始終重復(fù)地選擇某個(gè)純策略,而他不重復(fù)選擇的條件必須是工人也不會(huì)重復(fù)地選擇純策略。因此,老板以概率q選擇監(jiān)督必然意味著在這種情況下工人沒(méi)有合適的純策略選擇。====老板的選擇必須使工人在兩個(gè)純策略之間隨機(jī)選擇。工人什么情況下隨機(jī)選擇?混合策略均衡什么情況下達(dá)到納什均衡狀態(tài)?混合策略均衡◆當(dāng)工人選擇任何一個(gè)策略的期望支付相等時(shí),只能隨機(jī)選擇。于是,3-4q=2,即q*=1/4,1-q*=3/4。這樣,當(dāng)老板選擇(1/4,3/4)的混合戰(zhàn)略時(shí),可以使工人在兩個(gè)純戰(zhàn)略之間無(wú)差異?!敉恚僭O(shè)工人選擇(p,1-p),(p,1-p)成為其最優(yōu)混合戰(zhàn)略的條件是老板在選擇監(jiān)督與選擇不監(jiān)督之間無(wú)差異,即1×p+(-1)(1-p)=(-2)p+2(1-p),即p*=1/2,1-p*=1/2?!舢?dāng)老板選擇(1/4,3/4),工人選擇(1/2,1/2)時(shí),剛好互為彼此的最優(yōu)反應(yīng),達(dá)到納什均衡狀態(tài),稱為混合戰(zhàn)略納什均衡?;旌喜呗跃狻舢?dāng)工人選擇任何一個(gè)策略的期望支付相等時(shí),只能隨混合策略均衡◆參與人1和參與人2的混合策略組合構(gòu)成均衡的必要條件:混合策略均衡◆參與人1和參與人2的混合策略組合構(gòu)成均混合戰(zhàn)略均衡的求解方法◆方法1:支付最大化法

給定其他參與人的混合戰(zhàn)略,自己選擇行動(dòng)的概率分布要使自己期望支付最大化?;旌蠎?zhàn)略均衡的求解方法◆方法1:支付最大化法q1-q1-pp工人的期望支付函數(shù)為(-1)pq+2(1-p)q+3p(1-q)+2(1-p)(1-q)=-4pq+p-2q+2最優(yōu)化一階條件為:-4q+1=0q*=1/4給定工人的混合戰(zhàn)略為(p,1-p),老板的混合戰(zhàn)略為(q,1-q)支付最大化法求混合戰(zhàn)略納什均衡1,-1-1,2-2,32,2老板監(jiān)督不監(jiān)督偷懶不偷懶工人q1-q1-pp工人的期望支付函數(shù)為給定工人的混合戰(zhàn)略為(p混合戰(zhàn)略均衡的求解方法◆方法2:支付等值法

自己選擇策略概率分布使對(duì)方不會(huì)偏好于任何行動(dòng),即選擇每一個(gè)策略都會(huì)得到相同的收益?;旌蠎?zhàn)略均衡的求解方法◆方法2:支付等值法例子例:博弈方1的混合策略(p,1-p)

博弈方2的混合策略(q,1-q)博弈方1:由可得:q=0.8博弈方2:由可得:p=0.8

2,35,23,11,5CDAB博弈方2博弈方1例子例:博弈方1的混合策略(p,1-p)2,35,23,得雙方的策略及相應(yīng)得益:其中,博弈方1的期望得益為:博弈方2的期望得益為:策略期望得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6得雙方的策略及相應(yīng)得益:策略期望得益博弈方1(0.8,0.2多重均衡博弈和混合策略一、夫妻之爭(zhēng)的混合策略納什均衡◆首先,該博弈有兩個(gè)納什均衡,本博弈的兩個(gè)博弈方不會(huì)害怕對(duì)方猜到自己的選擇,他們主觀上并不想隱藏自己的選擇。因此,該博弈中兩博弈方的決策思路和原則應(yīng)該與沒(méi)有納什均衡的嚴(yán)格競(jìng)爭(zhēng)博弈有所不同。2,10,00,01,3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭(zhēng)多重均衡博弈和混合策略一、夫妻之爭(zhēng)的混合策略納什均衡2,1◆但顯然,雙方的偏好不同,妻子喜歡前一個(gè),丈夫喜歡后一個(gè)。故在純策略的范圍內(nèi),該博弈也是無(wú)法對(duì)兩博弈方的選擇提出確定性建議,因此也需要考慮博弈方采用混合策略的可能性?!粼O(shè)p和1-p分別為妻子選擇時(shí)裝表演和足球的概率;◆如果妻子不想讓丈夫利用自己的選擇傾向占上風(fēng),則自己的概率選擇應(yīng)使丈夫選擇兩種策略的期望得益相同:得:p=3/4◆但顯然,雙方的偏好不同,妻子喜歡前一個(gè),丈夫喜歡后一個(gè)。故◆設(shè)q和1-q分別為丈夫選擇時(shí)裝表演和足球的概率。同樣,如果丈夫不想讓妻子利用自己的選擇傾向占上風(fēng),則自己的概率選擇應(yīng)使妻子選擇兩種策略的期望得益相同:得:q=1/3夫妻之爭(zhēng)博弈的混合策略納什均衡

策略

得益妻子

(0.75,0.25)0.67丈夫

(1/3,2/3)0.75◆設(shè)q和1-q分別為丈夫選擇時(shí)裝表演和足球的概率。同樣,如果◆可見(jiàn),這個(gè)結(jié)果明顯不如夫妻雙方能交流協(xié)商時(shí),任何一方遷就另一方的得益好。這是因?yàn)槿狈贤〞r(shí)可能出現(xiàn)最差的結(jié)果造成的?!粢簿褪钦f(shuō),如果不強(qiáng)行設(shè)定雙方不能交流串通的博弈規(guī)則,雙方?jīng)Q策時(shí)沒(méi)有被客觀或人為的原因隔離開(kāi)來(lái),也沒(méi)有因?yàn)橘€氣而采取不理性的態(tài)度,那么這種夫妻之間的決策問(wèn)題一般不應(yīng)該用上述博弈方式解決?!艨梢?jiàn),這個(gè)結(jié)果明顯不如夫妻雙方能交流協(xié)商時(shí),任何一方遷就另二、制式問(wèn)題◆電器和電子設(shè)備往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn),稱之為不同的制式?!羧绻a(chǎn)相關(guān)電器或電子設(shè)備的廠商采用相同的制式,那么產(chǎn)品之間就能相互匹配,零配件也可能相互通用,這對(duì)于推廣各自的產(chǎn)品和在生產(chǎn)經(jīng)營(yíng)中進(jìn)行合作很有幫助。◆設(shè)有兩個(gè)廠商同時(shí)計(jì)劃引進(jìn)彩電生產(chǎn)線,而彩電有A、B兩種不同的制式,那么這時(shí)候兩個(gè)廠商之間就有一個(gè)選擇制式的博弈問(wèn)題。二、制式問(wèn)題◆電器和電子設(shè)備往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn),二、制式問(wèn)題1,30,00,02,2ABAB廠商2廠商1制式問(wèn)題

制式問(wèn)題混合策略納什均衡

AB得益廠商1:0.40.60.664廠商2:0.670.331.296假定兩廠商采用不同的制式所能獲取的各自好處如下圖所示:二、制式問(wèn)題1,30,00,02,2ABAB廠商2廠三、市場(chǎng)機(jī)會(huì)博弈-50,-50100,00,1000,0進(jìn)不進(jìn)進(jìn)不進(jìn)廠商2廠商1市場(chǎng)機(jī)會(huì)

進(jìn)

不進(jìn)

得益廠商1:2/31/30廠商2:2/31/30兩廠商同時(shí)發(fā)現(xiàn)一個(gè)市場(chǎng)機(jī)會(huì),但這個(gè)市場(chǎng)的容量并不大,兩個(gè)廠商該如何選擇呢?廠商1的混合策略必須使廠商2選擇進(jìn)與不進(jìn)的期望得益相同,廠商2的情形類似。三、市場(chǎng)機(jī)會(huì)博弈-50,-50100,00,1000,混合策略反應(yīng)函數(shù)◆反應(yīng)函數(shù):一博弈方對(duì)另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù)。在純策略的范疇內(nèi),反應(yīng)函數(shù)是各博弈方選擇的純策略對(duì)其他博弈方純策略的反應(yīng);在混合策略的范疇內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是一方對(duì)另一方的概率分布的反應(yīng),也是一定的概率分布。由于純策略可理解為混合策略,因此實(shí)際上反應(yīng)函數(shù)的概念,可以在混合策略概率分布之間反應(yīng)的意義上統(tǒng)一起來(lái)。混合策略反應(yīng)函數(shù)◆反應(yīng)函數(shù):一博弈方對(duì)另一博弈方每種可能的決法三:混合策略反應(yīng)函數(shù)猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布當(dāng)q<0.5時(shí),取r為1;當(dāng)q>0.5時(shí),取r為0當(dāng)r<0.5時(shí),取q為0;當(dāng)r>0.5時(shí),取q為1法三:混合策略反應(yīng)函數(shù)猜硬幣博弈-1,11,-11,-夫妻之爭(zhēng)博弈2,10,00,01,3時(shí)裝足球丈夫時(shí)裝足球妻子夫妻之爭(zhēng)rq111/33/4(r,1-r):妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布當(dāng)q<1/3時(shí),取r為0;當(dāng)q>1/3時(shí),取r為1當(dāng)r<3/4時(shí),取q為0;當(dāng)r>3/4時(shí),取q為1夫妻之爭(zhēng)博弈2,10,00,01,3時(shí)裝足球丈夫時(shí)裝混合戰(zhàn)略均衡

混合戰(zhàn)略要求人們以隨機(jī)的方式選擇自己的行動(dòng),由于隨機(jī)性行為無(wú)法準(zhǔn)確預(yù)期,因此很多人認(rèn)為混合戰(zhàn)略并非一個(gè)令人滿意的均衡概念?,F(xiàn)實(shí)生活中人們真會(huì)這樣采取行動(dòng)嗎?◆如何解釋混合戰(zhàn)略?參與人試圖通過(guò)選擇混合戰(zhàn)略給對(duì)手造成一種不確定性,使對(duì)手不能預(yù)測(cè)自己的行動(dòng)。如,猜硬幣、劃拳?;旌蠎?zhàn)略均衡混合戰(zhàn)略要求人們以隨機(jī)的方式選擇自己混合戰(zhàn)略均衡對(duì)參與人類型的一種推斷。如監(jiān)督博弈,老板不知道工人的類型,只知道“勤奮”、“懶惰”型工人各占50%。老板在選擇自己戰(zhàn)略時(shí)仿佛面臨的是一個(gè)選擇混合戰(zhàn)略的工人。混合戰(zhàn)略均衡對(duì)參與人類型的一種推斷。如監(jiān)督博弈,老板不知道工◆納什定理:在一個(gè)由n個(gè)博弈方的博弈中,如果n是有限的,且Si都是有限集(對(duì)i=1,…,n),則該博弈至

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論