博弈論教學(xué)全集_第1頁(yè)
博弈論教學(xué)全集_第2頁(yè)
博弈論教學(xué)全集_第3頁(yè)
博弈論教學(xué)全集_第4頁(yè)
博弈論教學(xué)全集_第5頁(yè)
已閱讀5頁(yè),還剩166頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈論教學(xué)全集第1頁(yè)/共171頁(yè)2023/3/28本章內(nèi)容博弈論的基本概念1納什均衡2納什均衡的應(yīng)用3納什均衡的存在性和多重性52混合策略納什均衡4第2頁(yè)/共171頁(yè)§1.認(rèn)識(shí)博弈1.田忌賽馬2023/3/283田忌/齊王齊王上中下中下上下上中上下中中上下下中上田忌上中下032112121212中下上120321121212下上中211203121212上下中121212032112中上下121212120321下上中211212121203第3頁(yè)/共171頁(yè)§1.認(rèn)識(shí)博弈2.智豬博弈有大豬、小豬同在一圈,只要按到某一按鈕就會(huì)有食物吃,按鈕到食槽有一段距離,每按一下會(huì)得到共8個(gè)單位的食物,每次按按鈕的成本為2。如果大豬先到,則大豬吃7,小豬吃1;如果小豬先到,大豬后到,則大豬吃4,小豬吃4;若同時(shí)到,則大豬吃5,小豬吃3。如果大豬按小豬等,則大豬得到4個(gè)單位的效用,小豬的到4個(gè)單位;若果大豬等小豬按,則大豬得到7個(gè)單位,小豬得到1個(gè)單位;如果同時(shí)按,大豬得5,小豬得3;如果都不按,則無(wú)所得。2023/3/284大豬/小豬小豬按等大豬按314等7-100第4頁(yè)/共171頁(yè)§1.認(rèn)識(shí)博弈3.攻城博弈我方擁有兩個(gè)師的兵力,敵方三個(gè)師的兵力盤(pán)踞在一座城市中。通往城市的道路有甲和乙兩條。規(guī)定雙方兵力都只能整師調(diào)動(dòng),誰(shuí)的兵力勝過(guò)對(duì)方就勝利。分析:敵人布防策略:A.三個(gè)師駐守甲B.兩個(gè)師駐守甲,一個(gè)師駐守乙C.一個(gè)師駐守甲,兩個(gè)師駐守乙D.三個(gè)師駐守乙我方進(jìn)攻策略:a.集中兵力進(jìn)攻甲b.兵分兩路,分攻甲、乙c.集中兵力進(jìn)攻乙2023/3/285第5頁(yè)/共171頁(yè)§1.認(rèn)識(shí)博弈對(duì)戰(zhàn)局進(jìn)行預(yù)測(cè)并選擇進(jìn)攻策略2023/3/286我方/敵方敵方ABCD我方a-,+-,++,-+,-b+,--,+-,++,-c+,-+,--,+-,+第6頁(yè)/共171頁(yè)§1.認(rèn)識(shí)博弈4.拿子游戲有兩堆火柴,一堆2支,一堆1支。有兩個(gè)游戲參與者甲和乙。要求:每人每次只能從一堆中取,可以取任意數(shù)量,最后拿完者贏,記為1;輸者,記為-1。2023/3/287甲(2,1)乙(1,1)(0,1)(2,0)1,-11,-1-1,11,-1-1,1(1,0)(0,1)(0,0)(1,0)(0,0)第7頁(yè)/共171頁(yè)§1.認(rèn)識(shí)博弈5.說(shuō)明以下幾個(gè)案例是否為博弈案例?1.《華商報(bào)》定價(jià)2.OPEC成員國(guó)選擇年產(chǎn)量3.兩家制造商,一家生產(chǎn)螺釘,一家生產(chǎn)螺帽,在公制和美制之間選擇生產(chǎn)標(biāo)準(zhǔn)4.一家公司的董事會(huì)為其總經(jīng)理設(shè)立一項(xiàng)期股安排5.華為集團(tuán)對(duì)市場(chǎng)預(yù)測(cè)后準(zhǔn)備在陜西師范大學(xué)國(guó)際商學(xué)院2008屆畢業(yè)生中招聘員工2023/3/288第8頁(yè)/共171頁(yè)§1.認(rèn)識(shí)博弈6.博弈三要素:(1)參與人(2)行動(dòng)或戰(zhàn)略(3)支付或盈利2023/3/289第9頁(yè)/共171頁(yè)§2.博弈論的基本概念1.參與人(players)在囚徒博弈(也叫囚徒困境)中,張三和李四是參與人,也稱(chēng)為對(duì)局人、局中人。張三和李四都是在博弈中作出決策而獲得最大化效用的人。2023/3/2810李四/張三張三認(rèn)罪抵賴(lài)?yán)钏恼J(rèn)罪55015抵賴(lài)15011第10頁(yè)/共171頁(yè)§2.博弈論的基本概念(1)參與人:在博弈(或?qū)郑┲凶鞒鰶Q策以獲得最大效用的個(gè)體,稱(chēng)為局中人。n個(gè)個(gè)體參加的博弈稱(chēng)為n人博弈。囚徒困境是二人博弈(2-persongame)。2023/3/2811李四/張三張三認(rèn)罪抵賴(lài)?yán)钏恼J(rèn)罪55015抵賴(lài)01511第11頁(yè)/共171頁(yè)§2.博弈論的基本概念參與人可以是自然人、法人、團(tuán)體,也可以是一種情況,當(dāng)表示某一種情況時(shí)稱(chēng)為“自然”。(2)自然:是一種虛擬參與人,它在博弈的特定時(shí)點(diǎn)上以特定的概率隨機(jī)選擇行動(dòng)。例:一個(gè)房地產(chǎn)市場(chǎng)有大小兩個(gè)房產(chǎn)開(kāi)發(fā)商A和B。2023/3/2812AB等待開(kāi)發(fā)等待開(kāi)發(fā)等待開(kāi)發(fā)在這個(gè)博弈中,A和B的是否開(kāi)發(fā),開(kāi)發(fā)的結(jié)局如何,與市場(chǎng)的大小有密切的關(guān)系?!笆袌?chǎng)容量”在這里就是自然,它以某種概率分而存在。第12頁(yè)/共171頁(yè)§2.博弈論的基本概念2.行動(dòng)(action)在智豬博弈中,大豬可選的決策有兩個(gè)(按,等),小豬也是同樣的兩個(gè)。在攻城博弈中,我方有三個(gè)行動(dòng)可供選擇(a,b,c),敵方有四個(gè)行動(dòng)可供選擇(A,B,C,D)。2023/3/2813大豬/小豬小豬按等大豬按314等7-100我方/敵方敵方ABCD我方a-,+-,++,-+,-b+,--,+-,++,-c+,-+,--,+-,+第13頁(yè)/共171頁(yè)§2.博弈論的基本概念(1)行動(dòng):概念:參與人在博弈的某個(gè)時(shí)點(diǎn)上的決策變量。參與人的行動(dòng)可能是連續(xù)的也可能是離散的。第i個(gè)參與人的一個(gè)特定行動(dòng)記作:aik(k∈K),則:例如,在攻城博弈中,我方的行動(dòng)為:(a,b,c)。2023/3/2814我方/敵方敵方ABCD我方a-,+-,++,-+,-b+,--,+-,++,-c+,-+,--,+-,+第14頁(yè)/共171頁(yè)§2.博弈論的基本概念(2)行動(dòng)集:第i個(gè)參與人的所有行動(dòng)的集合稱(chēng)為行動(dòng)集,記作:例如,在攻城博弈中,敵方的策略集為:{A,B,C,D}。2023/3/2815我方/敵方敵方ABCD我方a-,+-,++,-+,-b+,--,+-,++,-c+,-+,--,+-,+第15頁(yè)/共171頁(yè)§2.博弈論的基本概念(3)行動(dòng)組合:在n人博弈中,每一個(gè)可能的結(jié)果都不是某個(gè)參與人單獨(dú)決策的結(jié)果,而是所有參與人共同采取某一系列行動(dòng)共同作用的結(jié)果,n個(gè)參與人行動(dòng)的有序集a=(a1,…,ai,…an,)稱(chēng)為該博弈中的一個(gè)行動(dòng)組合。例如,在智豬博弈中,大豬的“按”和小豬的“等”就組成一個(gè)策略組合,記作:a=(按,等)。2023/3/2816大豬/小豬小豬按等大豬按314等7-100第16頁(yè)/共171頁(yè)§2.博弈論的基本概念(4)行動(dòng)順序:是參與人在博弈中采取行動(dòng)的時(shí)間排序。這是區(qū)分靜態(tài)與動(dòng)態(tài)博弈的基礎(chǔ)。一般情況下,假定參與人的行動(dòng)空間和行動(dòng)順序是所有參與人的共同知識(shí)。2023/3/2817甲(2,1)乙(1,1)(0,1)(2,0)1,-11,-1-1,11,-1-1,1(1,0)(0,1)(0,0)(1,0)(0,0)第17頁(yè)/共171頁(yè)§2.博弈論的基本概念3.信息(information)(1)信息:參與人有關(guān)博弈的知識(shí),特別是有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)。2023/3/2818AB等待開(kāi)發(fā)等待開(kāi)發(fā)等待開(kāi)發(fā)在這個(gè)博弈中,A和B的是否開(kāi)發(fā),開(kāi)發(fā)的結(jié)局如何,與市場(chǎng)的大小有密切的關(guān)系。“市場(chǎng)容量”在這里就是自然,它以某種概率分而存在。第18頁(yè)/共171頁(yè)§2.博弈論的基本概念(2)信息集:在博弈中描述參與人信息特征的集合。在動(dòng)態(tài)博弈中會(huì)有詳細(xì)的概念。2023/3/2819AB不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)不不N小(1/2)大(1/2)小(1/2)大(1/2)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)第19頁(yè)/共171頁(yè)§2.博弈論的基本概念(3)完全信息:指“自然”不首先行動(dòng)或“自然”的初始行動(dòng)被所有參與人都觀察到的情況,既沒(méi)有事前不確定性。(海薩尼的新定義)2023/3/2820AB不開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)第20頁(yè)/共171頁(yè)§2.博弈論的基本概念(4)完美信息:是指一個(gè)參與人對(duì)其他參與人(包括“自然”)的行動(dòng)選擇都準(zhǔn)確了解的情況,即每一個(gè)信息集只包含一個(gè)值。(5)共同知識(shí):每一個(gè)局中人都知道博弈的規(guī)則,并且這一現(xiàn)象是眾所周知的。2023/3/2821AB不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)不不N小(1/2)大(1/2)小(1/2)大(1/2)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)第21頁(yè)/共171頁(yè)完美信息、確定信息、對(duì)稱(chēng)信息、完全信息信息類(lèi)型含義完美每個(gè)信息集都是單結(jié)的確定自然不在任一參與人行動(dòng)之后行動(dòng)(是否擁有優(yōu)勢(shì)私人信息)對(duì)稱(chēng)沒(méi)有參與人在行動(dòng)時(shí)或在終點(diǎn)結(jié)處有與其他參與人不同的信息完全自然不首先行動(dòng),或自然的最初行動(dòng)能被每個(gè)參與人觀察到2023/3/2822信息類(lèi)型誰(shuí)能摸到最好的牌完美確定1.所有的牌都被洗成面朝上確定對(duì)稱(chēng)不完全2.所有的牌都被洗成面朝下且下注前不能看自己的牌確定非對(duì)稱(chēng)不完全3.所有的牌都被洗成面朝下且下注前只能看自己的牌確定非對(duì)稱(chēng)完全4.所有的牌都被洗成面朝上但都可以悄悄丟掉一張牌完美不確定5.所有的牌都被洗成面朝上,然后下注,最后再得一張面向上的牌確定非對(duì)稱(chēng)不完全6.所有的牌都被洗成面朝下,抓起不能看自己的牌并舉過(guò)頭頂讓其他參與人都看清楚自己的牌第22頁(yè)/共171頁(yè)§2.博弈論的基本概念4.戰(zhàn)略(strategies)(1)戰(zhàn)略:是參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。例:以下房產(chǎn)商開(kāi)發(fā)博弈中,A有2個(gè)戰(zhàn)略,B有4個(gè)戰(zhàn)略。2023/3/2823AB不開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)第23頁(yè)/共171頁(yè)§2.博弈論的基本概念(2)戰(zhàn)略組合:一般地,如果si表示第i個(gè)參與人的一個(gè)特定戰(zhàn)略,表示Si={si}第i個(gè)參與人的所有可選擇的戰(zhàn)略集合。若n個(gè)參與人每人選擇一個(gè)戰(zhàn)略,n維向量s={s1,…,si,…,sn}稱(chēng)為一個(gè)戰(zhàn)略組合。2023/3/2824AB不開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)第24頁(yè)/共171頁(yè)§2.博弈論的基本概念(3)戰(zhàn)略與行動(dòng):在靜態(tài)博弈中,戰(zhàn)略與行動(dòng)是相同的;在動(dòng)態(tài)博弈中,戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身。例:在以下博弈中,開(kāi)發(fā)、不開(kāi)發(fā)都是行動(dòng),對(duì)于B來(lái)說(shuō),無(wú)論A是否開(kāi)發(fā)B都開(kāi)發(fā),即{開(kāi)發(fā),開(kāi)發(fā)}是B的一個(gè)戰(zhàn)略。2023/3/2825AB不開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)第25頁(yè)/共171頁(yè)§2.博弈論的基本概念5.支付(payoff)在智豬博弈中,對(duì)應(yīng)于行動(dòng)組合(按,等),大豬和小豬的效用為(2,4),這被稱(chēng)為支付。(1)支付:在博弈論中,支付或者是指一個(gè)特定的行動(dòng)或戰(zhàn)略組合下參與人得到的確定的效用水平,或者是指參與人得到的期望效用水平。第i個(gè)參與人的支付記作:ui。u=(u1,…,ui,…,un)是n個(gè)參與人的支付組合。2023/3/2826大豬/小豬小豬按等大豬按314等7-100第26頁(yè)/共171頁(yè)§2.博弈論的基本概念(2)支付函數(shù):在博弈論中,參與人的支付不僅取決于自己的行動(dòng)或戰(zhàn)略選擇,而且取決于其他參與人行動(dòng)或戰(zhàn)略選擇,它們的行動(dòng)或戰(zhàn)略共同構(gòu)成一個(gè)行動(dòng)或戰(zhàn)略組合,這個(gè)組合決定參與人的效用水平。行動(dòng)或戰(zhàn)略組合與參與人的效用水平之間的關(guān)系稱(chēng)為支付函數(shù)。第i個(gè)參與人的效用函數(shù)記作:ui=ui(s)。2023/3/2827大豬/小豬小豬按等大豬按314等7-100第27頁(yè)/共171頁(yè)§2.博弈論的基本概念6結(jié)果結(jié)果是博弈分析者感興趣的所有東西,如均衡戰(zhàn)略組合、均衡行動(dòng)組合、均衡支付組合等。例:在智豬博弈中,均衡的行動(dòng)組合為(按,等),均衡支付組合為(2,4),這些都是博弈的結(jié)果。2023/3/2828大豬/小豬小豬按等大豬按314等7-100第28頁(yè)/共171頁(yè)§2.博弈論的基本概念7.均衡均衡:是所有參與人的最優(yōu)戰(zhàn)略或行動(dòng)組合。博弈的均衡缺乏唯一性。在動(dòng)態(tài)博弈中,均衡和均衡結(jié)果是有區(qū)別的:在房產(chǎn)開(kāi)發(fā)博弈中,如果(開(kāi)發(fā),{不開(kāi)發(fā),開(kāi)發(fā)})是一個(gè)均衡,則(開(kāi)發(fā),不開(kāi)發(fā))是均衡結(jié)果。2023/3/2829第29頁(yè)/共171頁(yè)§2.博弈論的基本概念8.博弈進(jìn)行的條件(1)利益是交易的前提(2)理性是參與人的共同知識(shí)2023/3/2830第30頁(yè)/共171頁(yè)§2.博弈論的基本概念9.博弈的表達(dá)式(1)矩陣(戰(zhàn)略)型表達(dá)式2023/3/2831我方/敵方敵方ABCD我方a-,+-,++,-+,-b+,--,+-,++,-c+,-+,--,+-,+第31頁(yè)/共171頁(yè)§2.博弈論的基本概念A(yù).矩陣型表達(dá)式:是將參與人的戰(zhàn)略和支付用一張表格的形式表示出來(lái),也叫作矩陣型、正則型。2023/3/2832004等7-1等31按小豬按大豬大豬/小豬列參與人行參與人矩陣型表達(dá)式第32頁(yè)/共171頁(yè)§2.博弈論的基本概念B.有限博弈:如果一個(gè)博弈滿(mǎn)足:a.參與人有限,b.每個(gè)參與人的戰(zhàn)略或行動(dòng)有限,則稱(chēng)此博弈為有限博弈。兩人有限博弈可以采用矩陣型表達(dá)式直觀地表達(dá)出來(lái)。2023/3/2833大豬/小豬小豬按等大豬按314等7-100第33頁(yè)/共171頁(yè)§2.博弈論的基本概念(2)展開(kāi)型表達(dá)式例:抓錢(qián)博弈有甲乙二人,在時(shí)刻一,兩個(gè)人的托盤(pán)上都有1元錢(qián),由甲來(lái)決策是否拿走這1元錢(qián)。如果甲拿走,則乙也拿走,游戲結(jié)束;如果不拿走,作為獎(jiǎng)勵(lì),甲和乙的盤(pán)子里都會(huì)多出1元錢(qián)。在時(shí)刻2,將由乙來(lái)決策,決策的過(guò)程和結(jié)果與甲相同。如果到時(shí)刻4,甲乙都沒(méi)有拿走錢(qián),作為獎(jiǎng)勵(lì),盤(pán)子的錢(qián)會(huì)增加到5元并獎(jiǎng)勵(lì)給兩人,游戲結(jié)束。2023/3/2834甲乙乙甲不拿不拿不拿不拿拿拿拿拿(5,5)(4,4)(3,3)(2,2)(1,1)第34頁(yè)/共171頁(yè)§2.博弈論的基本概念概念:展開(kāi)型是博弈規(guī)則的圖形表達(dá)式,其主要的畫(huà)圖形式是由一個(gè)根和若干枝依次排列組成,稱(chēng)為博弈樹(shù)。2023/3/2835甲(2,1)乙(1,1)(0,1)(2,0)1,-11,-1-1,11,-1-1,1(1,0)(0,1)(0,0)(1,0)(0,0)博弈樹(shù)的根博弈樹(shù)的枝:棱博弈樹(shù)的決策節(jié)博弈樹(shù)的末端節(jié)博弈樹(shù)第35頁(yè)/共171頁(yè)§2.博弈論的基本概念(3)博弈數(shù)學(xué)表達(dá)式在古諾模型中,產(chǎn)量Q是戰(zhàn)略空間,利潤(rùn)π是支付,則戰(zhàn)略式為:2023/3/2836第36頁(yè)/共171頁(yè)§3.博弈論的基本分類(lèi)1.按照行動(dòng)的順序分類(lèi)(1)靜態(tài)博弈所有參與人同時(shí)選擇行動(dòng)而且只選擇一次。在特殊情況下,雖然參與人采取行并不同時(shí),但由于在相差的時(shí)間段內(nèi)不知道其他局中人的有沒(méi)有采取行動(dòng),也稱(chēng)為靜態(tài)博弈。2023/3/2837李四/張三張三認(rèn)罪抵賴(lài)?yán)钏恼J(rèn)罪55015抵賴(lài)01511第37頁(yè)/共171頁(yè)§3.博弈論的基本分類(lèi)(2)動(dòng)態(tài)博弈先后或序貫行動(dòng)的博弈稱(chēng)為動(dòng)態(tài)博弈;也就是說(shuō),在一定的時(shí)期內(nèi),不同的參與人都知道其他參與人是否在自己采取行動(dòng)之前采取了行動(dòng)。2023/3/2838甲乙乙甲不拿不拿不拿不拿拿拿拿拿(5,5)(4,4)(3,3)(2,2)(1,1)第38頁(yè)/共171頁(yè)§3.博弈論的基本分類(lèi)2.按照對(duì)參與人特征的了解情況分類(lèi)完全信息:每個(gè)參與人對(duì)所有其他參與人的特征(包括戰(zhàn)略空間、支付函數(shù)等)有完全的了解。完全信息博弈:在博弈中每個(gè)局中人都知道其他局中人的戰(zhàn)略空間、支付函數(shù)等情況,稱(chēng)為完全信息博弈。否則,稱(chēng)為不完全信息博弈。2023/3/2839第39頁(yè)/共171頁(yè)§3.博弈論的基本分類(lèi)3.按照參與人采取行動(dòng)前對(duì)信息了解的情況分類(lèi)(1)完美信息博弈在(動(dòng)態(tài))博弈進(jìn)行中的每一時(shí)刻,參與人在面臨決策時(shí)對(duì)于博弈進(jìn)行此刻的所有參與人曾經(jīng)采取的決策都完全清楚了解,也就是說(shuō),每一個(gè)信息集中只包含一個(gè)策略,這稱(chēng)為完美信息博弈。(2)不完美信息博弈對(duì)博弈進(jìn)程中的其他局中人采取的行動(dòng)不完全了解就稱(chēng)為不完美信息博弈。2023/3/2840第40頁(yè)/共171頁(yè)§3.博弈論的基本分類(lèi)4.按照博弈支付和的特征分類(lèi)(1)零和博弈和非零和博弈例:拋硬幣博弈兩個(gè)參與人拋硬幣比賽,兩個(gè)人各拋一次,如果兩次的結(jié)果都相同,參與人1盈利為1,參與人2盈利為-1;如果兩次的結(jié)果相反,參與人1盈利為-1,參與人2盈利為1。概念:如果一個(gè)博弈中所有局中人的盈利總和總是為零,就稱(chēng)為零和博弈。如果博弈中所有局中人的盈利總和不總是為零,就稱(chēng)為非零和博弈。2023/3/28411/22正反1正1-1-11反-111-1第41頁(yè)/共171頁(yè)§3.博弈論的基本分類(lèi)(2)常和博弈和非常和博弈例:壁球比賽概念:如果一個(gè)博弈中所有局中人的盈利之和總保持為一個(gè)常數(shù),就稱(chēng)為零和博弈。如果一個(gè)博弈中所有局中人的盈利不是總保持為一個(gè)常數(shù),就稱(chēng)為非常和博弈或變和博弈。2023/3/28421/22前進(jìn)后退1前面20807030后面90103070第42頁(yè)/共171頁(yè)§4.納什均衡1.占優(yōu)戰(zhàn)略均衡(1)嚴(yán)格占優(yōu)戰(zhàn)略例:在囚徒困境中,無(wú)論張三采取什么行動(dòng),李四的“坦白”獲得的支付總比“抵賴(lài)”獲得的支付大,所以,“坦白”是李四的嚴(yán)格占優(yōu)戰(zhàn)略。2023/3/2843李四/張三張三坦白抵賴(lài)?yán)钏奶拱?3-30-5抵賴(lài)-50-1-1第43頁(yè)/共171頁(yè)§4.納什均衡(2)嚴(yán)格占優(yōu)戰(zhàn)略均衡例:在囚徒困境中,李四的嚴(yán)格占優(yōu)戰(zhàn)略是“坦白”,張三的嚴(yán)格占優(yōu)戰(zhàn)略也是“坦白”,所以,李四和張三都會(huì)根據(jù)理性作出判斷,選擇嚴(yán)格優(yōu)勢(shì)戰(zhàn)略——“坦白”作為自己的戰(zhàn)略。因此,最終均衡就是(坦白,坦白),這種由嚴(yán)格占優(yōu)戰(zhàn)略得到的均衡就稱(chēng)為嚴(yán)格占優(yōu)戰(zhàn)略均衡。2023/3/2844李四/張三張三坦白抵賴(lài)?yán)钏奶拱?3-30-5抵賴(lài)-50-1-1第44頁(yè)/共171頁(yè)§4.納什均衡(3)(弱)占優(yōu)戰(zhàn)略有很多博弈并沒(méi)有嚴(yán)格占優(yōu)戰(zhàn)略,而是具有弱占優(yōu)戰(zhàn)略。在下面的牌花博弈中,李四和張三都沒(méi)有嚴(yán)格優(yōu)勢(shì)戰(zhàn)略,李四的“?”與“?”相比,存在弱優(yōu)勢(shì),即:2023/3/2845李四/張三張三??李四?10550?10001第45頁(yè)/共171頁(yè)§4.納什均衡(4)(弱)占優(yōu)戰(zhàn)略均衡在下面的博弈中,李四的“?”是弱占優(yōu)戰(zhàn)略,所以李四選擇“?”;相對(duì)于李四的“?”,張三的“?”是占優(yōu)戰(zhàn)略,張三會(huì)選擇“?”。最終的均衡是(?,?)。2023/3/2846李四/張三張三??李四?10550?10001第46頁(yè)/共171頁(yè)§4.納什均衡(5)重復(fù)剔除占優(yōu)均衡例:假設(shè)有兩個(gè)寡頭公司壟斷某種產(chǎn)品的市場(chǎng)。每個(gè)公司都可采取三個(gè)價(jià)格中的任意一個(gè):高、中、低,如果哪個(gè)公司采取較低的價(jià)格就可以占有整個(gè)市場(chǎng),如果價(jià)格相同就會(huì)平分市場(chǎng)。給出博弈的矩陣表達(dá)式:2023/3/2847公司1/公司2公司2高中低公司1高6,60,100,8中10,05,50,8低8,08,04,4第47頁(yè)/共171頁(yè)§4.納什均衡(a)在對(duì)矩陣表達(dá)式觀察后,會(huì)發(fā)現(xiàn)無(wú)論對(duì)于公司1還是公司2,高價(jià)戰(zhàn)略都是劣戰(zhàn)略,因此首先剔除“高”戰(zhàn)略。2023/3/2848公司1/公司2公司2高中低公司1高6,60,100,8中10,05,50,8低8,08,04,4第48頁(yè)/共171頁(yè)§4.納什均衡(b)在第一輪的剔除后,后發(fā)現(xiàn)無(wú)論對(duì)于公司1還是公司2,中價(jià)戰(zhàn)略都是劣戰(zhàn)略,因此再次剔除“中”戰(zhàn)略。(c)最后剩下了唯一的戰(zhàn)略均衡對(duì)(低,低),就是重復(fù)剔除的占優(yōu)戰(zhàn)略解。解的結(jié)果或盈利是(4,4)。2023/3/2849公司1/公司2公司2高中低公司1高6,60,100,8中10,05,50,8低8,08,04,4第49頁(yè)/共171頁(yè)§4.納什均衡2023/3/2850第50頁(yè)/共171頁(yè)§4.納什均衡例:理性是共同知識(shí)2023/3/2851公司1/公司2公司2LMR公司1U1,01,20,1D0,30,12,0公司1/公司2公司2LM公司1U1,01,2D0,30,1公司1/公司2公司2LM公司1U1,01,2第51頁(yè)/共171頁(yè)§4.納什均衡例:不具備重復(fù)剔除占優(yōu)可解性2023/3/2852公司1/公司2公司2C1C2C3公司1R12,121,101,12R20,120,100,11R30,120,100,13公司1/公司2公司2C1C2C3公司1R12,121,101,12R20,120,100,11公司1/公司2公司2C1C2公司1R12,121,10R20,120,10公司1/公司2公司2C1C2C3公司1R12,121,101,12R20,120,100,11R30,120,100,13公司1/公司2公司2C1C3公司1R12,121,12R20,120,11R30,120,13公司1/公司2公司2C1C3公司1R12,121,12R30,120,13第52頁(yè)/共171頁(yè)§4.納什均衡(5)重復(fù)剔除占優(yōu)戰(zhàn)略可解性如果局中人的一組戰(zhàn)略組合s′是重復(fù)剔除劣戰(zhàn)略后剩下的唯一的戰(zhàn)略組合,這個(gè)戰(zhàn)略組合稱(chēng)為重復(fù)剔除優(yōu)勢(shì)戰(zhàn)略解。如果重復(fù)剔除劣戰(zhàn)略后剩下的戰(zhàn)略組合是唯一的,稱(chēng)該博弈是重復(fù)剔除戰(zhàn)略可解的。2023/3/2853第53頁(yè)/共171頁(yè)§4.納什均衡例.綜合例題兩個(gè)公司設(shè)置市場(chǎng)價(jià)格,p是價(jià)格,則需求曲線為:Q=D(P),D(P-1)>D(P)。如果公司1是定價(jià)較低的公司,那么公司1將滿(mǎn)足所有的市場(chǎng)需求;同樣也適用于公司2。如果兩個(gè)公司報(bào)價(jià)相同,則各得一半的市場(chǎng)份額。假如壟斷價(jià)格為pm(pm

≥2)報(bào)價(jià)以單位美元遞增,沒(méi)有生產(chǎn)成本。要求:(1)問(wèn):高于壟斷價(jià)格的要價(jià)是否都是劣戰(zhàn)略;pm-1要價(jià)戰(zhàn)略是否優(yōu)于壟斷價(jià)格戰(zhàn)略。(2)證明:該博弈具有占優(yōu)可解性。2023/3/2854第54頁(yè)/共171頁(yè)§4.納什均衡解:首先寫(xiě)出博弈的矩陣表達(dá)式:2023/3/2855公司1/公司2公司2pm-1pmPm+1Pm+2公司1pm-1?π(pm-1)?π(pm-1)0π(pm-1)0π(pm-1)0π(pm-1)pmπ(pm-1)0?π(pm)?π(pm)0π(pm)0π(pm)Pm+1π(pm-1)0π(pm)0?π(pm+1)?π(pm+1)0π(pm+1)Pm+2π(pm-1)0π(pm)0π(pm+1)0?π(pm+2)?π(pm+2)第55頁(yè)/共171頁(yè)§4.納什均衡①假定有一個(gè)高于壟斷價(jià)格的兩個(gè)要價(jià)為pm+n-1和pm+n,根據(jù)博弈的戰(zhàn)略表達(dá)式可知,公司1和公司2的兩個(gè)高于壟斷價(jià)格的盈利向量分別為:2023/3/2856第56頁(yè)/共171頁(yè)§4.納什均衡是明確的,但是下式是否成立,有待于證明:2023/3/2857第57頁(yè)/共171頁(yè)§4.納什均衡由以上結(jié)果可知,高于壟斷價(jià)格的戰(zhàn)略并不是劣戰(zhàn)略,只有第n+2個(gè)戰(zhàn)略是第n+1個(gè)戰(zhàn)略的劣戰(zhàn)略。低于壟斷價(jià)格的戰(zhàn)略不是占優(yōu)戰(zhàn)略。②證明:在整個(gè)博弈矩陣表達(dá)式中,假如有n+2個(gè)戰(zhàn)略,那么,在對(duì)比中,會(huì)發(fā)現(xiàn)第n+2個(gè)戰(zhàn)略是第n+1個(gè)戰(zhàn)略的劣戰(zhàn)略,即,要價(jià)為pm+n的戰(zhàn)略是要價(jià)為pm+n-1戰(zhàn)略的劣戰(zhàn)略。根據(jù)剔除劣戰(zhàn)略的原則,經(jīng)過(guò)逐次剔除,最后剩下價(jià)格為pm-1的戰(zhàn)略,這對(duì)于公司1和公司2來(lái)說(shuō)是唯一的。所以,該博弈存在占優(yōu)可解性。2023/3/2858第58頁(yè)/共171頁(yè)§4.納什均衡2.相對(duì)占優(yōu)戰(zhàn)略均衡(1)相對(duì)占優(yōu)戰(zhàn)略在愛(ài)情博弈中,既沒(méi)有嚴(yán)格優(yōu)勢(shì)戰(zhàn)略也沒(méi)有(弱)占優(yōu)戰(zhàn)略,只有相對(duì)占優(yōu)戰(zhàn)略。例如,當(dāng)張媛選擇“英語(yǔ)”時(shí),李明的占優(yōu)戰(zhàn)略為“英語(yǔ)”,即:對(duì)于張媛的“英語(yǔ)”李明的相對(duì)占優(yōu)戰(zhàn)略為“英語(yǔ)”。2023/3/2859李明/張媛張媛英語(yǔ)法語(yǔ)李明英語(yǔ)3

211法語(yǔ)002

3第59頁(yè)/共171頁(yè)§4.納什均衡2023/3/2860李明/張媛張媛英語(yǔ)法語(yǔ)李明英語(yǔ)3

211法語(yǔ)002

3第60頁(yè)/共171頁(yè)§4.納什均衡(2)相對(duì)占優(yōu)戰(zhàn)略均衡在愛(ài)情博弈中,對(duì)于張媛的“英語(yǔ)”李明的相對(duì)占優(yōu)戰(zhàn)略為“英語(yǔ)”,對(duì)于張媛的“法語(yǔ)”李明的相對(duì)占優(yōu)戰(zhàn)略為“法語(yǔ)”;對(duì)于李明的“英語(yǔ)”張媛的相對(duì)占優(yōu)戰(zhàn)略為“英語(yǔ)”,對(duì)于李明的“法語(yǔ)”張媛的相對(duì)占優(yōu)戰(zhàn)略為“法語(yǔ)”。該博弈的均衡就為(英語(yǔ),英語(yǔ)),(法語(yǔ),法語(yǔ)),這稱(chēng)為相對(duì)占優(yōu)戰(zhàn)略均衡。2023/3/2861李明/張媛張媛英語(yǔ)法語(yǔ)李明英語(yǔ)3

211法語(yǔ)002

3第61頁(yè)/共171頁(yè)§4.納什均衡3.納什均衡(1)最優(yōu)反應(yīng)例:2023/3/2862公司1/公司2公司2LCR公司1U0,44,05,3M4,00,45,3D3,53,56,6第62頁(yè)/共171頁(yè)§4.納什均衡2023/3/2863第63頁(yè)/共171頁(yè)§4.納什均衡(2)納什均衡(3)納什均衡舉例例1.古諾寡頭競(jìng)爭(zhēng)模型1.寡頭競(jìng)爭(zhēng)解2023/3/2864第64頁(yè)/共171頁(yè)§4.納什均衡2023/3/2865第65頁(yè)/共171頁(yè)§4.納什均衡2023/3/2866第66頁(yè)/共171頁(yè)§4.納什均衡2.寡頭“合作”解(合作的意思是說(shuō),兩個(gè)公司都認(rèn)為,利潤(rùn)的大小決定于兩個(gè)公司的總產(chǎn)量,并以此為條件,來(lái)決定各自的產(chǎn)量。也就說(shuō),并不存在真正意義上的合作。):2023/3/2867第67頁(yè)/共171頁(yè)§4.納什均衡例2.斯坦克伯格模型:該模型是在古諾模型的基礎(chǔ)上研究的。假定公司1在公司2之前決定它的產(chǎn)量,公司2的決策是在公司1決策之后作出的,也就說(shuō),公司2是在公司1選定產(chǎn)量后根據(jù)自己的反應(yīng)函數(shù)選擇自己的產(chǎn)量。2023/3/2868第68頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用1.完全競(jìng)爭(zhēng)模型2023/3/2869第69頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2.豪泰林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型豪泰林價(jià)格模型假定產(chǎn)品沒(méi)有差別,但產(chǎn)品在空間位置上有差別,有了不同的運(yùn)輸成本,造成價(jià)格的差別,由此而引起價(jià)格競(jìng)爭(zhēng)。2023/3/2870第70頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2871x1

2011-xx第71頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2872第72頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2873x12ab1-x-bx-a01第73頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2874第74頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用3.公地問(wèn)題在16世紀(jì)的英格蘭,每個(gè)村莊中間有一塊公共草地,既可以用于公共集會(huì),也可以被每個(gè)人用來(lái)放牧牛羊。每個(gè)村民也有屬于自己的草地,但那些草地外人無(wú)權(quán)進(jìn)入,而對(duì)于公共草地大家都想盡量多地占有。這就產(chǎn)生了公地問(wèn)題。其實(shí)類(lèi)似公地問(wèn)題的事件很多。如國(guó)際公共海域、公共環(huán)境、公共自然資源、公共產(chǎn)品等。2023/3/2875第75頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2876第76頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2877第77頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2878第78頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2879第79頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2880第80頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2881第81頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2882第82頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2883第83頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2884第84頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用4.基礎(chǔ)設(shè)施建設(shè):中央政府和地方政府之間的博弈2023/3/2885第85頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2886第86頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2887第87頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2888第88頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2889第89頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2890第90頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2891第91頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用5.公共產(chǎn)品的私人供給2023/3/2892第92頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2893第93頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2894第94頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2895第95頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2896第96頁(yè)/共171頁(yè)§5.納什均衡的應(yīng)用2023/3/2897第97頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡1.混合策略與期望盈利例:浪子博弈在這一博弈中,兩個(gè)參與人都不知道對(duì)方選擇是否確定地選擇某個(gè)策略,因此,按照以前所學(xué)的知識(shí)無(wú)法得出均衡解。但是,如果知道對(duì)方將以某一概率對(duì)某一策略進(jìn)行選擇的話,就可以得出反應(yīng)函數(shù),就可以按照納什均衡的方法求得解。2023/3/2898父母/兒子兒子立志放蕩父母支助32-13不助-1100第98頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2023/3/2899第99頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡進(jìn)一步浪子博弈還可以作出如下解釋?zhuān)?023/3/28100父母/兒子兒子立志(q1)放蕩(q2)父母支助(p1)3,2-1,3不助(p2)-1,10,0第100頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡父母的最佳選擇p*=0.5,兒子的最佳選擇q*=0.2,解釋如下:(1)當(dāng)父母選擇支助的概率p>0.5時(shí),兒子的最佳選擇就是放蕩;當(dāng)父母選擇支助的概率p<0.5時(shí),兒子的最佳選擇就是立志。(2)當(dāng)兒子選擇立志的概率q>0.2時(shí),父母的最佳選擇就是支助;當(dāng)兒子選擇立志的概率q<0.2時(shí),父母的最佳選擇就是不支助。2023/3/28101父母/兒子兒子立志放蕩父母支助32-13不助-1100第101頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡從上例中可以看出,當(dāng)參與人在選擇戰(zhàn)略具有不確定性,考慮納什均衡時(shí),具體戰(zhàn)略的盈利已經(jīng)顯得不很重要,重要的是某個(gè)戰(zhàn)略的概率分布,因此,納什均衡的解也就必須包含概率,這樣的支付或盈利就稱(chēng)為期望盈利。(1)混合策略純戰(zhàn)略:參與人在給定的信息下只選擇一種特定戰(zhàn)略,這樣情況下的戰(zhàn)略,稱(chēng)為純戰(zhàn)略?;旌蠎?zhàn)略:參與人在給定信息下以某種概率分布選擇不同的戰(zhàn)略,在原來(lái)純戰(zhàn)略的基礎(chǔ)上,選擇某個(gè)戰(zhàn)略的概率分布稱(chēng)為混合戰(zhàn)略。2023/3/28102第102頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡(2)期望盈利2023/3/28103第103頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2023/3/28104父母/兒子兒子立志(q1)不立志(q2)父母支助(p1)32-13不助(p2)-1100第104頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2.混合戰(zhàn)略納什均衡例1.2023/3/28105甲/乙乙紅(q)黑(1-q)甲紅(p)-111-1黑(1-p)1-1-11第105頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2023/3/28106第106頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2023/3/28107pq11O1/21/2甲乙第107頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡解法2:代數(shù)法例2.2023/3/28108甲/乙乙德(q)法(1-q)甲德(p)3211法(1-p)0023第108頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡解法1:反應(yīng)函數(shù)法2023/3/28109pq11O1/43/4甲乙第109頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡解法2:代數(shù)法2023/3/28110第110頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡例3(三人博弈)三個(gè)參與人A、B、C,每個(gè)人的戰(zhàn)略集為{1,2,3}。每個(gè)人對(duì)應(yīng)于某個(gè)戰(zhàn)略的支付是用三個(gè)人選擇戰(zhàn)略中的最小數(shù)字乘以4,再減去自己所選擇戰(zhàn)略的值。三個(gè)局中人的混合戰(zhàn)略為:p,q,r學(xué)習(xí)如何寫(xiě)出三個(gè)局中人的矩陣型表達(dá)式。2023/3/28111第111頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2023/3/28112A/B/C(sc=1)B123A13,3,33,2,33,1,322,3,32,2,32,1,331,3,31,2,31,1,3A/B/C(sc=2)B123A13,3,23,2,23,1,322,3,26,6,66,5,631,3,25,6,65,5,6A/B/C(sc=3)B123A13,3,13,2,13,1,122,3,16,6,56,5,531,3,15,6,59,9,9第112頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2023/3/28113第113頁(yè)/共171頁(yè)§6.混合戰(zhàn)略納什均衡2023/3/28114第114頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用1.監(jiān)管博弈2023/3/28115稅收機(jī)關(guān)/納稅人納稅人逃稅不逃稅稅收機(jī)關(guān)檢查a-C+F,-a-Fa-C,-a不查0,0a,-a第115頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用2.自然壟斷自然壟斷是一種特殊行業(yè),只有市場(chǎng)上僅存在一家廠商時(shí),規(guī)模效應(yīng)才能產(chǎn)生。在一個(gè)自然壟斷行業(yè)形成時(shí),剛開(kāi)始有許多家廠商競(jìng)爭(zhēng),但由于規(guī)模效益尚未形成,每個(gè)廠商都要承擔(dān)損失。只有雄厚實(shí)力(資本)的廠商才能堅(jiān)持到最后,進(jìn)入規(guī)模效益階段,形成自然壟斷。2023/3/28116第116頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用(1)自然壟斷的簡(jiǎn)單模型假定有兩家廠商參與競(jìng)爭(zhēng),它們可能堅(jiān)持,也可能放棄,假定兩家都競(jìng)爭(zhēng)時(shí),每一時(shí)期會(huì)造成成本c,如果一家退出,另一家在每一時(shí)期就會(huì)獲得利潤(rùn)π(π>c)。競(jìng)爭(zhēng)的退出分為三個(gè)時(shí)期:t0、t1、t2。2023/3/28117公司1/公司2公司2t0t1t2公司1t00,00,π0,2πt1π,0-c,-c-c,π-ct22π,0π-c,-c-2c,-2c第117頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用2023/3/28118第118頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用2023/3/28119第119頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用(2)自然壟斷的擴(kuò)展模型2023/3/28120公司1/公司2公司2t1t2…tj…tN公司1t10,00,π…0,(j-1)π…0,

(N-1)πt2π,0-c,-c…-c,(j-2)π-c…-c,(N-2)π-c……………………ti(i-1)π,0(i-2)π-c,-c…-(i-1)c,-(j-1)c…-(i-1)c,(N-i)π-(i-1)c………………………tN(N-1)π,0(N-2)π-c,-c…(N-j)π-(j-1)c,-(j-1)c…-(N-1)c,-(N-1)c第120頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用2023/3/28121第121頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用2023/3/28122第122頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用2023/3/28123第123頁(yè)/共171頁(yè)§7.混合戰(zhàn)略納什均衡的應(yīng)用2023/3/28124第124頁(yè)/共171頁(yè)§8.零和博弈1.零和博弈的基本概念例:拋硬幣博弈兩個(gè)參與人拋硬幣比賽,兩個(gè)人各拋一次,如果兩次的結(jié)果都相同,參與人1盈利為1,參與人盈利為-1;如果兩次的結(jié)果相反,參與人1盈利為-1,參與人2盈利為-1。2023/3/28125甲/乙乙正反甲正1-1-11反-111-1第125頁(yè)/共171頁(yè)§8.零和博弈(1)零和博弈與非零和博弈零和博弈:無(wú)論參與人采取什么策略向量,參與人的盈利之和總為零。(2)常和博弈與非常和博弈常和博弈:無(wú)論參與人采取什么策略向量,參與人的盈利之和總為一個(gè)常數(shù)。2023/3/28126第126頁(yè)/共171頁(yè)§8.零和博弈(3)零和博弈和常和博弈之間的關(guān)系2023/3/28127第127頁(yè)/共171頁(yè)§8.零和博弈(4)零和博弈的另一種寫(xiě)法在二人博弈中,由于每一個(gè)策略組合中,二人的盈利之和是零,所以只要寫(xiě)出一個(gè)人的盈利,另外一個(gè)人的盈利也就知道了。2023/3/281281/22LMR1U584M-790D91-21/22LMR1U5,-58,-84,-4M-7,79,-90,0D9,-91,-1-2,2第128頁(yè)/共171頁(yè)§8.零和博弈2.零和博弈的解法(1)最小最大法例:找出下面零和博弈的納什均衡2023/3/281291/22LMR1U5844M-790-7D91-2-29941/22LMR1U5,-58,-84,-44M-7,79,-90,0-7D9,-91,-1-2,2-2-9-9-4第129頁(yè)/共171頁(yè)§8.零和博弈2023/3/281301/22LMR1U5844M-790-7D91-2-2994第130頁(yè)/共171頁(yè)§8.零和博弈最小最大法的表述2023/3/28131第131頁(yè)/共171頁(yè)§8.零和博弈(2)直線交叉法例:拋硬幣博弈2023/3/281321/22正反1正1-1Min=-1反-11Min=-1Max=1Max=1第132頁(yè)/共171頁(yè)§8.零和博弈2023/3/281331/22正反1正(p)1-1Min=-1反(1-p)-11Min=-1混合2p-11-2pMin=?π1O1-1p0.51π1O1-1p0.51第133頁(yè)/共171頁(yè)§8.零和博弈2023/3/281341/22正(q)反(1-q)混合1正(p)1-12q-1反(1-p)-111-2qMax=1Max=1Max=?π1O1-1p0.51π1O1-1p0.51第134頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性1.納什均衡(1)嚴(yán)格占優(yōu)戰(zhàn)略均衡(2)占優(yōu)戰(zhàn)略均衡(3)重復(fù)剔除占優(yōu)均衡(4)純戰(zhàn)略納什均衡(5)混合戰(zhàn)略納什均衡2023/3/2813512345第135頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性2.納什均衡的存在性定理(1)納什均衡存在性定理1每一個(gè)有限博弈至少存在一個(gè)納什均衡(純戰(zhàn)略或混合戰(zhàn)略的)。(2)納什均衡存在性定理2在n人戰(zhàn)略式博弈中,如果每個(gè)參與人的純戰(zhàn)略空間Si是歐氏空間上一個(gè)非空的、閉的、有界的凸集,支付函數(shù)ui(s)對(duì)于si是連續(xù)、擬凹的,存在一個(gè)純戰(zhàn)略納什均衡。(3)納什均衡存在性定理3在n人戰(zhàn)略式博弈中,如果每個(gè)參與人的純戰(zhàn)略空間Si是歐氏空間上一個(gè)非空的、閉的、有界的凸集,支付函數(shù)ui(s)對(duì)于si是連續(xù)的,存在一個(gè)純戰(zhàn)略納什均衡。2023/3/28136第136頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性3.多重納什均衡的甄別多數(shù)博弈都具有多個(gè)(兩個(gè)以上)納什均衡,怎樣從多重納什均衡種選擇更有利于自己的均衡,成為參與人必須面對(duì)的問(wèn)題。例1.性別博弈例2.狩獵博弈2023/3/28137丈夫/妻子妻子足球歌劇丈夫足球3,10,0歌劇0,01,3甲/乙乙獵鹿打兔甲獵鹿10,100,4打兔4,04,4第137頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性(1)帕累托優(yōu)勢(shì)標(biāo)準(zhǔn)按照具體的盈利大小來(lái)篩選納什均衡(海薩尼和滕爾澤)。2023/3/28138甲/乙乙獵鹿打兔甲獵鹿10,100,4打兔4,04,4第138頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性(2)風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn)a.風(fēng)險(xiǎn)優(yōu)勢(shì)法:風(fēng)險(xiǎn)小的優(yōu)先。2023/3/28139甲/乙乙左右甲上9,90,8下8,08,8第139頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性b.偏離損失比較法2023/3/28140甲/乙乙左右甲上6(A)60,5下5,04(B)4第140頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性c.特殊情況2023/3/28141甲/乙乙左右甲上M/2,0M(B)0下M-m(A)0M-m,4第141頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性d.帕累托標(biāo)準(zhǔn)與風(fēng)險(xiǎn)優(yōu)勢(shì)的關(guān)系以帕累托標(biāo)準(zhǔn)選A;以風(fēng)險(xiǎn)優(yōu)勢(shì)選B。但多數(shù)人是風(fēng)險(xiǎn)厭惡者,選B。2023/3/28142甲/乙乙左右甲上6(A)6-1000,5下5,-10004(B)4第142頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性(3)聚點(diǎn)博弈在現(xiàn)實(shí)生活中,人們會(huì)使用博弈以外的信息來(lái)決定均衡,在既不存在帕累托關(guān)系也不存在風(fēng)險(xiǎn)優(yōu)劣關(guān)系的博弈中,人們往往依靠外在信息決定均衡。這被稱(chēng)為聚點(diǎn)均衡。(薩林,1960)性別博弈(恰逢女的生日)在沒(méi)有交通秩序鄉(xiāng)村,靠右邊走還是靠左邊走(習(xí)慣)電話博弈(一方主叫免費(fèi))2023/3/28143第143頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性(4)相關(guān)均衡參與人通過(guò)都能觀察到的共同信號(hào)選擇行動(dòng),依此確定博弈的結(jié)果。(奧蒙,1974)2023/3/28144甲/乙乙左右甲上5,10,0下4,41,5第144頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性2023/3/28145第145頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性(5)抗共謀博弈有一三人博弈,參與人分別為甲、乙、丙,策略集分別為{U,D}、{L,R}、{A,B}。2023/3/28146甲/乙/丙A乙LR甲U0,0,10-5,-5,0D-5,-5,01,1,-5甲/乙/丙B乙LR甲U-2,-2,0-5,-5,0D-5,-5,0-1,-1,5第146頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性2023/3/28147第147頁(yè)/共171頁(yè)§9.納什均衡的存在性與多重性

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論