策略型博弈總結(jié)課件_第1頁
策略型博弈總結(jié)課件_第2頁
策略型博弈總結(jié)課件_第3頁
策略型博弈總結(jié)課件_第4頁
策略型博弈總結(jié)課件_第5頁
已閱讀5頁,還剩143頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

博弈論與信息經(jīng)濟學

GameTheoryandInformationEconomics第二部分非合作博弈理論

博弈論與信息經(jīng)濟學

GameTheoryandIn第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態(tài)貝葉斯博弈

主要內(nèi)容第二章策略型博弈主要內(nèi)容第一節(jié)策略型博弈的表示第二節(jié)重復(fù)剔除嚴格劣策略均衡第三節(jié)

納什均衡第四節(jié)

混合策略納什均衡第五節(jié)納什均衡的存在性

第二章策略型博弈

——同時行動,如何決策第一節(jié)策略型博弈的表示第二章策略型博弈

策略型(標準型)表述

——適合表示靜態(tài)博弈擴展型表述

——適合表示動態(tài)博弈

博弈有兩種表述方法博弈有兩種表述方法一、策略型博弈的含義

完全信息靜態(tài)博弈又稱為策略型博弈。完全信息是指局中人對自己與其他局中人的所有與博弈有關(guān)的事前信息(策略空間、支付函數(shù)等)有充分的了解(局中人的支付函數(shù)是共同知識)。靜態(tài)博弈是指在博弈中,局中人同時采取行動,或者局中人的行動有先有后,但后行動者不能知道先行動者的行動選擇。

第一節(jié)策略型博弈的表示一、策略型博弈的含義第一節(jié)策略型博弈的表示

二、策略型博弈的三個要素:

1、局中人(Players):1,2,…,n;2、策略(Strategies):

;3、支付函數(shù)(Payoff

functions)表示為:

第一節(jié)策略型博弈的表示二、策略型博弈的三個要素:第一節(jié)策略型博弈的表示

1、有限博弈:

(1)博弈中局中人人數(shù)有限;

(2)每個局中人只有有限個策略。

2、零和博弈:博弈中局中人所獲支付之和為零,即一方所得為另一方所失。

三、兩種特殊博弈類型1、有限博弈:三、兩種特殊博弈類型1、局中人:甲,乙2、策略:{坦白,不坦白}3、支付函數(shù)——支付矩陣(雙人有限博弈)每個位置上第一個數(shù)字表示局中人1在對應(yīng)的策略組合中得到的支付,第二個數(shù)字表示局中人2的相應(yīng)所獲支付。例2.1囚徒困境及其策略型表示

(Tucker,1950)1、局中人:甲,乙例2.1囚徒困境及其策略型表示

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2囚徒困境的支付矩陣

乙坦白不坦白坦白-6,-6-1,

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石頭、剪刀、布的支付矩陣

乙石頭剪刀布石頭0,01,-1-

田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3例2.3田忌賽馬的支付矩陣

田忌上中下上下中中上下中下上下上中下中上上中

局中人:男,女

策略:男:看足球,看芭蕾女:看足球,看芭蕾

支付矩陣:見下一頁

例2.4性別大戰(zhàn)(battleofthesexes)局中人:男,女例2.4性別大戰(zhàn)(battleo

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

性別大戰(zhàn)的支付矩陣女足球芭蕾足球3,21,1芭一、基本思想:

如果一個局中人在任何情況下從某種策略中得到的支付均小于從另一種策略中得到的支付,那么顯然對他而言,前一種策略劣于后一種策略。從個人利益出發(fā),被剔除的策略不會被局中人采用。從而可以利用剔除嚴格劣策略的概念來簡化博弈局勢,可能會得到博弈的解。第二節(jié)

重復(fù)剔除嚴格劣策略均衡一、基本思想:第二節(jié)重復(fù)剔除嚴格劣策略均衡

,如果存在,對于所有的都有且其中至少有一個為嚴格不等式,則稱是第i個局中人的一個嚴格劣策略。

二、嚴格劣策略的定義,如果存在1、根據(jù)理性的局中人不會選擇嚴格劣策略這一原則,可以通過重復(fù)剔除嚴格劣策略的方法對博弈進行求解。

2、其方法是:對每個局中人尋找嚴格劣策略,由于它不會被局中人選擇實施,所以找到一種后就可以將其從博弈局勢中剔除,從而得到一種新的縮減后的博弈局勢,對這種新局勢重復(fù)上述過程,直到無法找到新的嚴格劣策略為止。

三、重復(fù)剔除嚴格劣策略1、根據(jù)理性的局中人不會選擇嚴格劣策略這一原則,可以通過

對局中人甲而言,無論局中人乙采取何種策略,采用“不坦白”策略得到的支付都小于采用“坦白”策略。局中人甲的“不坦白”策略嚴格劣于“坦白”策略.“不坦白”策略都是一種嚴格劣策略,從而可以剔除。博弈中局中人各自從自身利益出發(fā)的理性選擇(博弈均衡解)就是(坦白,坦白)。

四、囚徒困境的解對局中人甲而言,無論局中人乙采取何種策略,采用“不

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2例2.1囚徒困境的支付矩陣

甲:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,-8不

乙甲坦白不坦白坦白-6,-6-1,-8乙:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,

乙甲坦白坦白-6,-6乙坦白坦白-6,-6·例2.5

利用重復(fù)剔除嚴格劣策略求解

乙甲左中右上1,01,20,1下0,30,12,0·例2.5利用重復(fù)剔除嚴格劣策略求解乙·乙:“右”相對于“中”是嚴格劣策略

乙甲左中右上1,01,20,1下0,30,12,0·乙:“右”相對于“中”是嚴格劣策略乙·甲:“下”相對于“上”是嚴格劣策略

乙甲左中上1,01,2下0,30,1·甲:“下”相對于“上”是嚴格劣策略乙·乙:“左”相對于“中”是嚴格劣策略

乙甲左中上1,01,2·乙:“左”相對于“中”是嚴格劣策略乙·重復(fù)剔除嚴格劣策略均衡是(上,中)

乙甲中上1,2·重復(fù)剔除嚴格劣策略均衡是(上,中)乙1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把這一過程應(yīng)用到任意多步,需要假定“局中人是理性的”是共同知識。2、這一方法對博弈結(jié)果的預(yù)測經(jīng)常是不準確的.

五、重復(fù)剔除嚴格劣策略有兩個缺陷1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0例2.2石頭、剪刀、布的支付矩陣

利用重復(fù)剔除嚴格劣策略無法求解

乙石頭剪刀布石頭0,01,-1-例2.6

利用重復(fù)剔除嚴格劣策略無法求解

乙甲左中右上0,44,05,3中4,00,45,3下3,53,56,6例2.6利用重復(fù)剔除嚴格劣策略無法求解大多數(shù)的博弈局勢中使用剔除嚴格劣策略的方法能夠?qū)Σ┺木謩葸M行簡化,但可能得不到博弈的均衡解。需要引入非合作博弈理論中的核心概念

——納什均衡(NashEquilibrium)。

六、注意六、注意一、納什均衡的思想

“雙贏”或“多贏”

第三節(jié)納什均衡一、納什均衡的思想第三節(jié)納什均衡它是關(guān)于博弈結(jié)局的一致性預(yù)測如果所有局中人預(yù)測一個特定的納什均衡會出現(xiàn),那么這種均衡就會出現(xiàn)。只有納什均衡才能使每個局中人均認可這種結(jié)局,而且他們均知道其他局中人也認可這種結(jié)局。二、納什均衡的意義它是關(guān)于博弈結(jié)局的一致性預(yù)測二、納什均衡的意義

1、博弈的納什均衡是這樣一種最優(yōu)策略組合,是一種你好、我好大家都好的理性結(jié)局,其中每一個局中人均不能也不想單方面改變自己的策略而增加收益,每個局中人選擇的策略是對其他局中人所選策略的最佳反應(yīng)。

三、納什均衡的定義1、博弈的納什均衡是這樣一種最優(yōu)策略組合

2、數(shù)學定義:在策略型博弈中,如果對于每個局中人i,存在,都有

則稱策略組合是此博弈G的一個納什均衡。三、納什均衡的定義2、數(shù)學定義:三、納什均衡的定義1、雙人有限博弈:雙劃線法

首先對局中人2的每一個策略,局中人1尋找支付最大的策略,在其對應(yīng)支付下劃線;然后對局中人1進行相應(yīng)的步驟;最后,凡是兩個局中人支付下均被劃線的結(jié)局就是納什均衡。四、納什均衡的求法1、雙人有限博弈:雙劃線法四、納什均衡的求法用雙劃線法可以求出納什均衡:(坦白,坦白),(-6,-6)意義:揭示個人理性與集體理性之間的矛盾。

例2.1

囚徒困境的納什均衡用雙劃線法可以求出納什均衡:例2.1囚徒困境的納什均衡

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

局中人:大豬,小豬策略:大豬:按,等待小豬:按,等待支付矩陣:見下一頁納什均衡:(按,等待)

例2.7智豬博弈(boxedpigs)局中人:大豬,小豬例2.7智豬博弈(boxed

小豬大豬按等待按5,14,4等待9,-10,0

例2.7智豬博弈的支付矩陣小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

例2.4性別大戰(zhàn)博弈的支付矩陣女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

局中人:甲,乙

策略:甲:放左手,放右手乙:猜左手,猜右手

支付矩陣:見下一頁沒有納什均衡

例2.8猜左右手游戲局中人:甲,乙例2.8猜左右手游戲

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,-

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,2、連續(xù)性博弈納什均衡的求法首先求出每個局中人對其他局中人策略組合的反應(yīng)函數(shù)——即在其他局中人策略組合給定時極大化自己的支付,得到的最佳反應(yīng)策略表現(xiàn)為其他局中人策略組合的函數(shù);然后將這些反應(yīng)函數(shù)聯(lián)立求解即得到博弈的納什均衡解。四、納什均衡的求法2、連續(xù)性博弈納什均衡的求法四、納什均衡的求法

局中人:廠商1,廠商2

策略:廠商1:選擇產(chǎn)量

廠商2:選擇產(chǎn)量

假設(shè):價格

支付函數(shù)(利潤函數(shù)):

例2.9兩寡頭產(chǎn)量競爭Cournot(1838)模型局中人:廠商1,廠商2例2.9兩寡頭

Cournot模型求解Cournot模型求解

反應(yīng)函數(shù):

納什均衡:

Cournot模型求解反應(yīng)函數(shù):Cournot模型求解

假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量Q使總利潤最大化,利潤函數(shù)為:(Q)=Q(a-Q-c)

總利潤最大的產(chǎn)量為:——稱為契約曲線總利潤為:

比較及含義:

兩寡頭產(chǎn)量串謀模型假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量Q使總利潤最大化,

Q1

廠商2的反應(yīng)曲線

納什均衡

契約曲線廠商1的反應(yīng)曲線

OQ2

圖1反應(yīng)曲線、納什均衡與契約曲線Q1圖1反局中人:廠商1,廠商2策略:廠商1選擇價格;廠商2選擇價格假設(shè):兩寡頭固定成本都為0,邊際成本為常數(shù)c,

消費者對廠商1和2生產(chǎn)產(chǎn)品的需求量分別為:;例2.10兩寡頭價格競爭Bertrand(1883)模型局中人:廠商1,廠商2例2.10兩寡頭價格競爭Bert支付(利潤)函數(shù):

最優(yōu)化的一階條件是:

Bertrand(1883)模型及求解支付(利潤)函數(shù):Bertrand(1883)模型及求解

反應(yīng)函數(shù):

納什均衡價格:

Bertrand(1883)模型及求解反應(yīng)函數(shù):Bertrand(1883)模型及求解在n個局中人的策略型博弈中,

1、如果重復(fù)剔除嚴格劣策略剔除掉除策略組合s以外的所有策略,則這一策略組合s為該博弈的唯一的納什均衡。

2、如果策略組合s是一個納什均衡,那么它就不會被重復(fù)剔除嚴格劣策略所剔除。納什均衡是比重復(fù)剔除嚴格劣策略更強的解概念。五、納什均衡與重復(fù)剔除嚴格劣策略均衡在n個局中人的策略型博弈中,五、納什均衡與重

一、舉例說明混合策略納什均衡

例2.8猜左右手游戲

第四節(jié)混合策略納什均衡

乙甲(q)猜左手(1-q)猜右手(p)放左手-1,

11,

-1(1-p)放右手1,

-1-1,

1一、舉例說明混合策略納什均衡第四節(jié)混合策略納什均衡

在甲選,乙選這種策略時,他們的期望效用分別為:

混合策略與期望效用在甲選甲和乙的目標是:最優(yōu)化的一階條件是:

混合策略納什均衡甲和乙的目標是:混合策略納什均衡

混合策略納什均衡為:

混合策略納什均衡混合策略納什均衡1、混合策略(mixedStrategy)

局中人i的一個混合策略是在其純策略空間上的一個概率分布,其中是i選擇策略

的概率。局中人i的混合策略空間是他的所有混合策略構(gòu)成的集合。

純策略可以理解為混合策略的特例。如等價于

二、混合策略納什均衡1、混合策略(mixedStrategy)二、混合策

在混合策略組合下,局中人i的期望效用函數(shù)為:

其中

2、期望效用函數(shù)在混合策略組合下,局中人

在策略型博弈中,如果對于每個局中人i,存在,都有

則稱是博弈G的一個混合策略納什均衡。3、混合策略納什均衡在策略型博弈

奇數(shù)定理(Wilson1971):幾乎所有的有限博弈都有奇數(shù)個納什均衡。

4、奇數(shù)定理奇數(shù)定理(Wilson1971):幾乎所有的例2.11社會保障博弈

局中人:政府和下崗工人

策略:政府:救濟,不救濟下崗工人:找工作,不找工作

支付矩陣為:

三、應(yīng)用舉例例2.11社會保障博弈三、應(yīng)用舉例

工人政府找工作不找救濟3,2-1,3不救濟-1,10,0工人找工作不找救濟3,2-1,3不救濟-1,

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

求出性別大戰(zhàn)博弈的混合策略納什均衡女足球芭蕾足球3,21,1芭蕾-1

定理1:(Nash,

1950)每個有限策略型博弈至少存在一個納什均衡(純策略的或混合策略的)。

第五節(jié)納什均衡的存在性定理1:(Nash,1950)每個有限策

Brouwer不動點定理:如果X是非空的有界閉凸集,f(x)是X到自身的連續(xù)映射,那么至少存在一個xX,使得f(x)=x,x稱為不動點。

Kakutani不動點定理:設(shè)f(X)是點集X上的一個集值映射,如果X是非空的有界閉凸集,并且對于所有的xX,f(x)是非空的、凸的且上半連續(xù)的,那么至少存在一個xX,使得xf(x),x稱為不動點。

納什均衡的存在性證明Brouwer不動點定理:如果X是非空的有界

1、集值映射:對于集合X上的任何一個點x,如果f(x)給出唯一的一個點yY,則f(x)稱為從X到Y(jié)的映射;如果f(x)給出一個集合f(x)Y,則f(x)稱為從X到Y(jié)的集值映射。映射是集值映射的特例。

2、上半連續(xù):設(shè)f(x)是X到自身的一個集值映射,如果對于所有的xX和包含f(x)的開集V,都存在x的一個鄰域U,使得對于所有的xU,有f(x)V,則稱f(x)是上半連續(xù)的。

注:集值映射和上半連續(xù)1、集值映射:對于集合X上的任何一個點x,如果f(

定理2:(Debreu,

1952

;Glicksberg,1952

;Fan,

1952)在n人策略型博弈中,如果每個局中人的純策略空間Si是歐氏空間中的一個非空的有界閉凸集,支付函數(shù)ui(s)是連續(xù)的且對si是擬凹的,那么該博弈存在一個純策略納什均衡。

定理3:(Glicksberg,1952)在n人策略型博弈中,如果每個局中人的純策略空間Si是歐氏空間中的一個非空的有界閉凸集,支付函數(shù)ui(s)是連續(xù)的,那么該博弈存在一個混合策略納什均衡。

定理1的推廣:從有限到無限定理2:(Debreu,1952;Glicks博弈論與信息經(jīng)濟學

GameTheoryandInformationEconomics第二部分非合作博弈理論

博弈論與信息經(jīng)濟學

GameTheoryandIn第二章策略型博弈第三章擴展型博弈第四章貝葉斯博弈第五章動態(tài)貝葉斯博弈

主要內(nèi)容第二章策略型博弈主要內(nèi)容第一節(jié)策略型博弈的表示第二節(jié)重復(fù)剔除嚴格劣策略均衡第三節(jié)

納什均衡第四節(jié)

混合策略納什均衡第五節(jié)納什均衡的存在性

第二章策略型博弈

——同時行動,如何決策第一節(jié)策略型博弈的表示第二章策略型博弈

策略型(標準型)表述

——適合表示靜態(tài)博弈擴展型表述

——適合表示動態(tài)博弈

博弈有兩種表述方法博弈有兩種表述方法一、策略型博弈的含義

完全信息靜態(tài)博弈又稱為策略型博弈。完全信息是指局中人對自己與其他局中人的所有與博弈有關(guān)的事前信息(策略空間、支付函數(shù)等)有充分的了解(局中人的支付函數(shù)是共同知識)。靜態(tài)博弈是指在博弈中,局中人同時采取行動,或者局中人的行動有先有后,但后行動者不能知道先行動者的行動選擇。

第一節(jié)策略型博弈的表示一、策略型博弈的含義第一節(jié)策略型博弈的表示

二、策略型博弈的三個要素:

1、局中人(Players):1,2,…,n;2、策略(Strategies):

;3、支付函數(shù)(Payoff

functions)表示為:

第一節(jié)策略型博弈的表示二、策略型博弈的三個要素:第一節(jié)策略型博弈的表示

1、有限博弈:

(1)博弈中局中人人數(shù)有限;

(2)每個局中人只有有限個策略。

2、零和博弈:博弈中局中人所獲支付之和為零,即一方所得為另一方所失。

三、兩種特殊博弈類型1、有限博弈:三、兩種特殊博弈類型1、局中人:甲,乙2、策略:{坦白,不坦白}3、支付函數(shù)——支付矩陣(雙人有限博弈)每個位置上第一個數(shù)字表示局中人1在對應(yīng)的策略組合中得到的支付,第二個數(shù)字表示局中人2的相應(yīng)所獲支付。例2.1囚徒困境及其策略型表示

(Tucker,1950)1、局中人:甲,乙例2.1囚徒困境及其策略型表示

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2囚徒困境的支付矩陣

乙坦白不坦白坦白-6,-6-1,

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石頭、剪刀、布的支付矩陣

乙石頭剪刀布石頭0,01,-1-

田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3例2.3田忌賽馬的支付矩陣

田忌上中下上下中中上下中下上下上中下中上上中

局中人:男,女

策略:男:看足球,看芭蕾女:看足球,看芭蕾

支付矩陣:見下一頁

例2.4性別大戰(zhàn)(battleofthesexes)局中人:男,女例2.4性別大戰(zhàn)(battleo

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

性別大戰(zhàn)的支付矩陣女足球芭蕾足球3,21,1芭一、基本思想:

如果一個局中人在任何情況下從某種策略中得到的支付均小于從另一種策略中得到的支付,那么顯然對他而言,前一種策略劣于后一種策略。從個人利益出發(fā),被剔除的策略不會被局中人采用。從而可以利用剔除嚴格劣策略的概念來簡化博弈局勢,可能會得到博弈的解。第二節(jié)

重復(fù)剔除嚴格劣策略均衡一、基本思想:第二節(jié)重復(fù)剔除嚴格劣策略均衡

,如果存在,對于所有的都有且其中至少有一個為嚴格不等式,則稱是第i個局中人的一個嚴格劣策略。

二、嚴格劣策略的定義,如果存在1、根據(jù)理性的局中人不會選擇嚴格劣策略這一原則,可以通過重復(fù)剔除嚴格劣策略的方法對博弈進行求解。

2、其方法是:對每個局中人尋找嚴格劣策略,由于它不會被局中人選擇實施,所以找到一種后就可以將其從博弈局勢中剔除,從而得到一種新的縮減后的博弈局勢,對這種新局勢重復(fù)上述過程,直到無法找到新的嚴格劣策略為止。

三、重復(fù)剔除嚴格劣策略1、根據(jù)理性的局中人不會選擇嚴格劣策略這一原則,可以通過

對局中人甲而言,無論局中人乙采取何種策略,采用“不坦白”策略得到的支付都小于采用“坦白”策略。局中人甲的“不坦白”策略嚴格劣于“坦白”策略.“不坦白”策略都是一種嚴格劣策略,從而可以剔除。博弈中局中人各自從自身利益出發(fā)的理性選擇(博弈均衡解)就是(坦白,坦白)。

四、囚徒困境的解對局中人甲而言,無論局中人乙采取何種策略,采用“不

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2例2.1囚徒困境的支付矩陣

甲:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,-8不

乙甲坦白不坦白坦白-6,-6-1,-8乙:“不坦白”相對于“坦白”是嚴格劣策略

乙坦白不坦白坦白-6,-6-1,

乙甲坦白坦白-6,-6乙坦白坦白-6,-6·例2.5

利用重復(fù)剔除嚴格劣策略求解

乙甲左中右上1,01,20,1下0,30,12,0·例2.5利用重復(fù)剔除嚴格劣策略求解乙·乙:“右”相對于“中”是嚴格劣策略

乙甲左中右上1,01,20,1下0,30,12,0·乙:“右”相對于“中”是嚴格劣策略乙·甲:“下”相對于“上”是嚴格劣策略

乙甲左中上1,01,2下0,30,1·甲:“下”相對于“上”是嚴格劣策略乙·乙:“左”相對于“中”是嚴格劣策略

乙甲左中上1,01,2·乙:“左”相對于“中”是嚴格劣策略乙·重復(fù)剔除嚴格劣策略均衡是(上,中)

乙甲中上1,2·重復(fù)剔除嚴格劣策略均衡是(上,中)乙1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把這一過程應(yīng)用到任意多步,需要假定“局中人是理性的”是共同知識。2、這一方法對博弈結(jié)果的預(yù)測經(jīng)常是不準確的.

五、重復(fù)剔除嚴格劣策略有兩個缺陷1、每一步剔除需要局中人間相互了解的更進一步假定,如果我們把

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0例2.2石頭、剪刀、布的支付矩陣

利用重復(fù)剔除嚴格劣策略無法求解

乙石頭剪刀布石頭0,01,-1-例2.6

利用重復(fù)剔除嚴格劣策略無法求解

乙甲左中右上0,44,05,3中4,00,45,3下3,53,56,6例2.6利用重復(fù)剔除嚴格劣策略無法求解大多數(shù)的博弈局勢中使用剔除嚴格劣策略的方法能夠?qū)Σ┺木謩葸M行簡化,但可能得不到博弈的均衡解。需要引入非合作博弈理論中的核心概念

——納什均衡(NashEquilibrium)。

六、注意六、注意一、納什均衡的思想

“雙贏”或“多贏”

第三節(jié)納什均衡一、納什均衡的思想第三節(jié)納什均衡它是關(guān)于博弈結(jié)局的一致性預(yù)測如果所有局中人預(yù)測一個特定的納什均衡會出現(xiàn),那么這種均衡就會出現(xiàn)。只有納什均衡才能使每個局中人均認可這種結(jié)局,而且他們均知道其他局中人也認可這種結(jié)局。二、納什均衡的意義它是關(guān)于博弈結(jié)局的一致性預(yù)測二、納什均衡的意義

1、博弈的納什均衡是這樣一種最優(yōu)策略組合,是一種你好、我好大家都好的理性結(jié)局,其中每一個局中人均不能也不想單方面改變自己的策略而增加收益,每個局中人選擇的策略是對其他局中人所選策略的最佳反應(yīng)。

三、納什均衡的定義1、博弈的納什均衡是這樣一種最優(yōu)策略組合

2、數(shù)學定義:在策略型博弈中,如果對于每個局中人i,存在,都有

則稱策略組合是此博弈G的一個納什均衡。三、納什均衡的定義2、數(shù)學定義:三、納什均衡的定義1、雙人有限博弈:雙劃線法

首先對局中人2的每一個策略,局中人1尋找支付最大的策略,在其對應(yīng)支付下劃線;然后對局中人1進行相應(yīng)的步驟;最后,凡是兩個局中人支付下均被劃線的結(jié)局就是納什均衡。四、納什均衡的求法1、雙人有限博弈:雙劃線法四、納什均衡的求法用雙劃線法可以求出納什均衡:(坦白,坦白),(-6,-6)意義:揭示個人理性與集體理性之間的矛盾。

例2.1

囚徒困境的納什均衡用雙劃線法可以求出納什均衡:例2.1囚徒困境的納什均衡

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2乙坦白不坦白坦白-6,-6-1,

局中人:大豬,小豬策略:大豬:按,等待小豬:按,等待支付矩陣:見下一頁納什均衡:(按,等待)

例2.7智豬博弈(boxedpigs)局中人:大豬,小豬例2.7智豬博弈(boxed

小豬大豬按等待按5,14,4等待9,-10,0

例2.7智豬博弈的支付矩陣小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

小豬大豬按等待按5,14,4等待9,-10,0小豬按等待按5,14,4等待9,-10

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

例2.4性別大戰(zhàn)博弈的支付矩陣女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

女男足球芭蕾足球3,21,1芭蕾-1,-12,3女足球芭蕾足球3,21,1芭蕾-1

局中人:甲,乙

策略:甲:放左手,放右手乙:猜左手,猜右手

支付矩陣:見下一頁沒有納什均衡

例2.8猜左右手游戲局中人:甲,乙例2.8猜左右手游戲

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,-

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1乙猜左手猜右手放左手-1,11,2、連續(xù)性博弈納什均衡的求法首先求出每個局中人對其他局中人策略組合的反應(yīng)函數(shù)——即在其他局中人策略組合給定時極大化自己的支付,得到的最佳反應(yīng)策略表現(xiàn)為其他局中人策略組合的函數(shù);然后將這些反應(yīng)函數(shù)聯(lián)立求解即得到博弈的納什均衡解。四、納什均衡的求法2、連續(xù)性博弈納什均衡的求法四、納什均衡的求法

局中人:廠商1,廠商2

策略:廠商1:選擇產(chǎn)量

廠商2:選擇產(chǎn)量

假設(shè):價格

支付函數(shù)(利潤函數(shù)):

例2.9兩寡頭產(chǎn)量競爭Cournot(1838)模型局中人:廠商1,廠商2例2.9兩寡頭

Cournot模型求解Cournot模型求解

反應(yīng)函數(shù):

納什均衡:

Cournot模型求解反應(yīng)函數(shù):Cournot模型求解

假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量Q使總利潤最大化,利潤函數(shù)為:(Q)=Q(a-Q-c)

總利潤最大的產(chǎn)量為:——稱為契約曲線總利潤為:

比較及含義:

兩寡頭產(chǎn)量串謀模型假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量Q使總利潤最大化,

Q1

廠商2的反應(yīng)曲線

納什均衡

契約曲線廠商1的反應(yīng)曲線

OQ2

圖1反應(yīng)曲線、納什均衡與契約曲線Q1圖1反局中人:廠商1,廠商2策略:廠商1選擇價格;廠商2選擇價格假設(shè):兩寡頭固定成本都為0,邊際成本為常數(shù)c,

消費者對廠商1和2生產(chǎn)產(chǎn)品的需求量分別為:;例2.10兩寡頭價格競爭Bertrand(1883)模型局中人:廠商1,廠商2例2.10兩寡頭價格競爭Bert支付(利潤)函數(shù):

最優(yōu)化的一階條件是:

Bertrand(1883)模型及求解支付(利潤)函數(shù):Bertrand(1883)模型及求解

反應(yīng)函數(shù):

納什均衡價格:

Bertrand(1883)模型及求解反應(yīng)函數(shù):Bertrand(1883)模型及求解在n個局中人的策略型博弈中,

1、如果重復(fù)剔除嚴格劣策略剔除掉除策略組合s以外的所有策略,則這一策略組合s為該博弈的唯一的納什均衡。

2、如果策略組合s是一個納什均衡,那么它就不會被重復(fù)剔除嚴格劣策略所剔除。納什均衡是比重復(fù)剔除嚴格劣策略更強的解概念。五、納什均衡與重復(fù)剔除嚴格劣策略均衡在n個局中人的策略型博弈中,五、納什均衡與重

一、舉例說明混合策略納什均衡

例2.8猜左右手游戲

第四節(jié)混合策略納什均衡

乙甲(q)猜左手(1-q)猜右手(p)放左手-1,

11,

-1(1-p)放右手1,

-1-1,

1一、舉例說明混合策略納什均衡第四節(jié)混合策略納什均衡

在甲選,乙選這種策略時,他們的期望效用分別為:

混合策略與期望效用在甲選甲和乙的目標是:最優(yōu)化的一階條件是:

混合策略納什均衡甲和乙的目標是:混合策略納什均衡

混合策略納什均衡為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論