第二章(完全信息靜態(tài)博弈).ppt_第1頁(yè)
第二章(完全信息靜態(tài)博弈).ppt_第2頁(yè)
第二章(完全信息靜態(tài)博弈).ppt_第3頁(yè)
第二章(完全信息靜態(tài)博弈).ppt_第4頁(yè)
第二章(完全信息靜態(tài)博弈).ppt_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余59頁(yè)可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章完全信息靜態(tài)博弈,基本分析思路和方法納什均衡無限策略博弈分析和反應(yīng)函數(shù)混合策略和混合策略納什均衡,第一節(jié)基本分析思路和方法,上策均衡;嚴(yán)格下策反復(fù)消去法;劃線法;剪頭法。,一、上策均衡,博弈中如果不管其他博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來的得益始終高于其他策略(至少不低于其他策略),這種策略為該博弈方的“上策”(Dominant-strategy)。如果一個(gè)博弈的某個(gè)策略組合是由各個(gè)博弈方各自的上策構(gòu)成的,這個(gè)策略組合必然是該博弈的穩(wěn)定的結(jié)果,稱這樣的策略組合為該博弈的一個(gè)“上策均衡”(Dominant-strategyEquilibrium)。,二、嚴(yán)格下策反復(fù)消去法(It

2、eratedEliminationofStrictlyDominatedStrategies),一博弈方的某個(gè)策略給他帶來的得益總比其它策略帶來的得益小,就稱這種策略為“嚴(yán)格下策”。通過對(duì)可選策略的相互比較,把不可能采用的較差策略排除掉,從而篩選出較好的策略。博弈方2左中右博弈上方1下圖2.1,嚴(yán)格下策反復(fù)消去法算例分析,博弈方2博弈方2左中左中博弈上博弈上方1下方1圖2.2消去博弈方2圖2.3進(jìn)一步消去右策略后的博弈博弈方1下策后的博弈,嚴(yán)格下策反復(fù)消去法并不能解決所有博弈的分析問題。(如猜硬幣博弈、石頭剪子布博弈)嚴(yán)格下策反復(fù)消去法失效的原因,仍然是在典型的博弈問題中,博弈方之間普遍存在策

3、略依存的特征,也就是說一個(gè)博弈方的不同策略之間,往往不存在絕對(duì)的優(yōu)劣關(guān)系,而只存在相對(duì)的、有條件的優(yōu)劣關(guān)系。,三、劃線法,先找出自己針對(duì)其他博弈方每種策略或策略組合(對(duì)多人博弈)的最佳對(duì)策,即自己的可選策略中與其他博弈方的策略或策略組合相配合,給自己帶來最大得益的策略(這種相對(duì)最佳對(duì)策總是存在的,不過不一定唯一),然后在此基礎(chǔ)上,通過對(duì)其他博弈方策略選擇的判斷,包括對(duì)其他博弈方對(duì)自己策略判斷的判斷等,預(yù)測(cè)博弈的可能結(jié)果和確定自己的最優(yōu)策略。,劃線法算例分析,博弈方2左中右博弈上方1下圖2.4劃線法分析,無法用劃線法確定結(jié)果的博弈,猜硬幣猜硬幣方正面反面蓋硬正面幣方反面圖2.5劃線法分析猜硬幣博

4、弈,夫妻之爭(zhēng)(BattleofSexes)丈夫時(shí)裝足球妻時(shí)裝子足球圖2.6劃線法分析夫妻之爭(zhēng),四、箭頭法,箭頭法的基本思路是對(duì)博弈中的每個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加得益。如能,則從所分析的策略引一箭頭,到能夠帶來更多得益的策略。最后綜合對(duì)每個(gè)策略組合的分析情況,形成對(duì)博弈結(jié)果的判斷。,箭頭法分析,囚徒2坦白抵賴囚坦白徒1抵賴圖2.7箭頭法分析囚徒的困境,第二節(jié)納什均衡(NashEquilibrium),納什均衡的定義納什均衡與嚴(yán)格下策反復(fù)消去法,一、納什均衡的定義,n個(gè)參與人的策略式表達(dá)博弈:,策略組合是一個(gè)納什均衡,如果對(duì)于每一個(gè)i,是給

5、定其他所有參與人選擇的情況下第i個(gè)參與人的最優(yōu)策略。即:對(duì)于任意和任意的i都成立。,二、納什均衡的一致預(yù)測(cè)性質(zhì)一致預(yù)測(cè)性是納什均衡的本質(zhì)屬性?!耙恢滦灶A(yù)測(cè)”是指:如果所有博弈方都預(yù)測(cè)一個(gè)特定的博弈結(jié)果會(huì)出現(xiàn),那么所有的博弈方的實(shí)際行為選擇都會(huì)與他們的預(yù)測(cè)一致,即沒有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望,因此這個(gè)預(yù)測(cè)結(jié)果最終真會(huì)成為博弈的結(jié)果。,一致預(yù)測(cè)性在博弈分析中是重要的,原因在于一個(gè)博弈方在博弈中所作預(yù)測(cè)的內(nèi)容包括他自己的選擇,因此博弈方有可能會(huì)利用預(yù)測(cè)改變自己的選擇,而具有一致預(yù)測(cè)性質(zhì)的博弈分析概念就能避免這樣的矛盾,從而是穩(wěn)定的和自我強(qiáng)制的(Selfenforcing),相應(yīng)選擇也才是真

6、正可預(yù)測(cè)的。納什均衡具有一致性預(yù)測(cè)的性質(zhì),而且只有納什均衡才有這種性質(zhì),任何非納什均衡的預(yù)測(cè)都不是一致預(yù)測(cè),因此一致預(yù)測(cè)正是納什均衡的本質(zhì)屬性。,正是由于納什均衡是一致性預(yù)測(cè),因此才進(jìn)一步有下列性質(zhì):首先,各博弈方可以預(yù)測(cè)它,可以預(yù)測(cè)他們的對(duì)手會(huì)預(yù)測(cè)它,還可以預(yù)測(cè)他們的對(duì)手會(huì)預(yù)測(cè)自己會(huì)預(yù)測(cè)它,;其次,預(yù)測(cè)任何非納什均衡策略組合將是博弈的最終結(jié)果,意味著要么各博弈方的預(yù)測(cè)其實(shí)并不相同(預(yù)測(cè)不同的納什均衡會(huì)出現(xiàn)等),要么預(yù)期至少一個(gè)博弈方要“犯錯(cuò)誤”,包括對(duì)博弈結(jié)構(gòu)理解的錯(cuò)誤,對(duì)其他博弈方的策略預(yù)測(cè)錯(cuò)誤,其理性和計(jì)算能力有問題,或者是實(shí)施策略時(shí)會(huì)出現(xiàn)差錯(cuò)等。,三、納什均衡與上述分析方法的關(guān)系,(一

7、)納什均衡與上策均衡的關(guān)系上策均衡是比納什均衡更強(qiáng)、穩(wěn)定性更高的均衡概念圖2.8納什均衡與上策均衡的關(guān)系,(二)納什均衡與嚴(yán)格下策反復(fù)消去法,命題2.1在n個(gè)博弈方的博弈中,如果嚴(yán)格下策反復(fù)消去法排除了除之外的所有策略組合,那么一定是該博弈唯一的納什均衡。命題2.2在n個(gè)博弈方的博弈中,如果是G的一個(gè)納什均衡,那么嚴(yán)格下策反復(fù)消去法一定不會(huì)將它消去。,第三節(jié)無限策略博弈分析和反應(yīng)函數(shù),古諾的寡頭模型反應(yīng)函數(shù)伯特蘭德寡頭模型,一、古諾寡頭模型產(chǎn)量博弈,設(shè)一市場(chǎng)有1、2兩家廠商生產(chǎn)同樣的產(chǎn)品。如果廠商1的產(chǎn)量為,廠商2的產(chǎn)量為,則市場(chǎng)總產(chǎn)量為。設(shè)市場(chǎng)出清價(jià)格P(可以將產(chǎn)品全部賣出去的價(jià)格)是市場(chǎng)總

8、產(chǎn)量的函數(shù):再設(shè)兩廠商的生產(chǎn)都無固定成本,且每增加一單位產(chǎn)量的邊際成本相等。最后強(qiáng)調(diào)兩廠商同時(shí)決定各自的產(chǎn)量,即他們?cè)跊Q策之前都不知道另一方的產(chǎn)量。,古諾寡頭模型產(chǎn)量博弈分析(1),兩廠商的利潤(rùn)函數(shù)分別為:,古諾寡頭模型產(chǎn)量博弈分析(2),利潤(rùn)最大化條件:解得:,博弈結(jié)果效率比較,古諾寡頭模型產(chǎn)量博弈分析(3),從兩廠商的總體來看,根據(jù)總體利益最大化確定產(chǎn)量效率更高。換句話說,如果兩廠商更多考慮合作,聯(lián)合起來決定產(chǎn)量,先定出使總利益最大的產(chǎn)量后各自生產(chǎn)一半(1.5單位),則各自可分享到的利益為4.5,比只考慮自身利益的獨(dú)立決策行為得到的利益要高。,二、反應(yīng)函數(shù),前面討論的兩寡頭古諾模型中,根據(jù)

9、兩廠商的利潤(rùn)最大化條件可以得到兩廠商的反應(yīng)函數(shù)(ReactionFunction):,q2(0,6)(0,3)(2,2)(3,0)(6,0)q1圖2.9古諾模型的反應(yīng)函數(shù)幾何描述,三、伯特蘭德寡頭模型價(jià)格博弈,當(dāng)廠商1和廠商2價(jià)格分別是和時(shí),它們各自的需求函數(shù)為:設(shè)兩廠商無固定成本,邊際生產(chǎn)成本分別為和,策略空間分別為,兩廠商是同時(shí)決策的。,伯特蘭德寡頭模型價(jià)格博弈分析(1),兩廠商的利潤(rùn)函數(shù)(關(guān)于價(jià)格的函數(shù)):兩廠商對(duì)對(duì)方策略(價(jià)格)的反應(yīng)函數(shù)為:,伯特蘭德寡頭模型價(jià)格博弈分析(2),解此方程組,得:為該博弈唯一的納什均衡。,第四節(jié)混合策略和混合策略納什均衡,嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)多重

10、均衡博弈和混合策略混合策略和嚴(yán)格劣策略重復(fù)剔除混合策略反應(yīng)函數(shù),一、嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn),1、猜硬幣博弈猜硬幣方正面反面蓋硬正面幣方反面圖2.10猜硬幣博弈,2、嚴(yán)格競(jìng)爭(zhēng)博弈原則,第一個(gè)原則:自己的策略選擇不能預(yù)先被另一方知道或猜中。這正是沒有納什均衡博弈與存在唯一納什均衡博弈之間的一個(gè)重要的本質(zhì)區(qū)別。第二個(gè)原則:在該博弈的多次重復(fù)中,博弈方一定要避免自己的選擇帶有規(guī)律性,在該博弈中博弈方必須隨機(jī)選擇策略。,很顯然,上述猜硬幣博弈中兩博弈方都以1/2的相同概率隨機(jī)選擇正面、反面時(shí),雙方都無法根據(jù)對(duì)方的選擇獲益。這種博弈方以一定的概率分布在可選策略中隨機(jī)選擇的策略,稱為“混合策略”。與此

11、相對(duì),把原來意義上的策略稱為“純策略”。,3、混合策略定義,定義:在博弈中,博弈方i的策略空間為,則博弈方i以概率分布隨機(jī)在其k個(gè)可選擇策略中選擇的“策略”,稱為一個(gè)“混合策略”。其中對(duì)于j=1,k都成立,且。,4、混合策略和混合策略納什均衡,事實(shí)上,把策略擴(kuò)展到包括混合策略時(shí),納什均衡概念仍然成立。其本質(zhì)規(guī)定性也仍然相同,即如果一個(gè)策略組合滿足各博弈方的策略相互是對(duì)對(duì)方策略的最佳對(duì)策時(shí),就是一個(gè)納什均衡。不過現(xiàn)在其中的策略既可能是純策略,也可能是混合策略。這種令各個(gè)博弈方隨機(jī)選擇純策略的概率分布,以使對(duì)方或其他博弈方采用不同策略的期望得益相同,從而計(jì)算出各個(gè)博弈方隨機(jī)選擇各純策略概率的方法,

12、在求其他嚴(yán)格競(jìng)爭(zhēng)博弈的混合策略納什均衡時(shí)也適用。,5、混合策略博弈算例分析,博弈方2CD博弈A方1B圖2.11,如圖2.11所示的博弈,用劃線法很容易發(fā)現(xiàn)該博弈不存在純策略納什均衡。如果設(shè)博弈方1選擇A的概率為,選B的概率;博弈方2選C的概率為,選D的概率為。根據(jù)嚴(yán)格競(jìng)爭(zhēng)博弈的兩個(gè)原則有:,由,解得:、當(dāng)博弈方1以(0.8,0.2)的概率隨機(jī)選擇A和B,博弈方2以(0.8,0.2)的概率隨機(jī)選擇C和D時(shí),誰都無法通過單獨(dú)改變自己隨機(jī)選擇的概率分布改善自己的期望得益,因此這個(gè)混合策略組合是穩(wěn)定的。這就是本博弈唯一的混合策略納什均衡。,雙方采用該混合策略的期望得益為:,二、多重均衡博弈和混合策略,

13、1、夫妻之爭(zhēng)丈夫時(shí)裝足球妻時(shí)裝子足球圖2.12夫妻之爭(zhēng),用劃線法可知,該博弈有兩個(gè)納什均衡,即(時(shí)裝,時(shí)裝)和(足球,足球)。夫妻倆人首先從自身的最大利益出發(fā)獨(dú)立同時(shí)決策時(shí),也不能肯定他們究竟會(huì)做怎樣的選擇,無法知道博弈的結(jié)果最終會(huì)是哪個(gè)純策略組合。因此也需要考慮博弈方采用混合策略的可能性。,現(xiàn)在設(shè)和分別為妻子選擇時(shí)裝表演和足球時(shí)的概率;設(shè)和為丈夫選擇時(shí)裝表演和足球賽的概率。根據(jù)嚴(yán)格競(jìng)爭(zhēng)策略的兩個(gè)原則及混合策略的定義有:,解得:當(dāng)妻子以(3/4,1/4)的概率分布隨機(jī)選擇時(shí)裝表演和足球,丈夫以(1/3,2/3)的概率隨機(jī)選擇時(shí)裝表演和足球是該博弈的混合策略納什均衡。,該混合策略納什均衡給妻子和

14、丈夫各自帶來的期望得益為:,2、制式問題,廠商2AB廠A商1B圖2.13制式問題,容易看出,該博弈與夫妻之爭(zhēng)博弈一樣,也有兩個(gè)純策略納什均衡,分別為(A,A)和(B,B)。利用與夫妻之爭(zhēng)博弈同樣的分析方法,很容易解出該博弈的混合策略納什均衡就是廠商1以概率分布(0.4,0.6)隨機(jī)選擇A和B,廠商2則以概率分布(0.67,0.33)隨機(jī)選擇A和B。在該混合策略納什均衡下,雙方的期望得益分別為0.664和1.296。,3、市場(chǎng)機(jī)會(huì)博弈,廠商2進(jìn)不進(jìn)廠進(jìn)商1不進(jìn)圖2.14市場(chǎng)機(jī)會(huì),本博弈有(進(jìn),不進(jìn))和(不進(jìn),進(jìn))兩個(gè)純策略納什均衡。利用混合策略的分析方法可得,雙方各以(2/3,1/3)的概率選擇

15、進(jìn)與不進(jìn),正是本博弈的一個(gè)混合策略納什均衡。這時(shí),兩廠商的期望得益都是:,對(duì)于一次性博弈來說,兩個(gè)廠商是否會(huì)按照這種混合策略納什均衡行為可能還有疑問,但如果把上述混合策略理解成在遇到類似問題的大量廠商中,有2/3會(huì)選擇進(jìn),1/3會(huì)選擇不進(jìn),則反而更清楚一些和更有意義。實(shí)際上,混合策略博弈的意義就在于對(duì)于在一次性博弈中不存在納什均衡或多個(gè)納什均衡的情況下,當(dāng)我們從多次進(jìn)行該博弈的角度考察時(shí),從平均意義上(期望得益的角度)尋求博弈均衡解的一種有效的辦法。,三、混合策略和嚴(yán)格劣策略重復(fù)剔除,任何博弈方都不會(huì)采用任何嚴(yán)格劣策略,不管他們是純策略還是混合策略;嚴(yán)格劣策略重復(fù)剔除不會(huì)消去任何納什均衡,包括

16、純策略納什均衡和混合策略納什均衡;如果經(jīng)過反復(fù)消去后留下的策略組合是唯一的,那么一定是納什均衡。,算例分析,博弈方2LR博弈UM方1D圖2.15混合策略和嚴(yán)格劣策略重復(fù)剔除在上述博弈中,不存在任何嚴(yán)格劣策略,因而嚴(yán)格劣策略重復(fù)剔除法就無從運(yùn)用。但是,如果我們?cè)试S博弈方1采取混合策略,情況就會(huì)有所不同。設(shè)博弈方1采取如下混合策略:以概率分布(1/2,1/2,0)隨機(jī)選擇U、M、D,即各一半機(jī)會(huì)選U、M,不選D。那么與這個(gè)混合策略相比,D一定是博弈方1的嚴(yán)格劣策略。,當(dāng)博弈方2采用純策略L時(shí),博弈方1用上述混合策略的期望得益為當(dāng)博弈方2采用純策略R時(shí),博弈方1用上述混合策略的期望得益為即使博弈方2

17、也采用混合策略(q,1-q),博弈方1采用上述混合策略的期望得益還是一樣,即,也就是說,不管博弈方2采用哪種策略,包括有可能的純策略和所有混合策略(對(duì)應(yīng)q的不同值),博弈方1采用上述混合策略的期望得益始終為3/2,都大于采用D策略時(shí)能得到的確定性得益1。假設(shè)博弈方1是風(fēng)險(xiǎn)中性的,因此D策相對(duì)于混合策略(1/2,1/2,0)是嚴(yán)格劣策略。,既然D策在有混合策略時(shí)是嚴(yán)格劣策略,因此可以從博弈方1的策略空間中去掉,博弈的得益矩陣變?yōu)橄聢D。此時(shí)L策是博弈方2的相對(duì)于R策的嚴(yán)格劣策略,也可以將它從博弈方2的策略空間中消去。最后,在剩下的兩個(gè)策略組合中,博弈方1當(dāng)然選M策略,于是(M,R)策略組合就是該博

18、弈的納什均衡,此時(shí)雙方的得益為(3,3)。博弈方2LR博弈U3,10,2方1M0,23,3圖2.16消去D后的得益矩陣,四、混合策略反應(yīng)函數(shù),在純策略的范圍內(nèi),反應(yīng)函數(shù)是各博弈方選擇的純策略對(duì)其他博弈方純策略的反應(yīng);在混合策略的范圍內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是一方對(duì)另一方的概率分布的反應(yīng),同樣也是一定的概率分布;由于純策略可以理解為混合策略,因此實(shí)際上反應(yīng)函數(shù)的概念,可以在混合策略概率分布之間反應(yīng)的意義上統(tǒng)一起來。,猜硬幣,猜硬幣方正面反面蓋硬正面幣方反面圖2.16猜硬幣博弈設(shè)(r,1-r)是蓋硬幣一方隨機(jī)選擇正反面的混合策略的概率分布,(q,1-q)是猜硬幣方隨機(jī)選擇正反面的混合策略的概率分布,那么兩博弈方的反應(yīng)函數(shù)就是r和q之間的相互決定關(guān)系。,本博弈中當(dāng)猜硬幣方選擇猜正面的概率q1/2時(shí),蓋硬幣一方應(yīng)選擇正面,相當(dāng)于在混合策略(r,1-r)中令r=1,因?yàn)檫@樣贏多輸少;相反,如果q1/2,則蓋硬幣方應(yīng)選擇反面,相當(dāng)于r=0;而當(dāng)q=1/2時(shí),對(duì)蓋硬幣方來說,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論