管理經(jīng)濟(jì)學(xué)講義-之博弈論篇課件_第1頁
管理經(jīng)濟(jì)學(xué)講義-之博弈論篇課件_第2頁
管理經(jīng)濟(jì)學(xué)講義-之博弈論篇課件_第3頁
管理經(jīng)濟(jì)學(xué)講義-之博弈論篇課件_第4頁
管理經(jīng)濟(jì)學(xué)講義-之博弈論篇課件_第5頁
已閱讀5頁,還剩99頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

博奕論和對策行為

講10講101博弈論和對策行為

概論

博奕論(theGameTheory)也就是運(yùn)籌學(xué)中的對策論。對策思想最早產(chǎn)生于我國古代。早在兩千多年的春秋時期,孫武在《孫子兵法》中論述的軍事思想和治國策略,就蘊(yùn)育了豐富和深刻的對策論思想。孫武的后代孫臏,為田忌謀劃,巧勝齊王,這個著名的“田忌賽馬”,就是典型的對策思想的成功運(yùn)用。博弈論和對策行為概論博奕論(theGa2博弈論和對策行為

概論對策思想明確地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,始于Cournot(1838),Bertrand(1883),Edgeworth(1925)等人關(guān)于寡頭競爭、產(chǎn)量與價格壟斷、產(chǎn)品交易行為的研究。然而,作為一門學(xué)科的創(chuàng)立,則是以美國數(shù)學(xué)家馮.諾依曼(JohnVonNeumann)和經(jīng)濟(jì)學(xué)家奧斯卡.摩根斯坦(OskarMorgenstern)合著的《博奕論與經(jīng)濟(jì)行為》(TheGameTheoryandEconomicBehavior)(1944)一書出版為標(biāo)志,他們奠定和形成了這門學(xué)科的理論與方法論基礎(chǔ)。博弈論和對策行為概論對策思想明確地應(yīng)用于經(jīng)3博弈論和對策行為

概論博奕論是一門內(nèi)容廣泛且復(fù)雜的學(xué)科,不僅是經(jīng)濟(jì)學(xué),政治學(xué)、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學(xué)等,都涉及到博奕論。實(shí)際上,很多人把博奕論看成數(shù)學(xué)的一個分支,博奕論的一個重要代表人物---納什(Nash,曾獲1994年諾貝爾經(jīng)濟(jì)學(xué)獎,該年度的諾貝爾經(jīng)濟(jì)學(xué)獎授與了三位博奕論專家),在1951年的一篇奠基性的文章就是發(fā)表在數(shù)學(xué)雜志上,而非在經(jīng)濟(jì)學(xué)雜志上。但是,本講只是介紹博奕論的最基本的內(nèi)容,且限于博奕論在經(jīng)濟(jì)學(xué)中的應(yīng)用。博弈論和對策行為概論博奕論是一門內(nèi)容廣泛且4博弈論和對策行為

基本概念本書討論博奕論模型的最基本表述方式---策略型表述,它主要用于表現(xiàn)靜態(tài)對策。這里介紹策略型表述中的基本概念,明確有關(guān)術(shù)語的準(zhǔn)確含義。博弈論和對策行為基本概念本書討論博奕論模型5博弈論和對策行為

基本概念在策略型博奕中,一個對策有以下幾種基本要素:一.局中人(players):

即博奕的參與者,他們是博奕的決策主體行為。根據(jù)自己的利益要求決定自己的,記局中人為i,局中人集合為{1,2,…,I},即共有I個局中人。我們將某個局中人以外的其它局中人稱為“i的對手”,記為-i。博弈論和對策行為基本概念在策略型博奕中,一個對策有以下幾種6博弈論和對策行為

基本概念在策略型博奕中,一個對策有以下幾種基本要素:一.局中人即指每個局中人在對策中可以選擇采用的行動方案,但這個方案必須是一個完整的行動,而不是行動的某一步。每個局中人均有可供選擇的多種策略。二.策略(strategies):

博弈論和對策行為基本概念在策略型博奕中,一個對策有以下幾種7三.支付或收益(payoffs):

二.策略一.局中人在策略型博奕中,一個對策有以下幾種基本要素:博弈論和對策行為

基本概念是指一局博奕的得失?;蛘哒f是局中人從各種策略組合中獲得的效用,它是策略組合的函數(shù)。如果局中人得失的總和為零,則稱這種對策為零和對策;否則,稱為非零和博奕。三.支付或收益(payoffs):二.策略一.局中人在策略8例1.囚徒困境(prisoner’sdilemma)博弈論和對策行為

策略型博弈的實(shí)例和解(囚徒困境)囚徒B坦白抵賴囚徒A坦白-8,-80,-10抵賴-10,0-1,-1例1.囚徒困境(prisoner’sdilemma)博9例1.囚徒困境(prisoner’sdilemma)博弈論和對策行為

策略型博弈的實(shí)例和解(囚徒困境)

這個例子可以看作是非合作博奕現(xiàn)象的一個抽象概括。它講的是兩個嫌疑犯被隔離審訊。他們面臨的處境是:如果兩人都坦白,各判刑8年;如果兩人都抵賴,各判刑1年(或許證據(jù)不足);如果一人坦白另一人抵賴,則坦白的放出去,不坦白的判刑10年,(“坦白從寬、抗拒從嚴(yán)”)。這里,兩個囚徒就是兩個局中人,每個局中人都有兩個策略可供選擇:坦白或抵賴。表中每一格的一對數(shù)字分別表示局中人不同策略組合的收益,第一個數(shù)字是囚徒A的收益,第二個數(shù)字是囚徒B的收益。這種有限對策(局中人是有限個,每個局中人的策略數(shù)也是有限的)往往用矩陣形式表示。例1.囚徒困境(prisoner’sdilemma)博10例1.囚徒困境(prisoner’sdilemma)博弈論和對策行為

策略型博弈的實(shí)例和解(囚徒困境)在對博奕局勢進(jìn)行描述后,博奕論分析就是要求出局中人進(jìn)行策略選擇的理性結(jié)局,或者說找出博奕問題的解。在非合作博奕中,有兩種解的技術(shù):一種是納什均衡,一種是優(yōu)超解。例1.囚徒困境(prisoner’sdilemma)博11定義1:給定其它局中人的策略s,局中人i的最優(yōu)反應(yīng)

記為s,是指能給他帶來最大收益的策略,即博弈論和對策行為

納什均衡當(dāng)每個局中人都選擇了自己的最優(yōu)反應(yīng)策略,并且這些最優(yōu)反應(yīng)形成一個策略組合,便形成了納什均衡。定義1:給定其它局中人的策略s,局中人i的最優(yōu)反應(yīng)

12定義2:一個策略組合s*=(s1*,s2*,…,sn*)被稱為納什均

衡是指,對于所有的i,博弈論和對策行為

納什均衡納什均衡的思想就是,博奕的理性結(jié)局是這樣一種策略組合,其中每個局中人選擇的策略都已是對其它局中人所選策略的最優(yōu)反應(yīng),所以,誰也沒有積極性去選擇其它策略。因?yàn)槊恳粋€局中人均不能因?yàn)閱畏矫娓淖冏约旱牟呗远@利,于是誰也沒有興趣主動打破這種均衡。定義2:一個策略組合s*=(s1*,s2*,…,sn*)被13在囚徒困境中,考慮囚徒A對他人的最優(yōu)反應(yīng)。如果給定囚徒B的策略是“坦白”,那么對囚徒A來說,采取“坦白”策略得到的收益是-8,采取“抵賴”策略得到的收益是-10,顯然“坦白”為好;同理,如果給定囚徒B的策略是“抵賴”,對囚徒A來說,“坦白”也比“抵賴”好。因此,囚徒A對囚徒B的最優(yōu)反應(yīng)是“坦白”。對囚徒B作同樣分析:如果囚徒A的策略是“坦白”,則他采取“坦白”策略為好;如果囚徒A的策略是“抵賴”,他還是采取“坦白”策略好,所以囚徒B對囚徒A的最優(yōu)反應(yīng)也是“坦白”。兩個最優(yōu)反應(yīng)形成了一個策略組合(坦白,坦白),這就是一個納什均衡。博弈論和對策行為

納什均衡在囚徒困境中,考慮囚徒A對他人的最優(yōu)反應(yīng)。如14

兩個寡頭企業(yè)選擇產(chǎn)量的博奕就是一個囚徒困境問題。回想一下古諾均衡的含義:古諾均衡是指存在這樣一對產(chǎn)量組合(q1*,q2*),使得:假定企業(yè)2的產(chǎn)量為q2*時,q1*是企業(yè)1的最優(yōu)產(chǎn)量;假定企業(yè)1的產(chǎn)量為q1*時,q2*是企業(yè)2的最優(yōu)產(chǎn)量。按照納什均衡的定義,古諾均衡(q1*,q2*)也就是博奕論中的納什均衡。納什均衡只說明博奕的穩(wěn)定性結(jié)局。博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用兩個寡頭企業(yè)選擇產(chǎn)量的博奕就是一個囚徒困15讓我們再回到囚徒困境本身。納什均衡(坦白,坦白)表明兩人共同的集體選擇,但是這個選擇是否是理性的?理性選擇是指使收益最大化的選擇。如果兩人都抵賴,各判刑1年,顯然比坦白各判刑8年好。所以,納什均衡(坦白,坦白)并不是一個集體理性選擇。但它卻是個人理性選擇的一個組合。囚徒困境正是反映了一個深刻的問題,這就是個人理性與集體理性的矛盾。博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用讓我們再回到囚徒困境本身。納什均衡(坦白,坦白)表16博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用一個非集體理性選擇,如納什均衡(坦白,坦白),用經(jīng)濟(jì)學(xué)術(shù)語說,其中存在“帕累托改進(jìn)”的機(jī)會。所謂帕累托改進(jìn)就是說,它在不使另一部分人的境況變得更壞的前提下,至少能改進(jìn)一部分人的境況。如果不存在帕累托改進(jìn)的情況,便達(dá)到“帕累托最優(yōu)”。這里,如果兩人都選擇抵賴,兩人的境況都有所改進(jìn)。所以,(坦白,坦白)不是帕累托最優(yōu)。集體的理性選擇應(yīng)該是大家都抵賴。但是這個帕累托改進(jìn)辦不到。為什么?因?yàn)槲覀円呀?jīng)驗(yàn)證,(坦白,坦白)這個策略組合正是一個納什均衡。在一個納什均衡中,不會有人主動去打破這種格局的。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用一個非集17博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用那么,兩個囚徒事先訂好攻守同盟,兩人都采取抵賴的策略,不是可以改善兩人的境遇嗎?但問題是,這個攻守同盟有沒有意義?沒有。原因在于(抵賴,抵賴)這個策略組合不是一個納什均衡,沒有人有積極性去遵守這個協(xié)議。一般地,假設(shè)博奕中的每個局中人事先達(dá)成一項(xiàng)協(xié)議,規(guī)定了各自的行為規(guī)則。如果局中人會自覺遵守這個協(xié)議,等于說這個協(xié)議構(gòu)成了一個納什均衡:給定別人遵守協(xié)議的情況下,自己的最好選擇就是也遵守協(xié)議。相反,一個協(xié)議不構(gòu)成納什均衡時,它就不可能自動實(shí)施,因?yàn)橹辽儆幸粋€局中人會違背這個協(xié)議。所以,不滿足納什均衡要求的協(xié)議是沒有意義的。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用那么,兩18博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用以上的分析告訴我們,用經(jīng)濟(jì)學(xué)的觀點(diǎn)來看,只有由滿足個人理性選擇的策略組成的集合才是均衡的,或者說只有納什均衡才是穩(wěn)定的。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用以上的分19博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用看兩個寡頭合謀與價格卡特爾的情形,它也存在個人理性與集體理性的沖突。在兩個寡頭合謀條件下的產(chǎn)量與價格決定,是基于兩個寡頭利潤總和的最大化目標(biāo),而不是每個企業(yè)自己的利潤最大化。因此這種最大化目標(biāo)下的產(chǎn)量分配符合兩家企業(yè)的共同利益,卻不是使每家企業(yè)自己的利潤最大化的產(chǎn)量,換言之,并不是每家企業(yè)自己的“最優(yōu)反應(yīng)”。所以,卡特爾產(chǎn)量分配不是一個納什均衡。正因?yàn)榇耍ㄌ貭栂乱欢〞羞`約沖動,卡特爾具有不穩(wěn)定性。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用看兩個寡20博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用在軍備競賽中,人們年復(fù)一年的談判,試圖簽訂一個限制軍備的條約。但是這種條約也存在個人理性與集體理性的沖突。簽訂條約對世界和平有利,但履行條約未必是各國行動的“最優(yōu)反應(yīng)”:試想,如果我減少軍備開支,而你增加軍費(fèi)支出,我不是受到威脅了嗎?所以,這種條約不構(gòu)成納什均衡,各國都有違約的沖動。納什均衡是各國都大量增加軍費(fèi)預(yù)算,結(jié)果軍備競賽就只好繼續(xù)下去。冷戰(zhàn)時期前蘇聯(lián)和美國之間的軍備競賽就是典型一例,兩國都在導(dǎo)彈上花了幾萬億美元,如果把資源用于民品生產(chǎn),兩國的社會福利就會變得更好。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用在21博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用企業(yè)競爭而產(chǎn)生的廣告資源浪費(fèi)也是典型例子。如兩家寡頭競爭,經(jīng)理們可選擇策略是“多做廣告”和“少做廣告”,各種策略組合的盈利矩陣如下表,企業(yè)1最優(yōu)反應(yīng)是多做廣告,企業(yè)2最優(yōu)反應(yīng)也是多做廣告,因此(多做廣告,多做廣告)是一個納什均衡。這個納什均衡的結(jié)果是大量資源消耗在廣告上。企業(yè)2少做廣告多做廣告企業(yè)1少做廣告30,3010,40多做廣告40,1020,20博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用企22博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用

納什均衡概念的局限性在于,在博奕中有可能納什均衡不是唯一的。例:兩家寡頭價格競爭,經(jīng)理可選擇的策略是價格不變或漲價,收益矩陣如下所示:企業(yè)2價格不變漲價企業(yè)1價格不變10,10100,-30漲價-20,30140,35結(jié)果發(fā)現(xiàn)納什均衡有兩個:(價格不變,價格不變)、(漲價,漲價)。博奕中的實(shí)際結(jié)果取決于首先采取什么行動。如果先前的情況是價格不變,那么這一博奕的預(yù)期結(jié)果就是價格不變。另外,對有的博奕來說,也可能不存在納什均衡。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用納什23博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)一男一女戀愛,有些業(yè)余活動要安排,或者去看足球比賽,或者去看芭蕾舞演出。男的偏好足球,女的則更喜歡芭蕾舞,但他們都寧愿在一起,不愿分開。下表給出收益矩陣:女足球芭蕾男足球2,10,0芭蕾0,01,2博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別24博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)

這個博奕中有兩個納什均衡:(足球,足球)和(芭蕾,芭蕾)。就是說,一方去足球場,另一方也會去足球場;類似地,一方去看芭蕾,另一方也會去看芭蕾。在實(shí)際生活中,也許是這一次看足球,下一次看芭蕾,如此循環(huán),形成一種默契。這在實(shí)際生活中是指,兩種互補(bǔ)的活動應(yīng)該配合,盡管配合的方式可能有很多種。博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別25比如,兩家工廠生產(chǎn)的產(chǎn)品可能是互補(bǔ)的,一家為另一家提供零配件,這里有一個標(biāo)準(zhǔn)的選擇問題,由于種種原因,很可能在產(chǎn)品標(biāo)準(zhǔn)的選擇上,生產(chǎn)成品的廠家與生產(chǎn)零配件的廠家之間有沖突。這就需要相互妥協(xié),但妥協(xié)的結(jié)果有兩種可能,或者是生產(chǎn)零配件的廠家適應(yīng)生產(chǎn)成品的廠家,或者是生產(chǎn)成品的廠家適應(yīng)于生產(chǎn)零配件的廠家。博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)比如,兩家工廠生產(chǎn)的產(chǎn)品可能是互補(bǔ)的,一家為26博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)性別戰(zhàn)的例子中有兩個納什均衡,那么,究竟那一個納什均衡會實(shí)際發(fā)生?我們不知道。這里還有一個先動優(yōu)勢(first-moveradvantage),比如說,若男的先買票,兩人就會出現(xiàn)在足球場,若女的買票,兩人就會出現(xiàn)在芭蕾舞劇院。博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別27博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)在囚徒博奕中,我們隱含地假定雙方下奕者是同時實(shí)施其策略的。性別戰(zhàn)中的先動優(yōu)勢表明了另一種類型的博奕,稱為順序性博奕(sequentialgame)。在順序性博奕中,有一名下奕者先博奕行動,然后另一名下奕者要做出反應(yīng)。先下奕者有先動優(yōu)勢。性別戰(zhàn)的例子也有很多應(yīng)用。企業(yè)進(jìn)入新的市場就是一種順序性博奕。新企業(yè)首先決定是否進(jìn)入,然后現(xiàn)有企業(yè)決定是不管它,還是阻止它的進(jìn)入。博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別28博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用

設(shè)想有一家壟斷企業(yè)已在市場上(稱為“在位者”),另一家新企業(yè)虎視眈眈想進(jìn)入(稱為“進(jìn)入者”)。在位者想保持自己的壟斷地位,所以就要阻撓進(jìn)入者的進(jìn)入。在這個博奕中,進(jìn)入者有兩種策略可以選擇:進(jìn)入還是不進(jìn)入;在位者也有兩種策略:默許還是斗爭。各種策略組合的收益矩陣如下表:

例:市場進(jìn)入阻撓(entrydeterrance)在位者默許斗爭進(jìn)入者進(jìn)入40,50-10,0不進(jìn)入0,3000,300博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用設(shè)想有29博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用博奕也有兩個納什均衡,即(進(jìn)入,默許),(不進(jìn)入,斗爭),相應(yīng)的收益為(40,50),(0,300)。就是說如果新企業(yè)首先進(jìn)入,在位者的最優(yōu)反應(yīng)是默許;類似地,如果在位者默許,新企業(yè)的最優(yōu)策略是進(jìn)入。盡管在新企業(yè)不進(jìn)入時,默許和斗爭對在位者是一樣的效果,但在在位者選擇斗爭時,新企業(yè)的最優(yōu)選擇是不進(jìn)入,所以,(不進(jìn)入,斗爭)是一個納什均衡,而(不進(jìn)入,默許)不是納什均衡。博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用博奕30博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用一家企業(yè)率先推出一種新產(chǎn)品,其它企業(yè)跟進(jìn)也是一種順序性博奕。把新產(chǎn)品率先推向市場的先動企業(yè)的成功可能性要大一些,跟進(jìn)者面臨的困難是消費(fèi)者對先動企業(yè)的品牌有了一定的忠誠度,并在頭腦中有了先動企業(yè)的形象;而且,如果消費(fèi)者在學(xué)習(xí)使用先動企業(yè)的新產(chǎn)品時花費(fèi)了學(xué)習(xí)時間,往往不愿意再花時間或改動設(shè)備去使用另一家企業(yè)的類似產(chǎn)品。文字處理和數(shù)據(jù)庫軟件就是很好的例子。對一種程序或一種輸入方法已很熟練者,一般不愿意更換,除非后者有很多優(yōu)點(diǎn)。博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用一家31博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用

下表是兩個競爭企業(yè)是否推出新產(chǎn)品的利益矩陣。

這個博奕中有兩個納什均衡:一家推出新產(chǎn)品,一家無新產(chǎn)品。推出新產(chǎn)品的企業(yè)贏利為10,無新產(chǎn)品的企業(yè)贏利為-5。究竟是企業(yè)1還是企業(yè)2贏利,要看是哪一家企業(yè)首先行動。假定企業(yè)1具有較高的研究和開發(fā)優(yōu)勢,率先在市場上推出新產(chǎn)品,那么企業(yè)2的最佳反應(yīng)就是不跟進(jìn),因?yàn)楦M(jìn)的損失是7,不跟進(jìn)的損失只有5。企業(yè)2無新產(chǎn)品推出新產(chǎn)品企業(yè)1無新產(chǎn)品2,2-5,10推出新產(chǎn)品10,-5-7,-7博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用下表是32博弈論和對策行為

優(yōu)超解如果一個局中人在任何情況下從某種策略中得到的收益均大于從其它策略中得到的收益,那么對他而言,這個策略稱為優(yōu)超策略或支配性策略(dominantstrategy)。其它的策略稱為被優(yōu)超策略或被支配策略(dominatedstrategy)。博弈論和對策行為優(yōu)超解如果一個局中人在任何33博弈論和對策行為

優(yōu)超解在囚徒博奕中,對囚徒A來說,“抵賴”被“坦白”優(yōu)超,對囚徒B也同樣,所以,(坦白,坦白)就是一個優(yōu)超策略均衡。在這個例子中,優(yōu)超策略均衡也就是納什均衡。當(dāng)有一名局中人具有優(yōu)超策略時,博奕總會有一個納什均衡,因?yàn)楫?dāng)該局中人采取優(yōu)超策略時,另一局中人就會據(jù)此做出自己的最優(yōu)反應(yīng)。但納什均衡不一定是優(yōu)超策略均衡。博弈論和對策行為優(yōu)超解在囚徒博奕中,對囚徒A來說34博弈論和對策行為

優(yōu)超解在市場進(jìn)入阻撓博奕中,在位者有一個優(yōu)超解“默許”,進(jìn)入者對默許的最優(yōu)反應(yīng)是“進(jìn)入”,所以,(進(jìn)入,默許)是一個納什均衡。

大多數(shù)的博奕局勢中利用優(yōu)超概念只能夠?qū)Σ┺葐栴}進(jìn)行簡化,得不到對策解。博弈論和對策行為優(yōu)超解在市場進(jìn)入阻撓博奕中,在位35博弈論和對策行為

優(yōu)超解例2:考慮由下表給出的策略性博奕:局中人Buvx3,67,1局中人Ay5,18,0z6,06,2博弈論和對策行為優(yōu)超解例2:考慮由下表給出的策略性博奕:36博弈論和對策行為

優(yōu)超解對于局中人A來說,策略x被y優(yōu)超了,所以,可以刪去x使問題簡化為:局中人Buv局中人Ay5,18,0z6,06,2但是,對這個簡化了的博奕,我們?nèi)匀粺o法找到對策解。有些博奕問題既沒有優(yōu)超均衡解,也沒有納什均衡解。博弈論和對策行為優(yōu)超解對于局中人A來說,策37博弈論和對策行為

最大最小策略(Max-minstrategy)

馮.諾依曼和摩根斯坦認(rèn)為策略的選擇與決策者的性格有關(guān)。某些決策者可能認(rèn)為,冒失行動容易造成重大失誤,最好還是從最不利的情況出發(fā),向最好的方向努力,力求做到有備無患。這樣的決策者屬于風(fēng)險(xiǎn)厭惡型的,他首先想到的是各種不利因素和風(fēng)險(xiǎn),所以他先要考慮各種最壞的結(jié)果,然后從最壞結(jié)果中選出一個最好結(jié)果。按這種原則選取的策略可以稱為最大最小策略。博弈論和對策行為最大最小策略(Max-minstrate38博弈論和對策行為

混合策略和重復(fù)性博弈策略有兩種概念,前面我們所說的策略,都是純策略,另一種策略概念為在純策略基礎(chǔ)上形成的混合策略(mixedstrategy)。局中人I的混合策略αi是他的純策略空間Si上的一種概率分布,表示局中人實(shí)際對策時根據(jù)這種概率分布在純策略中隨機(jī)選擇加以實(shí)施。博弈論和對策行為混合策略和重復(fù)性博弈策略有兩種概39博弈論和對策行為

混合策略和重復(fù)性博弈為了敘述問題方便,下面我們主要討論二人零和博奕。零和對策是策略型對策的最基本模式,其中局中人得失的總和為零(或?yàn)橐怀?shù))。二人零和博奕是指零和博奕中有且只有兩個局中人,一人的所得正是另一人的所失。二人零和對策在博奕論的早期發(fā)展中曾占有過重要地位。二人零和博奕的支付矩陣可以記為:局中人Bb1b2a1α11α12a2α21α22如果支付矩陣的數(shù)值αij為正時,表示局中A的贏得值,若支付矩陣的數(shù)值αij為負(fù)時,表示局中A的損失或輸?shù)舻闹?。博弈論和對策行為混合策略和重?fù)性博弈為了敘述問題40博弈論和對策行為

混合策略和重復(fù)性博弈例:二人零和博奕的收益矩陣如下表,局中人A的收益值均為正,而局中人B的收益值均為負(fù),即表示局中人B的損失值。局中人Bb1b2局中人Aa11,-14,-4a23,-32,-2博弈論和對策行為混合策略和重復(fù)性博弈例:二人零和41博弈論和對策行為

混合策略和重復(fù)性博弈如果每個局中人完全清楚地知道對手將會采取什么樣的策略,會是什么情況呢?A如果知道B會選擇b1,則會選擇a2;當(dāng)A連續(xù)使用策略a2時,B必定會察覺,便會選擇b2;當(dāng)B連續(xù)使用b2時,A也會察覺,從而改為選擇a1;B如果知道A選擇了a1,則又會選擇b1;如此反復(fù),以至無窮,所以,雙方如果使用純策略進(jìn)行博奕時,就會出現(xiàn)不穩(wěn)定狀態(tài),不會有最終的均衡結(jié)果。這說明雙方都不能連續(xù)不變地使用某種純策略,都必須考慮如何隨機(jī)地使用自己的策略,使對方捉摸不到自己使用何種策略。這就需要混合策略的對策。博弈論和對策行為混合策略和重復(fù)性博弈如果每個局中42博弈論和對策行為

混合策略和重復(fù)性博弈假設(shè)A采取混合策略,即以概率x隨機(jī)的使用純策略a1,以概率(1-x)使用純策略a2,去對付B使用純策略b1,A的收益便是x的函數(shù):Uα=x+3(1-x)=3-2x若A使用上述混合策略去對付B使用純策略b時,A的收益便是Uα’=4x+2(1-x)=2+2x博弈論和對策行為混合策略和重復(fù)性博弈假設(shè)A采取混合43博弈論和對策行為

混合策略和重復(fù)性博弈用圖表示時,Uα和Uα’的表達(dá)式是兩條直線,x的取值范圍為[0,1],見下圖:U543210112345mxmpqpq博弈論和對策行為混合策略和重復(fù)性博弈用圖表示時,44博弈論和對策行為

混合策略和重復(fù)性博弈Uα的值隨著x值的增長而減少,Uα’的值隨著x值的增大而增大。兩條直線的交點(diǎn)m對應(yīng)著xm。局中人A按最大最小原則選擇他的策略,即他的選擇按

Max[min(3-2x,2+2x)]

來進(jìn)行的。min(3-2x,2+2x)即折線pmq,m點(diǎn)是折線pmq的最高點(diǎn),所以m點(diǎn)是混合策略意義下的最大最小值。當(dāng)Uα=Uα’時,可解得xm=1/4,Uα=Uα’=5/2。所以,局中人A的最優(yōu)混合策略為:a1,a2(1/4,3/4)Uα=Uα’=5/2A:博弈論和對策行為混合策略和重復(fù)性博弈Uα的值隨著45博弈論和對策行為

混合策略和重復(fù)性博弈可以用同樣的方法分析局中人B的最優(yōu)混合策略。若B以概率y隨機(jī)的使用純策略b1,以概率(1-y)使用純策略b2,去對付A使用純策略a1,B的損失值為:Ub=y+4(1-y)=4-3y若B使用上述混合策略去對付A使用純策略a時,B的損失值便是:Ub’=3y+2(1-y)=2+y博弈論和對策行為混合策略和重復(fù)性博弈可以用同樣的46博弈論和對策行為

混合策略和重復(fù)性博弈用圖表示時,Ub和Ub’的表達(dá)式是兩條直線,y的取值范圍為[0,1],見下圖:U543210112345nynef博弈論和對策行為混合策略和重復(fù)性博弈用圖表示時,47博弈論和對策行為

混合策略和重復(fù)性博弈注意,此時B按最大最小原則選擇自己的最優(yōu)策略,即min[max(4-3y,2+y)]

折線enf表示max(4-3y,2+y),n點(diǎn)是折線enf的最低點(diǎn),也即最小最大值。N點(diǎn)對應(yīng)的yn=1/2,以此概率構(gòu)成的B的混合策略是B的最優(yōu)混合策略。b1,b2(1/2,1/2)Ub=Ub’=5/2B:博弈論和對策行為混合策略和重復(fù)性博弈注意,此時B48博弈論和對策行為

混合策略和重復(fù)性博弈本例中Uα=Ub=5/2,這樣,A的混合策略(1/4,3/4)與B的混合策略(1/2,1/2)便構(gòu)成一個“最大最小策略均衡”。一般記作:maxminE(X,Y)=minmaxE(X,Y)式中X=(x1,x2,…,xn),Y=(y1,y2,…,yn)為局中人A和B使用各自策略的概率,期望值E(X,Y)=博弈論和對策行為混合策略和重復(fù)性博弈本例中U49博弈論和對策行為

混合策略和重復(fù)性博弈下面再對這個例子作進(jìn)一步分析。設(shè)局中人A使用混合策略x,局中人B使用最優(yōu)混合策略y*,這時局中人B的期望支付若局中人B使用某種混合策略,而局中人A使用最優(yōu)混合策略,這時局中人A的收益的期望值為博弈論和對策行為混合策略和重復(fù)性博弈下面再對這個例50博弈論和對策行為

混合策略和重復(fù)性博弈這說明當(dāng)局中人A使用最優(yōu)策略時,不管局中人B使用何種策略,他的收入的期望值不變,從而保持有利的競爭地位;當(dāng)局中人B使用最優(yōu)策略時,不管局中人A使用何種策略,他的支付的期望值不變,這就是B的最好應(yīng)對方式。反之,如果A不使用最優(yōu)策略,他的期望收入必定小于Uα;如果B不使用最優(yōu)策略,他的期望損失值就要大于Ub。從而,局中人A和B的最優(yōu)混合策略構(gòu)成了一個混合策略納什均衡。博弈論和對策行為混合策略和重復(fù)性博弈這說明當(dāng)局中人51博弈論和對策行為

混合策略和重復(fù)性博弈任何一個博奕,也許不存在純策略納什均衡,但一定存在混合策略納什均衡。對于零和博奕,若存在“最大最小策略均衡”,則該均衡必定是納什均衡。如上例所示?;旌喜呗灾幸欢苷业郊{什均衡這一性質(zhì),使得混合策略更有實(shí)用性。同時,混合策略也許更符合客觀實(shí)際,一則因?yàn)椴┺鹊木种腥诉x擇策略時本來就不是確定無疑的,而是具有一定的隨機(jī)性;并且,每個局中人對于對手的策略選擇的猜測也不是十分可靠的,這種猜測的命中率也是隨機(jī)的。

二則因?yàn)榛旌喜呗詫Ω斗磸?fù)進(jìn)行多次的博奕為純策略更很有效,而這種重復(fù)性博奕在現(xiàn)實(shí)中更為普遍。博弈論和對策行為混合策略和重復(fù)性博弈任何一個博奕52博奕論和對策行為

講10講1053博弈論和對策行為

概論

博奕論(theGameTheory)也就是運(yùn)籌學(xué)中的對策論。對策思想最早產(chǎn)生于我國古代。早在兩千多年的春秋時期,孫武在《孫子兵法》中論述的軍事思想和治國策略,就蘊(yùn)育了豐富和深刻的對策論思想。孫武的后代孫臏,為田忌謀劃,巧勝齊王,這個著名的“田忌賽馬”,就是典型的對策思想的成功運(yùn)用。博弈論和對策行為概論博奕論(theGa54博弈論和對策行為

概論對策思想明確地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,始于Cournot(1838),Bertrand(1883),Edgeworth(1925)等人關(guān)于寡頭競爭、產(chǎn)量與價格壟斷、產(chǎn)品交易行為的研究。然而,作為一門學(xué)科的創(chuàng)立,則是以美國數(shù)學(xué)家馮.諾依曼(JohnVonNeumann)和經(jīng)濟(jì)學(xué)家奧斯卡.摩根斯坦(OskarMorgenstern)合著的《博奕論與經(jīng)濟(jì)行為》(TheGameTheoryandEconomicBehavior)(1944)一書出版為標(biāo)志,他們奠定和形成了這門學(xué)科的理論與方法論基礎(chǔ)。博弈論和對策行為概論對策思想明確地應(yīng)用于經(jīng)55博弈論和對策行為

概論博奕論是一門內(nèi)容廣泛且復(fù)雜的學(xué)科,不僅是經(jīng)濟(jì)學(xué),政治學(xué)、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學(xué)等,都涉及到博奕論。實(shí)際上,很多人把博奕論看成數(shù)學(xué)的一個分支,博奕論的一個重要代表人物---納什(Nash,曾獲1994年諾貝爾經(jīng)濟(jì)學(xué)獎,該年度的諾貝爾經(jīng)濟(jì)學(xué)獎授與了三位博奕論專家),在1951年的一篇奠基性的文章就是發(fā)表在數(shù)學(xué)雜志上,而非在經(jīng)濟(jì)學(xué)雜志上。但是,本講只是介紹博奕論的最基本的內(nèi)容,且限于博奕論在經(jīng)濟(jì)學(xué)中的應(yīng)用。博弈論和對策行為概論博奕論是一門內(nèi)容廣泛且56博弈論和對策行為

基本概念本書討論博奕論模型的最基本表述方式---策略型表述,它主要用于表現(xiàn)靜態(tài)對策。這里介紹策略型表述中的基本概念,明確有關(guān)術(shù)語的準(zhǔn)確含義。博弈論和對策行為基本概念本書討論博奕論模型57博弈論和對策行為

基本概念在策略型博奕中,一個對策有以下幾種基本要素:一.局中人(players):

即博奕的參與者,他們是博奕的決策主體行為。根據(jù)自己的利益要求決定自己的,記局中人為i,局中人集合為{1,2,…,I},即共有I個局中人。我們將某個局中人以外的其它局中人稱為“i的對手”,記為-i。博弈論和對策行為基本概念在策略型博奕中,一個對策有以下幾種58博弈論和對策行為

基本概念在策略型博奕中,一個對策有以下幾種基本要素:一.局中人即指每個局中人在對策中可以選擇采用的行動方案,但這個方案必須是一個完整的行動,而不是行動的某一步。每個局中人均有可供選擇的多種策略。二.策略(strategies):

博弈論和對策行為基本概念在策略型博奕中,一個對策有以下幾種59三.支付或收益(payoffs):

二.策略一.局中人在策略型博奕中,一個對策有以下幾種基本要素:博弈論和對策行為

基本概念是指一局博奕的得失。或者說是局中人從各種策略組合中獲得的效用,它是策略組合的函數(shù)。如果局中人得失的總和為零,則稱這種對策為零和對策;否則,稱為非零和博奕。三.支付或收益(payoffs):二.策略一.局中人在策略60例1.囚徒困境(prisoner’sdilemma)博弈論和對策行為

策略型博弈的實(shí)例和解(囚徒困境)囚徒B坦白抵賴囚徒A坦白-8,-80,-10抵賴-10,0-1,-1例1.囚徒困境(prisoner’sdilemma)博61例1.囚徒困境(prisoner’sdilemma)博弈論和對策行為

策略型博弈的實(shí)例和解(囚徒困境)

這個例子可以看作是非合作博奕現(xiàn)象的一個抽象概括。它講的是兩個嫌疑犯被隔離審訊。他們面臨的處境是:如果兩人都坦白,各判刑8年;如果兩人都抵賴,各判刑1年(或許證據(jù)不足);如果一人坦白另一人抵賴,則坦白的放出去,不坦白的判刑10年,(“坦白從寬、抗拒從嚴(yán)”)。這里,兩個囚徒就是兩個局中人,每個局中人都有兩個策略可供選擇:坦白或抵賴。表中每一格的一對數(shù)字分別表示局中人不同策略組合的收益,第一個數(shù)字是囚徒A的收益,第二個數(shù)字是囚徒B的收益。這種有限對策(局中人是有限個,每個局中人的策略數(shù)也是有限的)往往用矩陣形式表示。例1.囚徒困境(prisoner’sdilemma)博62例1.囚徒困境(prisoner’sdilemma)博弈論和對策行為

策略型博弈的實(shí)例和解(囚徒困境)在對博奕局勢進(jìn)行描述后,博奕論分析就是要求出局中人進(jìn)行策略選擇的理性結(jié)局,或者說找出博奕問題的解。在非合作博奕中,有兩種解的技術(shù):一種是納什均衡,一種是優(yōu)超解。例1.囚徒困境(prisoner’sdilemma)博63定義1:給定其它局中人的策略s,局中人i的最優(yōu)反應(yīng)

記為s,是指能給他帶來最大收益的策略,即博弈論和對策行為

納什均衡當(dāng)每個局中人都選擇了自己的最優(yōu)反應(yīng)策略,并且這些最優(yōu)反應(yīng)形成一個策略組合,便形成了納什均衡。定義1:給定其它局中人的策略s,局中人i的最優(yōu)反應(yīng)

64定義2:一個策略組合s*=(s1*,s2*,…,sn*)被稱為納什均

衡是指,對于所有的i,博弈論和對策行為

納什均衡納什均衡的思想就是,博奕的理性結(jié)局是這樣一種策略組合,其中每個局中人選擇的策略都已是對其它局中人所選策略的最優(yōu)反應(yīng),所以,誰也沒有積極性去選擇其它策略。因?yàn)槊恳粋€局中人均不能因?yàn)閱畏矫娓淖冏约旱牟呗远@利,于是誰也沒有興趣主動打破這種均衡。定義2:一個策略組合s*=(s1*,s2*,…,sn*)被65在囚徒困境中,考慮囚徒A對他人的最優(yōu)反應(yīng)。如果給定囚徒B的策略是“坦白”,那么對囚徒A來說,采取“坦白”策略得到的收益是-8,采取“抵賴”策略得到的收益是-10,顯然“坦白”為好;同理,如果給定囚徒B的策略是“抵賴”,對囚徒A來說,“坦白”也比“抵賴”好。因此,囚徒A對囚徒B的最優(yōu)反應(yīng)是“坦白”。對囚徒B作同樣分析:如果囚徒A的策略是“坦白”,則他采取“坦白”策略為好;如果囚徒A的策略是“抵賴”,他還是采取“坦白”策略好,所以囚徒B對囚徒A的最優(yōu)反應(yīng)也是“坦白”。兩個最優(yōu)反應(yīng)形成了一個策略組合(坦白,坦白),這就是一個納什均衡。博弈論和對策行為

納什均衡在囚徒困境中,考慮囚徒A對他人的最優(yōu)反應(yīng)。如66

兩個寡頭企業(yè)選擇產(chǎn)量的博奕就是一個囚徒困境問題?;叵胍幌鹿胖Z均衡的含義:古諾均衡是指存在這樣一對產(chǎn)量組合(q1*,q2*),使得:假定企業(yè)2的產(chǎn)量為q2*時,q1*是企業(yè)1的最優(yōu)產(chǎn)量;假定企業(yè)1的產(chǎn)量為q1*時,q2*是企業(yè)2的最優(yōu)產(chǎn)量。按照納什均衡的定義,古諾均衡(q1*,q2*)也就是博奕論中的納什均衡。納什均衡只說明博奕的穩(wěn)定性結(jié)局。博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用兩個寡頭企業(yè)選擇產(chǎn)量的博奕就是一個囚徒困67讓我們再回到囚徒困境本身。納什均衡(坦白,坦白)表明兩人共同的集體選擇,但是這個選擇是否是理性的?理性選擇是指使收益最大化的選擇。如果兩人都抵賴,各判刑1年,顯然比坦白各判刑8年好。所以,納什均衡(坦白,坦白)并不是一個集體理性選擇。但它卻是個人理性選擇的一個組合。囚徒困境正是反映了一個深刻的問題,這就是個人理性與集體理性的矛盾。博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用讓我們再回到囚徒困境本身。納什均衡(坦白,坦白)表68博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用一個非集體理性選擇,如納什均衡(坦白,坦白),用經(jīng)濟(jì)學(xué)術(shù)語說,其中存在“帕累托改進(jìn)”的機(jī)會。所謂帕累托改進(jìn)就是說,它在不使另一部分人的境況變得更壞的前提下,至少能改進(jìn)一部分人的境況。如果不存在帕累托改進(jìn)的情況,便達(dá)到“帕累托最優(yōu)”。這里,如果兩人都選擇抵賴,兩人的境況都有所改進(jìn)。所以,(坦白,坦白)不是帕累托最優(yōu)。集體的理性選擇應(yīng)該是大家都抵賴。但是這個帕累托改進(jìn)辦不到。為什么?因?yàn)槲覀円呀?jīng)驗(yàn)證,(坦白,坦白)這個策略組合正是一個納什均衡。在一個納什均衡中,不會有人主動去打破這種格局的。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用一個非集69博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用那么,兩個囚徒事先訂好攻守同盟,兩人都采取抵賴的策略,不是可以改善兩人的境遇嗎?但問題是,這個攻守同盟有沒有意義?沒有。原因在于(抵賴,抵賴)這個策略組合不是一個納什均衡,沒有人有積極性去遵守這個協(xié)議。一般地,假設(shè)博奕中的每個局中人事先達(dá)成一項(xiàng)協(xié)議,規(guī)定了各自的行為規(guī)則。如果局中人會自覺遵守這個協(xié)議,等于說這個協(xié)議構(gòu)成了一個納什均衡:給定別人遵守協(xié)議的情況下,自己的最好選擇就是也遵守協(xié)議。相反,一個協(xié)議不構(gòu)成納什均衡時,它就不可能自動實(shí)施,因?yàn)橹辽儆幸粋€局中人會違背這個協(xié)議。所以,不滿足納什均衡要求的協(xié)議是沒有意義的。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用那么,兩70博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用以上的分析告訴我們,用經(jīng)濟(jì)學(xué)的觀點(diǎn)來看,只有由滿足個人理性選擇的策略組成的集合才是均衡的,或者說只有納什均衡才是穩(wěn)定的。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用以上的分71博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用看兩個寡頭合謀與價格卡特爾的情形,它也存在個人理性與集體理性的沖突。在兩個寡頭合謀條件下的產(chǎn)量與價格決定,是基于兩個寡頭利潤總和的最大化目標(biāo),而不是每個企業(yè)自己的利潤最大化。因此這種最大化目標(biāo)下的產(chǎn)量分配符合兩家企業(yè)的共同利益,卻不是使每家企業(yè)自己的利潤最大化的產(chǎn)量,換言之,并不是每家企業(yè)自己的“最優(yōu)反應(yīng)”。所以,卡特爾產(chǎn)量分配不是一個納什均衡。正因?yàn)榇耍ㄌ貭栂乱欢〞羞`約沖動,卡特爾具有不穩(wěn)定性。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用看兩個寡72博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用在軍備競賽中,人們年復(fù)一年的談判,試圖簽訂一個限制軍備的條約。但是這種條約也存在個人理性與集體理性的沖突。簽訂條約對世界和平有利,但履行條約未必是各國行動的“最優(yōu)反應(yīng)”:試想,如果我減少軍備開支,而你增加軍費(fèi)支出,我不是受到威脅了嗎?所以,這種條約不構(gòu)成納什均衡,各國都有違約的沖動。納什均衡是各國都大量增加軍費(fèi)預(yù)算,結(jié)果軍備競賽就只好繼續(xù)下去。冷戰(zhàn)時期前蘇聯(lián)和美國之間的軍備競賽就是典型一例,兩國都在導(dǎo)彈上花了幾萬億美元,如果把資源用于民品生產(chǎn),兩國的社會福利就會變得更好。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用在73博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用企業(yè)競爭而產(chǎn)生的廣告資源浪費(fèi)也是典型例子。如兩家寡頭競爭,經(jīng)理們可選擇策略是“多做廣告”和“少做廣告”,各種策略組合的盈利矩陣如下表,企業(yè)1最優(yōu)反應(yīng)是多做廣告,企業(yè)2最優(yōu)反應(yīng)也是多做廣告,因此(多做廣告,多做廣告)是一個納什均衡。這個納什均衡的結(jié)果是大量資源消耗在廣告上。企業(yè)2少做廣告多做廣告企業(yè)1少做廣告30,3010,40多做廣告40,1020,20博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用企74博弈論和對策行為

囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用

納什均衡概念的局限性在于,在博奕中有可能納什均衡不是唯一的。例:兩家寡頭價格競爭,經(jīng)理可選擇的策略是價格不變或漲價,收益矩陣如下所示:企業(yè)2價格不變漲價企業(yè)1價格不變10,10100,-30漲價-20,30140,35結(jié)果發(fā)現(xiàn)納什均衡有兩個:(價格不變,價格不變)、(漲價,漲價)。博奕中的實(shí)際結(jié)果取決于首先采取什么行動。如果先前的情況是價格不變,那么這一博奕的預(yù)期結(jié)果就是價格不變。另外,對有的博奕來說,也可能不存在納什均衡。博弈論和對策行為囚徒困境在經(jīng)濟(jì)學(xué)上的應(yīng)用納什75博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)一男一女戀愛,有些業(yè)余活動要安排,或者去看足球比賽,或者去看芭蕾舞演出。男的偏好足球,女的則更喜歡芭蕾舞,但他們都寧愿在一起,不愿分開。下表給出收益矩陣:女足球芭蕾男足球2,10,0芭蕾0,01,2博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別76博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)

這個博奕中有兩個納什均衡:(足球,足球)和(芭蕾,芭蕾)。就是說,一方去足球場,另一方也會去足球場;類似地,一方去看芭蕾,另一方也會去看芭蕾。在實(shí)際生活中,也許是這一次看足球,下一次看芭蕾,如此循環(huán),形成一種默契。這在實(shí)際生活中是指,兩種互補(bǔ)的活動應(yīng)該配合,盡管配合的方式可能有很多種。博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別77比如,兩家工廠生產(chǎn)的產(chǎn)品可能是互補(bǔ)的,一家為另一家提供零配件,這里有一個標(biāo)準(zhǔn)的選擇問題,由于種種原因,很可能在產(chǎn)品標(biāo)準(zhǔn)的選擇上,生產(chǎn)成品的廠家與生產(chǎn)零配件的廠家之間有沖突。這就需要相互妥協(xié),但妥協(xié)的結(jié)果有兩種可能,或者是生產(chǎn)零配件的廠家適應(yīng)生產(chǎn)成品的廠家,或者是生產(chǎn)成品的廠家適應(yīng)于生產(chǎn)零配件的廠家。博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)比如,兩家工廠生產(chǎn)的產(chǎn)品可能是互補(bǔ)的,一家為78博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)性別戰(zhàn)的例子中有兩個納什均衡,那么,究竟那一個納什均衡會實(shí)際發(fā)生?我們不知道。這里還有一個先動優(yōu)勢(first-moveradvantage),比如說,若男的先買票,兩人就會出現(xiàn)在足球場,若女的買票,兩人就會出現(xiàn)在芭蕾舞劇院。博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別79博弈論和對策行為

策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別戰(zhàn)(battleofthesexes)在囚徒博奕中,我們隱含地假定雙方下奕者是同時實(shí)施其策略的。性別戰(zhàn)中的先動優(yōu)勢表明了另一種類型的博奕,稱為順序性博奕(sequentialgame)。在順序性博奕中,有一名下奕者先博奕行動,然后另一名下奕者要做出反應(yīng)。先下奕者有先動優(yōu)勢。性別戰(zhàn)的例子也有很多應(yīng)用。企業(yè)進(jìn)入新的市場就是一種順序性博奕。新企業(yè)首先決定是否進(jìn)入,然后現(xiàn)有企業(yè)決定是不管它,還是阻止它的進(jìn)入。博弈論和對策行為策略型博弈的實(shí)例和解(性別戰(zhàn))例2.性別80博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用

設(shè)想有一家壟斷企業(yè)已在市場上(稱為“在位者”),另一家新企業(yè)虎視眈眈想進(jìn)入(稱為“進(jìn)入者”)。在位者想保持自己的壟斷地位,所以就要阻撓進(jìn)入者的進(jìn)入。在這個博奕中,進(jìn)入者有兩種策略可以選擇:進(jìn)入還是不進(jìn)入;在位者也有兩種策略:默許還是斗爭。各種策略組合的收益矩陣如下表:

例:市場進(jìn)入阻撓(entrydeterrance)在位者默許斗爭進(jìn)入者進(jìn)入40,50-10,0不進(jìn)入0,3000,300博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用設(shè)想有81博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用博奕也有兩個納什均衡,即(進(jìn)入,默許),(不進(jìn)入,斗爭),相應(yīng)的收益為(40,50),(0,300)。就是說如果新企業(yè)首先進(jìn)入,在位者的最優(yōu)反應(yīng)是默許;類似地,如果在位者默許,新企業(yè)的最優(yōu)策略是進(jìn)入。盡管在新企業(yè)不進(jìn)入時,默許和斗爭對在位者是一樣的效果,但在在位者選擇斗爭時,新企業(yè)的最優(yōu)選擇是不進(jìn)入,所以,(不進(jìn)入,斗爭)是一個納什均衡,而(不進(jìn)入,默許)不是納什均衡。博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用博奕82博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用一家企業(yè)率先推出一種新產(chǎn)品,其它企業(yè)跟進(jìn)也是一種順序性博奕。把新產(chǎn)品率先推向市場的先動企業(yè)的成功可能性要大一些,跟進(jìn)者面臨的困難是消費(fèi)者對先動企業(yè)的品牌有了一定的忠誠度,并在頭腦中有了先動企業(yè)的形象;而且,如果消費(fèi)者在學(xué)習(xí)使用先動企業(yè)的新產(chǎn)品時花費(fèi)了學(xué)習(xí)時間,往往不愿意再花時間或改動設(shè)備去使用另一家企業(yè)的類似產(chǎn)品。文字處理和數(shù)據(jù)庫軟件就是很好的例子。對一種程序或一種輸入方法已很熟練者,一般不愿意更換,除非后者有很多優(yōu)點(diǎn)。博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用一家83博弈論和對策行為

性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用

下表是兩個競爭企業(yè)是否推出新產(chǎn)品的利益矩陣。

這個博奕中有兩個納什均衡:一家推出新產(chǎn)品,一家無新產(chǎn)品。推出新產(chǎn)品的企業(yè)贏利為10,無新產(chǎn)品的企業(yè)贏利為-5。究竟是企業(yè)1還是企業(yè)2贏利,要看是哪一家企業(yè)首先行動。假定企業(yè)1具有較高的研究和開發(fā)優(yōu)勢,率先在市場上推出新產(chǎn)品,那么企業(yè)2的最佳反應(yīng)就是不跟進(jìn),因?yàn)楦M(jìn)的損失是7,不跟進(jìn)的損失只有5。企業(yè)2無新產(chǎn)品推出新產(chǎn)品企業(yè)1無新產(chǎn)品2,2-5,10推出新產(chǎn)品10,-5-7,-7博弈論和對策行為性別戰(zhàn)在經(jīng)濟(jì)學(xué)上的應(yīng)用下表是84博弈論和對策行為

優(yōu)超解如果一個局中人在任何情況下從某種策略中得到的收益均大于從其它策略中得到的收益,那么對他而言,這個策略稱為優(yōu)超策略或支配性策略(dominantstrategy)。其它的策略稱為被優(yōu)超策略或被支配策略(dominatedstrategy)。博弈論和對策行為優(yōu)超解如果一個局中人在任何85博弈論和對策行為

優(yōu)超解在囚徒博奕中,對囚徒A來說,“抵賴”被“坦白”優(yōu)超,對囚徒B也同樣,所以,(坦白,坦白)就是一個優(yōu)超策略均衡。在這個例子中,優(yōu)超策略均衡也就是納什均衡。當(dāng)有一名局中人具有優(yōu)超策略時,博奕總會有一個納什均衡,因?yàn)楫?dāng)該局中人采取優(yōu)超策略時,另一局中人就會據(jù)此做出自己的最優(yōu)反應(yīng)。但納什均衡不一定是優(yōu)超策略均衡。博弈論和對策行為優(yōu)超解在囚徒博奕中,對囚徒A來說86博弈論和對策行為

優(yōu)超解在市場進(jìn)入阻撓博奕中,在位者有一個優(yōu)超解“默許”,進(jìn)入者對默許的最優(yōu)反應(yīng)是“進(jìn)入”,所以,(進(jìn)入,默許)是一個納什均衡。

大多數(shù)的博奕局勢中利用優(yōu)超概念只能夠?qū)Σ┺葐栴}進(jìn)行簡化,得不到對策解。博弈論和對策行為優(yōu)超解在市場進(jìn)入阻撓博奕中,在位87博弈論和對策行為

優(yōu)超解例2:考慮由下表給出的策略性博奕:局中人Buvx3,67,1局中人Ay5,18,0z6,06,2博弈論和對策行為優(yōu)超解例2:考慮由下表給出的策略性博奕:88博弈論和對策行為

優(yōu)超解對于局中人A來說,策略x被y優(yōu)超了,所以,可以刪去x使問題簡化為:局中人Buv局中人Ay5,18,0z6,06,2但是,對這個簡化了的博奕,我們?nèi)匀粺o法找到對策解。有些博奕問題既沒有優(yōu)超均衡解,也沒有納什均衡解。博弈論和對策行為優(yōu)超解對于局中人A來說,策89博弈論和對策行為

最大最小策略(Max-minstrategy)

馮.諾依曼和摩根斯坦認(rèn)為策略的選擇與決策者的性格有關(guān)。某些決策者可能認(rèn)為,冒失行動容易造成重大失誤,最好還是從最不利的情況出發(fā),向最好的方向努力,力求做到有備無患。這樣的決策者屬于風(fēng)險(xiǎn)厭惡型的,他首先想到的是各種不利因素和風(fēng)險(xiǎn),所以他先要考慮各種最壞的結(jié)果,然后從最壞結(jié)果中選出一個最好結(jié)果。按這種原則選取的策略可以稱為最大最小策略。博弈論和對策行為最大最小策略(Max-minstrate90博弈論和對策行為

混合策略和重復(fù)性博弈策略有兩種概念,前面我們所說的策略,都是純策略,另一種策略概念為在純策略基礎(chǔ)上形成的混合策略(mixedstrategy)。局中人I的混合策略αi是他的純策略空間Si上的一種概率分布,表示局中人實(shí)際對策時根據(jù)這種概率分布在純策略中隨機(jī)選擇加以實(shí)施。博弈論和對策行為混合策略和重復(fù)性博弈策略有兩種概91博弈論和對策行為

混合策略和重復(fù)性博弈為了敘述問題方便,下面我們主要討論二人零和博奕。零和對策是策略型對策的最基本模式,其中局中人得失的總和為零(或?yàn)橐怀?shù))。二人零和博奕是指零和博奕中有且只有兩個局中人,一人的所得正是另一人的所失。二人零和對策在博奕論的早期發(fā)展中曾占有過重要地位。二人零和博奕的支付矩陣可以記為:局中人Bb1b2a1α11α12a2α21α22如果支付矩陣的數(shù)值αij為正時,表示局中A的贏得值,若支付矩陣的數(shù)值αij為負(fù)時,表示局中A的損失或輸?shù)舻闹怠2┺恼摵蛯Σ咝袨榛旌喜呗院椭貜?fù)性博弈為了敘述問題92博弈論和對策行為

混合策略和重復(fù)性博弈例:二人零和博奕的收益矩陣如下表,局中人A的收益值均為正,而局中人B的收益值均為負(fù),即表示局中人B的損失值。局中人Bb1b2局中人Aa11,-14,-4a23,-32,-2博弈論和對策行為混合策略和重復(fù)性博弈例:二人零和93博弈論和對策行為

混合策略和重復(fù)性博弈如果每個局中人完全清楚地知道對手將會采取什么樣的策略,會是什么情況呢?A如果知道B會選擇b1,則會選擇a2;當(dāng)A連續(xù)使用策略a2時,B必定會察覺,便會選擇b2;當(dāng)B連續(xù)使用b2時,A也會察覺,從而改為選擇a1;B如果知道A選擇了a1,則又會選擇b1;如此反復(fù),以至無窮,所以,雙方如果使用純策略進(jìn)行博奕時,就會出現(xiàn)不穩(wěn)定狀態(tài),不會有最終的均衡結(jié)果。這說明雙方都不能連續(xù)不變地使用某

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論