第2講 完全信息靜態(tài)博弈【博弈論經(jīng)典】課件_第1頁(yè)
第2講 完全信息靜態(tài)博弈【博弈論經(jīng)典】課件_第2頁(yè)
第2講 完全信息靜態(tài)博弈【博弈論經(jīng)典】課件_第3頁(yè)
第2講 完全信息靜態(tài)博弈【博弈論經(jīng)典】課件_第4頁(yè)
第2講 完全信息靜態(tài)博弈【博弈論經(jīng)典】課件_第5頁(yè)
已閱讀5頁(yè),還剩157頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

在這一講,我們集中討論完全信息靜態(tài)博弈?!巴耆畔ⅰ敝傅氖敲總€(gè)參與人對(duì)所有其他參與人的特征(包括戰(zhàn)略空間、支付函數(shù)等)有完全的了解?!办o態(tài)”指的是所有參與人同時(shí)選擇行動(dòng)且只選擇一次?!巴瑫r(shí)行動(dòng)”是一個(gè)信息概念而非日歷上的時(shí)間概念:只要每個(gè)參與人在選擇自己的行動(dòng)時(shí)不知道其他參與人的選擇,我們就說(shuō)他們?cè)谕瑫r(shí)行動(dòng)。第2講完全信息靜態(tài)博弈在這一講,我們集中討論完全信息靜態(tài)博弈。第2講完全信息靜態(tài)完全信息靜態(tài)博弈是一種最簡(jiǎn)單的博弈,在這種博弈中,由于每個(gè)人是在不知道其他人行動(dòng)的情況下選擇自己的行動(dòng),戰(zhàn)略和行動(dòng)實(shí)際上是一回事。博弈分析的目的是預(yù)測(cè)博弈的均衡結(jié)果,即給定每個(gè)參與人是理性的(rational),每個(gè)參與人都知道每個(gè)參與人都是理性的,什么是每個(gè)參與人的最優(yōu)戰(zhàn)略?什么是所有參與人的最優(yōu)戰(zhàn)略組合?納什均衡是完全信息博弈解的一般概念,也是所有其他類型博弈解的基本要求。第2講完全信息靜態(tài)博弈完全信息靜態(tài)博弈是一種最簡(jiǎn)單的博弈,在這種博弈中,由于每個(gè)人1.納什均衡納什對(duì)博弈論的貢獻(xiàn)有兩個(gè)方面:一是合作博弈理論中的討價(jià)還價(jià)模型,稱為納什討價(jià)還價(jià)解(Nashbargainingsolution);二是非合作博弈論方面,這是他的主要貢獻(xiàn)所在。納什對(duì)非合作博弈的主要貢獻(xiàn)是他在1950年和1951年的兩篇論文中在非常一般意義上定義了非合作博弈及其均衡解,并證明了均衡解的存在。這樣就奠定了非合作博弈論的基礎(chǔ)。納什所定義的均衡稱為“納什均衡”,它如同瓦爾拉斯均衡一樣,已成為經(jīng)濟(jì)學(xué)中的專家術(shù)語(yǔ)。第2講完全信息靜態(tài)博弈1.納什均衡第2講完全信息靜態(tài)博弈2.占優(yōu)戰(zhàn)略均衡一個(gè)著名的例子:“囚徒困境”?!扒敉嚼Ь场钡墓适轮v的是:兩個(gè)嫌疑犯作案后被警察抓住,被分別關(guān)在不同的房間里受審訊警察知道兩個(gè)人有罪,但缺乏足夠的證明定罪,除非兩人當(dāng)中至少有一個(gè)人坦白。警察告訴每個(gè)人:如果兩人都不承認(rèn),每人都以輕微的犯罪判刑1年;如果兩人都坦白,各判刑8年;如果兩人中一個(gè)人坦白而另一個(gè)人抵賴,坦白的釋放出去,抵賴的判刑10年。第2講完全信息靜態(tài)博弈2.占優(yōu)戰(zhàn)略均衡第2講完全信息靜態(tài)博弈

這樣,每個(gè)嫌疑犯面臨四個(gè)可能的結(jié)果:第2講完全信息靜態(tài)博弈-8,-80,-10-10,0-1,-1囚犯B囚犯A坦白不坦白坦白不坦白囚徒困境這樣,每個(gè)嫌疑犯面臨四個(gè)可能的結(jié)果:第2講完全信息靜態(tài)在這個(gè)博弈中,每個(gè)囚徒都有兩種可選擇的戰(zhàn)略:坦白或抵賴。不論同伙選擇什么戰(zhàn)略,每個(gè)囚徒的最優(yōu)戰(zhàn)略是“坦白”,比如說(shuō),如果B選擇坦白,A選擇坦白時(shí)的支付為-8,選擇抵賴時(shí)的支付為-10,因而坦白比抵賴好;如果B選擇抵賴,A坦白時(shí)的支付為0,抵賴時(shí)的支付為-1,因而坦白還是比抵賴好。就是說(shuō),“坦白”是囚徒A的占優(yōu)戰(zhàn)略。類似地,“坦白”也是B的占優(yōu)戰(zhàn)略。第2講完全信息靜態(tài)博弈在這個(gè)博弈中,每個(gè)囚徒都有兩種可選擇的戰(zhàn)略:坦白或抵賴。第2

一般來(lái)說(shuō),由于每個(gè)人參與人的效用(支付)是博弈中所有參與人的戰(zhàn)略的函數(shù),因此每個(gè)參與人的最優(yōu)戰(zhàn)略選擇依賴于所有其他人的戰(zhàn)略選擇。但在一些特殊博弈中,一個(gè)參與人的最優(yōu)戰(zhàn)略可能并不依賴于其他參與人的戰(zhàn)略選擇,就是說(shuō),不論其他參與人選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是惟一的,這樣的戰(zhàn)略稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)第2講完全信息靜態(tài)博弈一般來(lái)說(shuō),由于每個(gè)人參與人的效用(支付)是博弈中所有參與第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈在一個(gè)博弈里,如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么,占優(yōu)戰(zhàn)略均衡是可以預(yù)測(cè)的到惟一的均衡,因?yàn)闆](méi)有一個(gè)理性的參與人會(huì)選擇劣戰(zhàn)略。在囚徒困境博弈里,(坦白,坦白)是占優(yōu)戰(zhàn)略均衡;在房地產(chǎn)開(kāi)發(fā)博弈里,如果市場(chǎng)需求是大的,(開(kāi)發(fā),開(kāi)發(fā))是占優(yōu)戰(zhàn)略均衡。注意:占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的,而不要求每個(gè)參與人知道其他參與人是理性的(也就是說(shuō),不要求“理性”是共同知識(shí)),這是因?yàn)?,不論其他參與人是否是理性的,占優(yōu)戰(zhàn)略總是一個(gè)理性人的最優(yōu)選擇。第2講完全信息靜態(tài)博弈在一個(gè)博弈里,如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么,占優(yōu)戰(zhàn)略囚徒困境反映了一個(gè)深刻的問(wèn)題,即個(gè)人理性和集體理性的沖突。如果每個(gè)人都選擇抵賴,各判刑1年,顯然比都判刑8年好。但這個(gè)帕累托改進(jìn)做不到,因?yàn)樗粷M足個(gè)人理性要求,(抵賴,抵賴)不是一個(gè)均衡。換個(gè)角度看,即使兩個(gè)囚徒在作案之前建立攻守同盟(絕不坦白),這個(gè)攻守同盟也沒(méi)有用,因?yàn)闆](méi)有人有積極性遵守協(xié)定。這就是合作博弈和非合作博弈的區(qū)別。第2講完全信息靜態(tài)博弈囚徒困境反映了一個(gè)深刻的問(wèn)題,即個(gè)人理性和集體理性的沖突。第囚徒困境在經(jīng)濟(jì)學(xué)上有著廣泛的應(yīng)用。例1:兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈。如果兩個(gè)企業(yè)聯(lián)合起來(lái)形成卡特爾,選擇壟斷利潤(rùn)最大化的產(chǎn)量,每個(gè)企業(yè)都可以得到更多的利潤(rùn)。但卡特爾不是一個(gè)穩(wěn)定的均衡,因?yàn)榻o定對(duì)方遵守協(xié)議的情況下,每個(gè)企業(yè)都想增加生產(chǎn),結(jié)果是,每個(gè)企業(yè)都只得到小于最大利潤(rùn)的產(chǎn)量,利潤(rùn)嚴(yán)格小于卡特爾產(chǎn)量下的利潤(rùn)。在有些情況下,個(gè)人理性和集體理性的沖突對(duì)社會(huì)來(lái)說(shuō)也許是一件好事,盡管對(duì)集體而言是一件壞事。第2講完全信息靜態(tài)博弈囚徒困境在經(jīng)濟(jì)學(xué)上有著廣泛的應(yīng)用。第2講完全信息靜態(tài)博弈例2:公共產(chǎn)品的供給也是一個(gè)囚徒困境問(wèn)題。

如果大家都出錢興辦公共事業(yè),所有人的福利都會(huì)增加。問(wèn)題是,如果我出錢你不出錢,我得不償失,而如果你出錢我不出錢,我就可以占你的便宜。所以,每個(gè)人的最優(yōu)戰(zhàn)略是“不出錢”,這種情況下,使得所有人的福利都得不到提高。例3:“軍備競(jìng)賽”。例4:經(jīng)濟(jì)改革本身也可能是這樣,在許多改革中,改革要付出成本(包括風(fēng)險(xiǎn)),而改革的成果大家共享,結(jié)果是:盡管人人都認(rèn)為改革好,卻沒(méi)有人真正去改革,大家只好在都不滿意的體第2講完全信息靜態(tài)博弈例2:公共產(chǎn)品的供給也是一個(gè)囚徒困境問(wèn)題。第2講完全信息靜

下繼續(xù)生活下去。

從囚徒困境中,我們可以引出一個(gè)很重要的結(jié)論:一種制度(體制)安排,要發(fā)生效力,必須是一種均衡。否則,這種制度安排不能成立。第2講完全信息靜態(tài)博弈下繼續(xù)生活下去。第2講完全信息靜態(tài)博弈3.重復(fù)剔除的占優(yōu)均衡在每個(gè)參與人都有占優(yōu)戰(zhàn)略的情況下,占優(yōu)戰(zhàn)略均衡是一個(gè)非常合理的預(yù)測(cè),但在絕大數(shù)博弈中,占優(yōu)戰(zhàn)略均衡是不存在的。第2講完全信息靜態(tài)博弈3.重復(fù)剔除的占優(yōu)均衡第2講完全信息靜態(tài)博弈“智豬博弈”這個(gè)例子講的是,豬圈里圈著兩頭豬,一頭大豬,一頭小豬,豬圈的一頭有一個(gè)豬食槽,另一頭安裝著一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕,8個(gè)單位的豬食進(jìn)槽,但需要支付兩個(gè)單位的成本。若大豬先到,大豬吃到7個(gè)單位,小豬只能吃到1個(gè)單位;若小豬先到,大豬和小豬各吃到4個(gè)單位;若兩豬同時(shí)到,大豬吃到5個(gè)單位,小豬吃到3個(gè)單位。第2講完全信息靜態(tài)博弈“智豬博弈”第2講完全信息靜態(tài)博弈這里,每頭豬都有兩種戰(zhàn)略:按或等待。第2講完全信息靜態(tài)博弈3,12,47,-10,0按等待按等待小豬大豬這里,每頭豬都有兩種戰(zhàn)略:按或等待。第2講完全信息靜態(tài)博弈顯然,這個(gè)博弈沒(méi)有占優(yōu)戰(zhàn)略均衡,因?yàn)楸M管“等待”是小豬的占優(yōu)戰(zhàn)略,但大豬沒(méi)有占有戰(zhàn)略。大豬的戰(zhàn)略依賴于小豬的戰(zhàn)略:如果小豬選擇“等待”,大豬的最優(yōu)的戰(zhàn)略式“按”,反之,如果小豬選擇“按”,大豬的最優(yōu)戰(zhàn)略是“等待”。因此,我們不能應(yīng)用占優(yōu)戰(zhàn)略找出均衡。那么,什么是這個(gè)博弈的可能的均衡解呢?第2講完全信息靜態(tài)博弈顯然,這個(gè)博弈沒(méi)有占優(yōu)戰(zhàn)略均衡,因?yàn)楸M管“等待”是小豬的占優(yōu)在找出上述“智豬博弈”的均衡解時(shí),實(shí)際上是應(yīng)用了“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”(interatedeliminationofstrictlydominatedstrategies)的思路,這個(gè)思路是這樣的:首先找出某個(gè)參與人的劣戰(zhàn)略(假定存在),把這個(gè)劣戰(zhàn)略剔除掉,重新構(gòu)造一個(gè)不包含已剔除戰(zhàn)略的新的博弈;然后再剔除這個(gè)新的博弈的某個(gè)參與人的劣戰(zhàn)略;繼續(xù)這個(gè)過(guò)程,一直到只剩下一個(gè)唯一的戰(zhàn)略組合為止。這個(gè)唯一剩下的戰(zhàn)略組合就是這個(gè)博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡。

(interateddominancestrategies)第2講完全信息靜態(tài)博弈在找出上述“智豬博弈”的均衡解時(shí),實(shí)際上是應(yīng)用了“重復(fù)剔除嚴(yán)在“智豬博弈”中,我們先剔除掉小豬的劣戰(zhàn)略“按”,在剔除掉這個(gè)戰(zhàn)略后的新的博弈中,小豬只有一個(gè)戰(zhàn)略“等待”,大豬仍有兩個(gè)戰(zhàn)略,但此時(shí),“等待”已成為大豬的劣戰(zhàn)略,提出這個(gè)戰(zhàn)略,剩下的唯一戰(zhàn)略組合是(按,等待)。第2講完全信息靜態(tài)博弈在“智豬博弈”中,我們先剔除掉小豬的劣戰(zhàn)略“按”,在剔除掉這我們需要對(duì)“占優(yōu)戰(zhàn)略”和“劣戰(zhàn)略”的概念進(jìn)行重新定義。第2講完全信息靜態(tài)博弈我們需要對(duì)“占優(yōu)戰(zhàn)略”和“劣戰(zhàn)略”的概念進(jìn)行重新定義。第2講第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈與占優(yōu)戰(zhàn)略均衡不同的是,重復(fù)剔除的占優(yōu)均衡不僅要求每個(gè)參與人是理性的,而且要求“理性”是參與人的共同知識(shí),即所有參與人知道所有參與人是理性的,所有參與人知道所有參與人知道所有參與人是理性的,如此等等。第2講完全信息靜態(tài)博弈與占優(yōu)戰(zhàn)略均衡不同的是,重復(fù)剔除的占應(yīng)用例子:(1)股份公司中的大股東和小股東。(2)股票市場(chǎng)上大戶和小戶。(3)市場(chǎng)競(jìng)爭(zhēng)中大企業(yè)和小企業(yè)之間的關(guān)系。第2講完全信息靜態(tài)博弈應(yīng)用例子:第2講完全信息靜態(tài)博弈4.納什均衡把理性作為共同知識(shí)的要求并不是重復(fù)剔除的占優(yōu)均衡的唯一問(wèn)題。更為嚴(yán)重的問(wèn)題是,對(duì)于相當(dāng)多的博弈,我們無(wú)法使用重復(fù)剔除劣戰(zhàn)略的辦法找出均衡。比如,在房地產(chǎn)開(kāi)發(fā)博弈中,假定市場(chǎng)是低需求的情況,那么,無(wú)論對(duì)于A還是B,沒(méi)有任何一種戰(zhàn)略優(yōu)于另一種戰(zhàn)略,每一個(gè)參與人的最優(yōu)戰(zhàn)略都依賴于另一個(gè)參與人的戰(zhàn)略:如果B選擇開(kāi)發(fā),A的最優(yōu)戰(zhàn)略是不開(kāi)發(fā),如果B選擇不開(kāi)發(fā),A的最第2講完全信息靜態(tài)博弈4.納什均衡第2講完全信息靜態(tài)博弈

優(yōu)戰(zhàn)略是開(kāi)發(fā)。為了找出這個(gè)博弈的均衡解,我們需要引入納什均衡。納什均衡是完全信息靜態(tài)博弈解的一般概念,構(gòu)成納什均衡的戰(zhàn)略一定是重復(fù)剔除嚴(yán)格劣戰(zhàn)略過(guò)程中不能被剔除的戰(zhàn)略。就是說(shuō),沒(méi)有任何一個(gè)戰(zhàn)略嚴(yán)格優(yōu)于納什均衡戰(zhàn)略,逆定理不一定成立;更為重要的是許多不存在占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡的博弈,卻存在納什均衡。第2講完全信息靜態(tài)博弈優(yōu)戰(zhàn)略是開(kāi)發(fā)。為了找出這個(gè)博弈的均衡解,我們需要引入納第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈

運(yùn)用上述定義來(lái)檢查一個(gè)特定的戰(zhàn)略組合是否是一個(gè)納什均衡。在囚徒困境里,(坦白,坦白)是一個(gè)納什均衡。在房地產(chǎn)開(kāi)發(fā)博弈中,如果是高需求,(開(kāi)發(fā),開(kāi)發(fā))是一個(gè)納什均衡;如果是低需求,(開(kāi)發(fā),不開(kāi)發(fā))是一個(gè)納什均衡,(不開(kāi)發(fā),開(kāi)發(fā))也是一個(gè)納什均衡,而(開(kāi)發(fā),開(kāi)發(fā))和(不開(kāi)發(fā),不開(kāi)發(fā))都不是納什均衡。第2講完全信息靜態(tài)博弈運(yùn)用上述定義來(lái)檢查一個(gè)特定的戰(zhàn)略組合是否是一個(gè)納什均衡

納什均衡有強(qiáng)弱之分,上述定義給出的是弱納什均衡的概念。一個(gè)納什均衡是強(qiáng)的(strictorstrong),如果給定其他參與人的戰(zhàn)略,每一個(gè)參與人的最優(yōu)選擇是唯一的。就是說(shuō),第2講完全信息靜態(tài)博弈納什均衡有強(qiáng)弱之分,上述定義給出的是弱納什均衡的概念。5.納什均衡、占優(yōu)戰(zhàn)略均衡和重復(fù)剔除的占優(yōu)均衡之間的關(guān)系(1)每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡。(2)納什均衡一定是在重復(fù)剔除嚴(yán)格劣戰(zhàn)略過(guò)程中沒(méi)有被剔除掉的戰(zhàn)略組合,但沒(méi)有被剔除掉的戰(zhàn)略組合不一定是納什均衡。第2講完全信息靜態(tài)博弈5.納什均衡、占優(yōu)戰(zhàn)略均衡和重復(fù)剔除的占優(yōu)均衡之間的關(guān)系第26.納什均衡的應(yīng)用舉例庫(kù)諾特(cournot)寡頭競(jìng)爭(zhēng)模型可以說(shuō)是納什均衡最早的版本,它比納什本人的定義早了100多年。在庫(kù)諾特模型里,有兩個(gè)參與人,分別為企業(yè)1和企業(yè)2;每個(gè)企業(yè)的戰(zhàn)略是選擇產(chǎn)量;支付是利潤(rùn),它是兩個(gè)企業(yè)產(chǎn)量的函數(shù)。

第2講完全信息靜態(tài)博弈6.納什均衡的應(yīng)用舉例第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈納什均衡庫(kù)諾特模型的納什均衡第2講完全信息靜態(tài)博弈納什均衡庫(kù)諾特模型的納什均衡第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈7.混合戰(zhàn)略納什均衡我們將納什均衡定義為一組滿足所有參與人的效用最大化要求的戰(zhàn)略組合,即:第2講完全信息靜態(tài)博弈7.混合戰(zhàn)略納什均衡第2講完全信息靜態(tài)博弈例1:社會(huì)福利博弈。在這個(gè)博弈里,參與人是政府和一個(gè)流浪漢,流浪漢有兩個(gè)戰(zhàn)略:尋找工作或游蕩;政府也有兩個(gè)戰(zhàn)略:救濟(jì)和不救濟(jì)。政府想幫助流浪漢,但前提是后者必須試圖尋找工作,否則,前者不予幫助;而流浪漢只有在得不到政府救濟(jì)時(shí)才會(huì)尋找工作。第2講完全信息靜態(tài)博弈例1:社會(huì)福利博弈。在這個(gè)博弈里,參與人是政府和一個(gè)流浪漢,第2講完全信息靜態(tài)博弈3,2-1,3-1,10,0流浪漢政府不救濟(jì)救濟(jì)尋找工作游蕩社會(huì)福利博弈第2講完全信息靜態(tài)博弈3,2-1,3-1,10,0流浪漢政這個(gè)博弈不存在納什均衡。給定政府救濟(jì),流浪漢的最優(yōu)戰(zhàn)略是游蕩;給定流浪汗游蕩,政府的最優(yōu)戰(zhàn)略是不救濟(jì);給定政府不救濟(jì),流浪漢的最優(yōu)戰(zhàn)略是尋找工作;而給定流浪漢尋找工作,政府的最優(yōu)戰(zhàn)略是救濟(jì);如此等等,沒(méi)有一個(gè)戰(zhàn)略組合構(gòu)成納什均衡。第2講完全信息靜態(tài)博弈這個(gè)博弈不存在納什均衡。給定政府救濟(jì),流浪漢的最優(yōu)戰(zhàn)略是游蕩例2:猜謎游戲(matchingpennies)這個(gè)故事講的是,兩個(gè)兒童手里各拿著一枚硬幣,決定要顯示正面向上還是反面向上。如果兩枚硬幣同時(shí)正面向上或同時(shí)反面向上,兒童A付給兒童B1分錢;如果兩枚硬幣只有一枚正面向上,兒童B付給兒童A1分錢。這個(gè)博弈的支付矩陣如下:第2講完全信息靜態(tài)博弈例2:猜謎游戲(matchingpennies)這個(gè)故事講-1,11,-11,-1-1,1兒童B兒童A反面正面正面反面猜謎游戲第2講完全信息靜態(tài)博弈-1,11,-11,-1-1,1兒童B兒童A反面正面正面反面這個(gè)博弈事實(shí)上是一個(gè)零和博弈,一方所得即另一方所失,也沒(méi)有納什均衡。比如說(shuō),(正面,正面)不是納什均衡,因?yàn)榻o定B選擇正面,A的最優(yōu)戰(zhàn)略是反面;(反面,正面)也不是納什均衡,因?yàn)槿绻鸄選擇反面,B也將選擇反面。類似地,(正面,反面)和(反面,反面)都不是納什均衡。第2講完全信息靜態(tài)博弈這個(gè)博弈事實(shí)上是一個(gè)零和博弈,一方所得即另一方所失,也沒(méi)有納上述兩個(gè)博弈的顯著特征是,每一個(gè)參與人都想猜透對(duì)方的戰(zhàn)略,而每一個(gè)參與人又都不能讓對(duì)方猜透自己的戰(zhàn)略。這樣的問(wèn)題在諸如撲克比賽、橄欖球比賽、戰(zhàn)爭(zhēng)等情況中都會(huì)出現(xiàn)。在所有這類博弈中,都不存在納什均衡。但是,盡管上述兩個(gè)博弈不存在前面所定義的納什均衡,卻存在下面將要定義的混合戰(zhàn)略納什均衡。第2講完全信息靜態(tài)博弈上述兩個(gè)博弈的顯著特征是,每一個(gè)參與人都想猜透對(duì)方的戰(zhàn)略,而混合戰(zhàn)略納什均衡指的是參與人以一定的概率選擇某種戰(zhàn)略,比如說(shuō),參與人以0.3的概率選擇第1種戰(zhàn)略,以0.5的概率選擇第2種戰(zhàn)略,以0.2的概率選擇第3種戰(zhàn)略。如果一個(gè)參與人采取混合戰(zhàn)略,他的對(duì)手就不能準(zhǔn)確的猜出他實(shí)際上會(huì)選擇的戰(zhàn)略,盡管每個(gè)參與人都知道其他參與人不同戰(zhàn)略的概率分布。為了區(qū)分這種情況,我們將前面的納什均衡定義為“純”戰(zhàn)略納什均衡。第2講完全信息靜態(tài)博弈混合戰(zhàn)略納什均衡指的是參與人以一定的概率選擇某種戰(zhàn)略,比如說(shuō)考慮社會(huì)福利博弈的例子。設(shè)想政府以1/2的概率選擇救濟(jì),以1/2的概率選擇不救濟(jì)。那么,對(duì)流浪漢來(lái)說(shuō),選擇工作帶來(lái)的期望效用為:

1/2*2+1/2*1=1.5

選擇游蕩帶來(lái)的期望效用為:

1/2*3+1/2*0=1.5選擇任何混合戰(zhàn)略帶來(lái)的期望效用都是1.5,所以,流浪漢的任何一種戰(zhàn)略(純的或混合的)都是對(duì)政府所選擇的混合戰(zhàn)略的最優(yōu)反應(yīng)。第2講完全信息靜態(tài)博弈考慮社會(huì)福利博弈的例子。設(shè)想政府以1/2的概率選擇救濟(jì),以1第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈納什均衡要求每個(gè)參與人的混合戰(zhàn)略是給定對(duì)方的混合戰(zhàn)略下的最優(yōu)選擇。因此,在社會(huì)福利博弈中,是唯一的納什均衡。就是說(shuō),在均衡情況下,政府以0.5的概率選擇救濟(jì),以0.5的概率選擇不救濟(jì),流浪漢以0.2的概率選擇尋找工作,以0.8的概率選擇游蕩。這個(gè)結(jié)論也可以從反面來(lái)說(shuō)明確實(shí)是一個(gè)納什均衡。

第2講完全信息靜態(tài)博弈納什均衡要求每個(gè)參與人的混合戰(zhàn)略是給定對(duì)方的混合戰(zhàn)略下的最優(yōu)假定政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于0.2,那么,政府的唯一最優(yōu)的選擇是純戰(zhàn)略不救濟(jì);但如果政府以1的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟(jì)的戰(zhàn)略,流浪漢則選擇游蕩;如此等等。因此小于0.2不構(gòu)成納什均衡。類似地,假定政府認(rèn)為流浪漢尋找工作的概率嚴(yán)格大于0.2,那么政府的唯一最優(yōu)的選擇是純戰(zhàn)略救濟(jì);但如果政府以1的概率選擇救濟(jì),流浪漢的最優(yōu)選擇是游蕩,因此,大于0.2也不構(gòu)成納什均衡。第2講完全信息靜態(tài)博弈假定政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于0.2,那么,政上述混合戰(zhàn)略也可以用幾何圖形來(lái)表示。但參與人選擇均和戰(zhàn)略時(shí),他選擇任何一個(gè)純戰(zhàn)略的概率在0與1之間是連續(xù)的?,F(xiàn)在,我們用反應(yīng)對(duì)應(yīng)(reactioncorrespondent)的概念來(lái)描述一個(gè)參與人對(duì)應(yīng)于其他參與人混合戰(zhàn)略的最優(yōu)選擇。和反應(yīng)函數(shù)的區(qū)別是:反應(yīng)函數(shù)表示的是一個(gè)參與人只有一個(gè)特定的戰(zhàn)略是其他人給定戰(zhàn)略的最優(yōu)選擇,而反應(yīng)對(duì)應(yīng)允許一個(gè)參與人有多個(gè)(甚至無(wú)窮多個(gè))戰(zhàn)略是其他人給定戰(zhàn)略的最優(yōu)選擇。政府和流浪漢的的反應(yīng)對(duì)應(yīng)分別為:第2講完全信息靜態(tài)博弈上述混合戰(zhàn)略也可以用幾何圖形來(lái)表示。但參與人選擇均和戰(zhàn)略時(shí),第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈在下圖中,畫出政府和流浪漢的反應(yīng)曲線,兩條反應(yīng)曲線的交叉點(diǎn)就是納什均衡點(diǎn)。第2講完全信息靜態(tài)博弈NE10.20.51在下圖中,畫出政府和流浪漢的反應(yīng)曲線,兩條反應(yīng)曲線的交叉點(diǎn)就結(jié)論:一個(gè)參與人選擇不同的純戰(zhàn)略的概率分布不是由他自己的支付決定的,而是由他的對(duì)手的支付決定的。由于這個(gè)原因,許多人認(rèn)為混合戰(zhàn)略納什均衡是一個(gè)難以令人滿意的概念。既然參與人在構(gòu)成混合戰(zhàn)略的不同純戰(zhàn)略之間是無(wú)差異的,他為什么不選擇一個(gè)特定的純戰(zhàn)略而要以特定的概率隨機(jī)地選擇不同的純戰(zhàn)略呢?原因是一個(gè)參與人選擇混合戰(zhàn)略的目的是給其他第2講完全信息靜態(tài)博弈結(jié)論:一個(gè)參與人選擇不同的純戰(zhàn)略的概率分布不是由他自己的支付參與人造成不確定性,這樣,盡管其他參與人知道他選擇某個(gè)特定純戰(zhàn)略的概率是多少,但他并不能猜透他實(shí)際上會(huì)選擇哪個(gè)純戰(zhàn)略。如果某個(gè)參與人嚴(yán)格偏好某個(gè)特定的純戰(zhàn)略,他的行為就會(huì)被其他參與人準(zhǔn)確地猜透,就不會(huì)有混合戰(zhàn)略的出現(xiàn)。盡管混合戰(zhàn)略不像純戰(zhàn)略那樣直觀,但它確實(shí)是一些博弈中參與人的合理行為方式,撲克比賽、劃拳等例子,參加者總是隨機(jī)行動(dòng)以使自己的行為不被對(duì)手所預(yù)測(cè)。第2講完全信息靜態(tài)博弈參與人造成不確定性,這樣,盡管其他參與人知道他選擇某個(gè)特定純海薩尼對(duì)混合均衡的解釋是,混合戰(zhàn)略均衡等價(jià)于不完全信息下的純戰(zhàn)略均衡。在社會(huì)福利博弈中,假定有兩類特征的流浪漢,一類選擇尋找工作,另一類選擇游蕩;每個(gè)流浪漢都知道自己的特征,但政府不知道流浪漢的特征,只知道一個(gè)流浪漢有20%的概率屬于第一類,有80%的概率屬于第二類。在這種情況下,政府在選擇自己的戰(zhàn)略時(shí)似乎面臨的是一位選擇混合戰(zhàn)略的流浪漢。經(jīng)濟(jì)學(xué)上的監(jiān)督博弈也是屬于這樣的例子。第2講完全信息靜態(tài)博弈海薩尼對(duì)混合均衡的解釋是,混合戰(zhàn)略均衡等價(jià)于不完全信息下的純監(jiān)督博弈是猜謎游戲的變種,他概括了諸如稅收檢查、質(zhì)量檢查、懲治犯罪、雇主監(jiān)督雇員等這樣一類情況。以稅收檢查為例,這個(gè)博弈的參與人包括稅收機(jī)關(guān)和納稅人。稅收機(jī)關(guān)的純戰(zhàn)略是檢查或不檢查,納稅人的純戰(zhàn)略是逃稅或不逃稅。下面是支付矩陣。第2講完全信息靜態(tài)博弈監(jiān)督博弈是猜謎游戲的變種,他概括了諸如稅收檢查、質(zhì)量檢查、懲第2講完全信息靜態(tài)博弈a-C+F,-a-Fa-C,-a0,0a,-a納稅人稅收機(jī)關(guān)不檢查檢查逃稅不逃稅稅收監(jiān)督博弈a:應(yīng)納稅款C:檢查成本F:是罰款假定:C<a+F第2講完全信息靜態(tài)博弈a-C+F,-a-Fa-C,-a0,第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈監(jiān)督博弈的納什均衡與應(yīng)納稅款a、對(duì)逃稅的懲罰F、以及檢查成本C有關(guān)。對(duì)逃稅的懲罰越重,應(yīng)納稅款越多,納稅人逃稅的概率就越?。粰z查成本越高,納稅人逃稅的概率越大。第2講完全信息靜態(tài)博弈監(jiān)督博弈的納什均衡與應(yīng)納稅款a、對(duì)逃稅的懲罰F、以及檢查成本前面討論的是不存在純戰(zhàn)略納什均衡但存在混合戰(zhàn)略納什均衡的博弈。有些博弈既存在純戰(zhàn)略均衡,也存在混合戰(zhàn)略均衡。所謂“性別站”就是這樣一個(gè)博弈。性別戰(zhàn)說(shuō)的是,一男一女約會(huì),或者看足球比賽,或者芭蕾舞演出,男的偏好足球,女的偏好芭蕾舞,但他們都寧愿在一起而不愿分開(kāi)。下面是支付矩陣。第2講完全信息靜態(tài)博弈前面討論的是不存在純戰(zhàn)略納什均衡但存在混合戰(zhàn)略納什均衡的博弈第2講完全信息靜態(tài)博弈2,10,00,01,2女男芭蕾足球足球芭蕾性別戰(zhàn)第2講完全信息靜態(tài)博弈2,10,00,01,2女男芭蕾足球這個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡:(足球,足球),(芭蕾,芭蕾)。事實(shí)上,這個(gè)博弈還有一個(gè)混合戰(zhàn)略納什均衡,這就是:男的以2/3的概率選擇足球賽,以1/3的概率選擇芭蕾舞;女的以1/3的概率選擇足球賽,以2/3的概率選擇芭蕾舞。類似性別戰(zhàn)這種存在兩個(gè)純戰(zhàn)略納什均衡和一個(gè)混合戰(zhàn)略納什均衡的博弈例子還有斗雞博弈、商場(chǎng)消耗戰(zhàn)博弈等。第2講完全信息靜態(tài)博弈這個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡:(足球,足球),(芭蕾,芭蕾)8.不同均衡概念之間的關(guān)系第2講完全信息靜態(tài)博弈占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡純戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡8.不同均衡概念之間的關(guān)系第2講完全信息靜態(tài)博弈占優(yōu)均衡重9.納什均衡多重性有時(shí)候博弈可能有多個(gè)均衡,如性別戰(zhàn)博弈有三個(gè)納什均衡。事實(shí)上,許多博弈都存在多個(gè)納什均衡,有些博弈甚至有無(wú)窮多個(gè)納什均衡??紤]兩個(gè)人分一塊蛋糕,每個(gè)人獨(dú)立提出自己的要求的份額,設(shè)x1為第一個(gè)人要求的份額,x2為第二個(gè)人要求的份額。如果x1+x2<=1,每個(gè)人都得到自己要求的份額;否則誰(shuí)也得不到什么。在這個(gè)博弈中,任何滿足x1+x2=1的(x1,x2)都是納什均衡,因而這個(gè)博弈有無(wú)窮多個(gè)納什均衡。第2講完全信息靜態(tài)博弈9.納什均衡多重性第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈x1x211曲線上的任何點(diǎn)都是納什均衡第2講完全信息靜態(tài)博弈x1x211曲線上的任何點(diǎn)都是納什均博弈分析的目的是預(yù)測(cè)參與人的合理行為方式。納什均衡是參與人如何博弈的一致性預(yù)測(cè):如果所有參與人預(yù)測(cè)一個(gè)特定的納什均衡將出現(xiàn),那么,沒(méi)有人有積極性選擇非納什均衡的戰(zhàn)略,這個(gè)納什均衡就會(huì)實(shí)際出現(xiàn)。但當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí),要所有參與人預(yù)測(cè)同一個(gè)納什均衡會(huì)出現(xiàn)是非常困難的。在這種情況下,盡管所有參與人都預(yù)測(cè)納什均衡會(huì)出現(xiàn),但如果不同參與人預(yù)測(cè)的不是同一個(gè)納什均衡,實(shí)際出現(xiàn)的就不是納什均衡,而是非納什均衡。第2講完全信息靜態(tài)博弈博弈分析的目的是預(yù)測(cè)參與人的合理行為方式。納什均衡是參與人如比如說(shuō),在“性別戰(zhàn)”中,如果男的預(yù)期的是(足球,足球),而女的預(yù)期的是(芭蕾,芭蕾),實(shí)際出現(xiàn)的就是(足球,芭蕾)。在分蛋糕的博弈中,如果第一個(gè)參與人預(yù)期x2=0.4,第二個(gè)參與人預(yù)期是x1=0.5,那么第一個(gè)參與人會(huì)選擇x1=0.6,第二個(gè)參與人選擇x2=0.5,x1+x2=1.1>1,誰(shuí)也得不到什么,這是一個(gè)非納什均衡結(jié)果。第2講完全信息靜態(tài)博弈比如說(shuō),在“性別戰(zhàn)”中,如果男的預(yù)期的是(足球,足球),而女所以,應(yīng)該強(qiáng)調(diào)的是,非納什均衡結(jié)果之所以出現(xiàn),是因?yàn)閰⑴c人在預(yù)測(cè)上犯了錯(cuò)誤,而不是因?yàn)閰⑴c人預(yù)測(cè)這個(gè)非納什均衡結(jié)果會(huì)出現(xiàn)。正是這個(gè)意義上,我們說(shuō)只有納什均衡是一致性預(yù)期,任何非納什均衡都不可能成為一致性預(yù)期。第2講完全信息靜態(tài)博弈所以,應(yīng)該強(qiáng)調(diào)的是,非納什均衡結(jié)果之所以出現(xiàn),是因?yàn)閰⑴c人在當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí),博弈論并沒(méi)有一個(gè)一般的理論證明納什均衡結(jié)果一定會(huì)出現(xiàn)。在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來(lái)達(dá)到一個(gè)“聚點(diǎn)”均衡(focalpoint)這個(gè)信息可能與社會(huì)文化習(xí)慣、參與人過(guò)去博弈的歷史等有關(guān)。比如說(shuō),在性別戰(zhàn)博弈中,如果今天是男的生日,(足球,足球)可能是一個(gè)聚點(diǎn)均衡,而如果是女的生日,(芭蕾,芭蕾)可能是一個(gè)聚點(diǎn)均衡第2講完全信息靜態(tài)博弈當(dāng)一個(gè)博弈有多個(gè)納什均衡時(shí),博弈論并沒(méi)有一個(gè)一般的理論證明納保證一個(gè)納什均衡出現(xiàn)的另一種方法是參與人在博弈開(kāi)始之前進(jìn)行不花成本的“廉價(jià)磋商”(cheaptalk)。盡管我們無(wú)法保證磋商會(huì)達(dá)成一個(gè)協(xié)議,即使達(dá)成協(xié)議也不一定會(huì)被遵守,但在一些博弈中,事前磋商確實(shí)可以使某些納什均衡實(shí)際上出現(xiàn)。第2講完全信息靜態(tài)博弈保證一個(gè)納什均衡出現(xiàn)的另一種方法是參與人在博弈開(kāi)始之前進(jìn)行不10.相關(guān)均衡納什均衡假定每個(gè)參與人獨(dú)立行動(dòng)。奧蒙提出了“相關(guān)均衡”(correlatedequilbrium)的概念。他證明,如果參與人可以根據(jù)某個(gè)共同預(yù)測(cè)的到信號(hào)選擇行動(dòng),就可能出現(xiàn)“相關(guān)均衡”;相關(guān)均衡可以使所有參與人受益,相關(guān)均衡可能是參與人事前磋商的結(jié)果。第2講完全信息靜態(tài)博弈10.相關(guān)均衡第2講完全信息靜態(tài)博弈設(shè)想A、B兩個(gè)參與人在博弈的前一天相遇,雙方同意根據(jù)天氣的狀況選擇行動(dòng),比如說(shuō),“如果明天是晴天,A選擇U,B選擇L;如果明天是陰天,A選擇D,B選擇R”,然后兩人分開(kāi),到第二天每人根據(jù)天氣情況選擇自己的戰(zhàn)略。這樣,通過(guò)天氣變化的信號(hào),兩個(gè)人的選擇相關(guān)了。更為重要的是,奧蒙證明,如果每個(gè)人收到不同但相關(guān)的信號(hào),每個(gè)人都可以得到更高的期望效用。第2講完全信息靜態(tài)博弈設(shè)想A、B兩個(gè)參與人在博弈的前一天相遇,雙方同意根據(jù)天氣的狀1.下表是兩人博弈的戰(zhàn)略式表述,其中U和D是參與人1的戰(zhàn)略空間,L和R是參與人2的戰(zhàn)略空間。練習(xí)題a,bc,de,fg,hDULR1.下表是兩人博弈的戰(zhàn)略式表述,其中U和D是參與人1的戰(zhàn)略空

(1)準(zhǔn)確地定義上述博弈的占優(yōu)戰(zhàn)略均衡和納什均衡;(2)當(dāng)a,b,c,d,e,f,g,h之間滿足什么條件時(shí),上述博弈存在:(a)占優(yōu)戰(zhàn)略均衡,(b)重復(fù)剔除的占優(yōu)均衡。練習(xí)題(1)準(zhǔn)確地定義上述博弈的占優(yōu)戰(zhàn)略均衡和納什均衡;練習(xí)題2.在下表所示的戰(zhàn)略式表述博弈中,找出重復(fù)剔除的占優(yōu)均衡。練習(xí)題4,35,16,22,18,43,63,09,62,8LRUMDM2.在下表所示的戰(zhàn)略式表述博弈中,找出重復(fù)剔除的占優(yōu)均衡。練在這一講,我們集中討論完全信息靜態(tài)博弈?!巴耆畔ⅰ敝傅氖敲總€(gè)參與人對(duì)所有其他參與人的特征(包括戰(zhàn)略空間、支付函數(shù)等)有完全的了解。“靜態(tài)”指的是所有參與人同時(shí)選擇行動(dòng)且只選擇一次?!巴瑫r(shí)行動(dòng)”是一個(gè)信息概念而非日歷上的時(shí)間概念:只要每個(gè)參與人在選擇自己的行動(dòng)時(shí)不知道其他參與人的選擇,我們就說(shuō)他們?cè)谕瑫r(shí)行動(dòng)。第2講完全信息靜態(tài)博弈在這一講,我們集中討論完全信息靜態(tài)博弈。第2講完全信息靜態(tài)完全信息靜態(tài)博弈是一種最簡(jiǎn)單的博弈,在這種博弈中,由于每個(gè)人是在不知道其他人行動(dòng)的情況下選擇自己的行動(dòng),戰(zhàn)略和行動(dòng)實(shí)際上是一回事。博弈分析的目的是預(yù)測(cè)博弈的均衡結(jié)果,即給定每個(gè)參與人是理性的(rational),每個(gè)參與人都知道每個(gè)參與人都是理性的,什么是每個(gè)參與人的最優(yōu)戰(zhàn)略?什么是所有參與人的最優(yōu)戰(zhàn)略組合?納什均衡是完全信息博弈解的一般概念,也是所有其他類型博弈解的基本要求。第2講完全信息靜態(tài)博弈完全信息靜態(tài)博弈是一種最簡(jiǎn)單的博弈,在這種博弈中,由于每個(gè)人1.納什均衡納什對(duì)博弈論的貢獻(xiàn)有兩個(gè)方面:一是合作博弈理論中的討價(jià)還價(jià)模型,稱為納什討價(jià)還價(jià)解(Nashbargainingsolution);二是非合作博弈論方面,這是他的主要貢獻(xiàn)所在。納什對(duì)非合作博弈的主要貢獻(xiàn)是他在1950年和1951年的兩篇論文中在非常一般意義上定義了非合作博弈及其均衡解,并證明了均衡解的存在。這樣就奠定了非合作博弈論的基礎(chǔ)。納什所定義的均衡稱為“納什均衡”,它如同瓦爾拉斯均衡一樣,已成為經(jīng)濟(jì)學(xué)中的專家術(shù)語(yǔ)。第2講完全信息靜態(tài)博弈1.納什均衡第2講完全信息靜態(tài)博弈2.占優(yōu)戰(zhàn)略均衡一個(gè)著名的例子:“囚徒困境”。“囚徒困境”的故事講的是:兩個(gè)嫌疑犯作案后被警察抓住,被分別關(guān)在不同的房間里受審訊警察知道兩個(gè)人有罪,但缺乏足夠的證明定罪,除非兩人當(dāng)中至少有一個(gè)人坦白。警察告訴每個(gè)人:如果兩人都不承認(rèn),每人都以輕微的犯罪判刑1年;如果兩人都坦白,各判刑8年;如果兩人中一個(gè)人坦白而另一個(gè)人抵賴,坦白的釋放出去,抵賴的判刑10年。第2講完全信息靜態(tài)博弈2.占優(yōu)戰(zhàn)略均衡第2講完全信息靜態(tài)博弈

這樣,每個(gè)嫌疑犯面臨四個(gè)可能的結(jié)果:第2講完全信息靜態(tài)博弈-8,-80,-10-10,0-1,-1囚犯B囚犯A坦白不坦白坦白不坦白囚徒困境這樣,每個(gè)嫌疑犯面臨四個(gè)可能的結(jié)果:第2講完全信息靜態(tài)在這個(gè)博弈中,每個(gè)囚徒都有兩種可選擇的戰(zhàn)略:坦白或抵賴。不論同伙選擇什么戰(zhàn)略,每個(gè)囚徒的最優(yōu)戰(zhàn)略是“坦白”,比如說(shuō),如果B選擇坦白,A選擇坦白時(shí)的支付為-8,選擇抵賴時(shí)的支付為-10,因而坦白比抵賴好;如果B選擇抵賴,A坦白時(shí)的支付為0,抵賴時(shí)的支付為-1,因而坦白還是比抵賴好。就是說(shuō),“坦白”是囚徒A的占優(yōu)戰(zhàn)略。類似地,“坦白”也是B的占優(yōu)戰(zhàn)略。第2講完全信息靜態(tài)博弈在這個(gè)博弈中,每個(gè)囚徒都有兩種可選擇的戰(zhàn)略:坦白或抵賴。第2

一般來(lái)說(shuō),由于每個(gè)人參與人的效用(支付)是博弈中所有參與人的戰(zhàn)略的函數(shù),因此每個(gè)參與人的最優(yōu)戰(zhàn)略選擇依賴于所有其他人的戰(zhàn)略選擇。但在一些特殊博弈中,一個(gè)參與人的最優(yōu)戰(zhàn)略可能并不依賴于其他參與人的戰(zhàn)略選擇,就是說(shuō),不論其他參與人選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是惟一的,這樣的戰(zhàn)略稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)第2講完全信息靜態(tài)博弈一般來(lái)說(shuō),由于每個(gè)人參與人的效用(支付)是博弈中所有參與第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈在一個(gè)博弈里,如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么,占優(yōu)戰(zhàn)略均衡是可以預(yù)測(cè)的到惟一的均衡,因?yàn)闆](méi)有一個(gè)理性的參與人會(huì)選擇劣戰(zhàn)略。在囚徒困境博弈里,(坦白,坦白)是占優(yōu)戰(zhàn)略均衡;在房地產(chǎn)開(kāi)發(fā)博弈里,如果市場(chǎng)需求是大的,(開(kāi)發(fā),開(kāi)發(fā))是占優(yōu)戰(zhàn)略均衡。注意:占優(yōu)戰(zhàn)略均衡只要求每個(gè)參與人是理性的,而不要求每個(gè)參與人知道其他參與人是理性的(也就是說(shuō),不要求“理性”是共同知識(shí)),這是因?yàn)?,不論其他參與人是否是理性的,占優(yōu)戰(zhàn)略總是一個(gè)理性人的最優(yōu)選擇。第2講完全信息靜態(tài)博弈在一個(gè)博弈里,如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么,占優(yōu)戰(zhàn)略囚徒困境反映了一個(gè)深刻的問(wèn)題,即個(gè)人理性和集體理性的沖突。如果每個(gè)人都選擇抵賴,各判刑1年,顯然比都判刑8年好。但這個(gè)帕累托改進(jìn)做不到,因?yàn)樗粷M足個(gè)人理性要求,(抵賴,抵賴)不是一個(gè)均衡。換個(gè)角度看,即使兩個(gè)囚徒在作案之前建立攻守同盟(絕不坦白),這個(gè)攻守同盟也沒(méi)有用,因?yàn)闆](méi)有人有積極性遵守協(xié)定。這就是合作博弈和非合作博弈的區(qū)別。第2講完全信息靜態(tài)博弈囚徒困境反映了一個(gè)深刻的問(wèn)題,即個(gè)人理性和集體理性的沖突。第囚徒困境在經(jīng)濟(jì)學(xué)上有著廣泛的應(yīng)用。例1:兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈。如果兩個(gè)企業(yè)聯(lián)合起來(lái)形成卡特爾,選擇壟斷利潤(rùn)最大化的產(chǎn)量,每個(gè)企業(yè)都可以得到更多的利潤(rùn)。但卡特爾不是一個(gè)穩(wěn)定的均衡,因?yàn)榻o定對(duì)方遵守協(xié)議的情況下,每個(gè)企業(yè)都想增加生產(chǎn),結(jié)果是,每個(gè)企業(yè)都只得到小于最大利潤(rùn)的產(chǎn)量,利潤(rùn)嚴(yán)格小于卡特爾產(chǎn)量下的利潤(rùn)。在有些情況下,個(gè)人理性和集體理性的沖突對(duì)社會(huì)來(lái)說(shuō)也許是一件好事,盡管對(duì)集體而言是一件壞事。第2講完全信息靜態(tài)博弈囚徒困境在經(jīng)濟(jì)學(xué)上有著廣泛的應(yīng)用。第2講完全信息靜態(tài)博弈例2:公共產(chǎn)品的供給也是一個(gè)囚徒困境問(wèn)題。

如果大家都出錢興辦公共事業(yè),所有人的福利都會(huì)增加。問(wèn)題是,如果我出錢你不出錢,我得不償失,而如果你出錢我不出錢,我就可以占你的便宜。所以,每個(gè)人的最優(yōu)戰(zhàn)略是“不出錢”,這種情況下,使得所有人的福利都得不到提高。例3:“軍備競(jìng)賽”。例4:經(jīng)濟(jì)改革本身也可能是這樣,在許多改革中,改革要付出成本(包括風(fēng)險(xiǎn)),而改革的成果大家共享,結(jié)果是:盡管人人都認(rèn)為改革好,卻沒(méi)有人真正去改革,大家只好在都不滿意的體第2講完全信息靜態(tài)博弈例2:公共產(chǎn)品的供給也是一個(gè)囚徒困境問(wèn)題。第2講完全信息靜

下繼續(xù)生活下去。

從囚徒困境中,我們可以引出一個(gè)很重要的結(jié)論:一種制度(體制)安排,要發(fā)生效力,必須是一種均衡。否則,這種制度安排不能成立。第2講完全信息靜態(tài)博弈下繼續(xù)生活下去。第2講完全信息靜態(tài)博弈3.重復(fù)剔除的占優(yōu)均衡在每個(gè)參與人都有占優(yōu)戰(zhàn)略的情況下,占優(yōu)戰(zhàn)略均衡是一個(gè)非常合理的預(yù)測(cè),但在絕大數(shù)博弈中,占優(yōu)戰(zhàn)略均衡是不存在的。第2講完全信息靜態(tài)博弈3.重復(fù)剔除的占優(yōu)均衡第2講完全信息靜態(tài)博弈“智豬博弈”這個(gè)例子講的是,豬圈里圈著兩頭豬,一頭大豬,一頭小豬,豬圈的一頭有一個(gè)豬食槽,另一頭安裝著一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕,8個(gè)單位的豬食進(jìn)槽,但需要支付兩個(gè)單位的成本。若大豬先到,大豬吃到7個(gè)單位,小豬只能吃到1個(gè)單位;若小豬先到,大豬和小豬各吃到4個(gè)單位;若兩豬同時(shí)到,大豬吃到5個(gè)單位,小豬吃到3個(gè)單位。第2講完全信息靜態(tài)博弈“智豬博弈”第2講完全信息靜態(tài)博弈這里,每頭豬都有兩種戰(zhàn)略:按或等待。第2講完全信息靜態(tài)博弈3,12,47,-10,0按等待按等待小豬大豬這里,每頭豬都有兩種戰(zhàn)略:按或等待。第2講完全信息靜態(tài)博弈顯然,這個(gè)博弈沒(méi)有占優(yōu)戰(zhàn)略均衡,因?yàn)楸M管“等待”是小豬的占優(yōu)戰(zhàn)略,但大豬沒(méi)有占有戰(zhàn)略。大豬的戰(zhàn)略依賴于小豬的戰(zhàn)略:如果小豬選擇“等待”,大豬的最優(yōu)的戰(zhàn)略式“按”,反之,如果小豬選擇“按”,大豬的最優(yōu)戰(zhàn)略是“等待”。因此,我們不能應(yīng)用占優(yōu)戰(zhàn)略找出均衡。那么,什么是這個(gè)博弈的可能的均衡解呢?第2講完全信息靜態(tài)博弈顯然,這個(gè)博弈沒(méi)有占優(yōu)戰(zhàn)略均衡,因?yàn)楸M管“等待”是小豬的占優(yōu)在找出上述“智豬博弈”的均衡解時(shí),實(shí)際上是應(yīng)用了“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”(interatedeliminationofstrictlydominatedstrategies)的思路,這個(gè)思路是這樣的:首先找出某個(gè)參與人的劣戰(zhàn)略(假定存在),把這個(gè)劣戰(zhàn)略剔除掉,重新構(gòu)造一個(gè)不包含已剔除戰(zhàn)略的新的博弈;然后再剔除這個(gè)新的博弈的某個(gè)參與人的劣戰(zhàn)略;繼續(xù)這個(gè)過(guò)程,一直到只剩下一個(gè)唯一的戰(zhàn)略組合為止。這個(gè)唯一剩下的戰(zhàn)略組合就是這個(gè)博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡。

(interateddominancestrategies)第2講完全信息靜態(tài)博弈在找出上述“智豬博弈”的均衡解時(shí),實(shí)際上是應(yīng)用了“重復(fù)剔除嚴(yán)在“智豬博弈”中,我們先剔除掉小豬的劣戰(zhàn)略“按”,在剔除掉這個(gè)戰(zhàn)略后的新的博弈中,小豬只有一個(gè)戰(zhàn)略“等待”,大豬仍有兩個(gè)戰(zhàn)略,但此時(shí),“等待”已成為大豬的劣戰(zhàn)略,提出這個(gè)戰(zhàn)略,剩下的唯一戰(zhàn)略組合是(按,等待)。第2講完全信息靜態(tài)博弈在“智豬博弈”中,我們先剔除掉小豬的劣戰(zhàn)略“按”,在剔除掉這我們需要對(duì)“占優(yōu)戰(zhàn)略”和“劣戰(zhàn)略”的概念進(jìn)行重新定義。第2講完全信息靜態(tài)博弈我們需要對(duì)“占優(yōu)戰(zhàn)略”和“劣戰(zhàn)略”的概念進(jìn)行重新定義。第2講第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈與占優(yōu)戰(zhàn)略均衡不同的是,重復(fù)剔除的占優(yōu)均衡不僅要求每個(gè)參與人是理性的,而且要求“理性”是參與人的共同知識(shí),即所有參與人知道所有參與人是理性的,所有參與人知道所有參與人知道所有參與人是理性的,如此等等。第2講完全信息靜態(tài)博弈與占優(yōu)戰(zhàn)略均衡不同的是,重復(fù)剔除的占應(yīng)用例子:(1)股份公司中的大股東和小股東。(2)股票市場(chǎng)上大戶和小戶。(3)市場(chǎng)競(jìng)爭(zhēng)中大企業(yè)和小企業(yè)之間的關(guān)系。第2講完全信息靜態(tài)博弈應(yīng)用例子:第2講完全信息靜態(tài)博弈4.納什均衡把理性作為共同知識(shí)的要求并不是重復(fù)剔除的占優(yōu)均衡的唯一問(wèn)題。更為嚴(yán)重的問(wèn)題是,對(duì)于相當(dāng)多的博弈,我們無(wú)法使用重復(fù)剔除劣戰(zhàn)略的辦法找出均衡。比如,在房地產(chǎn)開(kāi)發(fā)博弈中,假定市場(chǎng)是低需求的情況,那么,無(wú)論對(duì)于A還是B,沒(méi)有任何一種戰(zhàn)略優(yōu)于另一種戰(zhàn)略,每一個(gè)參與人的最優(yōu)戰(zhàn)略都依賴于另一個(gè)參與人的戰(zhàn)略:如果B選擇開(kāi)發(fā),A的最優(yōu)戰(zhàn)略是不開(kāi)發(fā),如果B選擇不開(kāi)發(fā),A的最第2講完全信息靜態(tài)博弈4.納什均衡第2講完全信息靜態(tài)博弈

優(yōu)戰(zhàn)略是開(kāi)發(fā)。為了找出這個(gè)博弈的均衡解,我們需要引入納什均衡。納什均衡是完全信息靜態(tài)博弈解的一般概念,構(gòu)成納什均衡的戰(zhàn)略一定是重復(fù)剔除嚴(yán)格劣戰(zhàn)略過(guò)程中不能被剔除的戰(zhàn)略。就是說(shuō),沒(méi)有任何一個(gè)戰(zhàn)略嚴(yán)格優(yōu)于納什均衡戰(zhàn)略,逆定理不一定成立;更為重要的是許多不存在占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡的博弈,卻存在納什均衡。第2講完全信息靜態(tài)博弈優(yōu)戰(zhàn)略是開(kāi)發(fā)。為了找出這個(gè)博弈的均衡解,我們需要引入納第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈

運(yùn)用上述定義來(lái)檢查一個(gè)特定的戰(zhàn)略組合是否是一個(gè)納什均衡。在囚徒困境里,(坦白,坦白)是一個(gè)納什均衡。在房地產(chǎn)開(kāi)發(fā)博弈中,如果是高需求,(開(kāi)發(fā),開(kāi)發(fā))是一個(gè)納什均衡;如果是低需求,(開(kāi)發(fā),不開(kāi)發(fā))是一個(gè)納什均衡,(不開(kāi)發(fā),開(kāi)發(fā))也是一個(gè)納什均衡,而(開(kāi)發(fā),開(kāi)發(fā))和(不開(kāi)發(fā),不開(kāi)發(fā))都不是納什均衡。第2講完全信息靜態(tài)博弈運(yùn)用上述定義來(lái)檢查一個(gè)特定的戰(zhàn)略組合是否是一個(gè)納什均衡

納什均衡有強(qiáng)弱之分,上述定義給出的是弱納什均衡的概念。一個(gè)納什均衡是強(qiáng)的(strictorstrong),如果給定其他參與人的戰(zhàn)略,每一個(gè)參與人的最優(yōu)選擇是唯一的。就是說(shuō),第2講完全信息靜態(tài)博弈納什均衡有強(qiáng)弱之分,上述定義給出的是弱納什均衡的概念。5.納什均衡、占優(yōu)戰(zhàn)略均衡和重復(fù)剔除的占優(yōu)均衡之間的關(guān)系(1)每一個(gè)占優(yōu)戰(zhàn)略均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡。(2)納什均衡一定是在重復(fù)剔除嚴(yán)格劣戰(zhàn)略過(guò)程中沒(méi)有被剔除掉的戰(zhàn)略組合,但沒(méi)有被剔除掉的戰(zhàn)略組合不一定是納什均衡。第2講完全信息靜態(tài)博弈5.納什均衡、占優(yōu)戰(zhàn)略均衡和重復(fù)剔除的占優(yōu)均衡之間的關(guān)系第26.納什均衡的應(yīng)用舉例庫(kù)諾特(cournot)寡頭競(jìng)爭(zhēng)模型可以說(shuō)是納什均衡最早的版本,它比納什本人的定義早了100多年。在庫(kù)諾特模型里,有兩個(gè)參與人,分別為企業(yè)1和企業(yè)2;每個(gè)企業(yè)的戰(zhàn)略是選擇產(chǎn)量;支付是利潤(rùn),它是兩個(gè)企業(yè)產(chǎn)量的函數(shù)。

第2講完全信息靜態(tài)博弈6.納什均衡的應(yīng)用舉例第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈納什均衡庫(kù)諾特模型的納什均衡第2講完全信息靜態(tài)博弈納什均衡庫(kù)諾特模型的納什均衡第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈7.混合戰(zhàn)略納什均衡我們將納什均衡定義為一組滿足所有參與人的效用最大化要求的戰(zhàn)略組合,即:第2講完全信息靜態(tài)博弈7.混合戰(zhàn)略納什均衡第2講完全信息靜態(tài)博弈例1:社會(huì)福利博弈。在這個(gè)博弈里,參與人是政府和一個(gè)流浪漢,流浪漢有兩個(gè)戰(zhàn)略:尋找工作或游蕩;政府也有兩個(gè)戰(zhàn)略:救濟(jì)和不救濟(jì)。政府想幫助流浪漢,但前提是后者必須試圖尋找工作,否則,前者不予幫助;而流浪漢只有在得不到政府救濟(jì)時(shí)才會(huì)尋找工作。第2講完全信息靜態(tài)博弈例1:社會(huì)福利博弈。在這個(gè)博弈里,參與人是政府和一個(gè)流浪漢,第2講完全信息靜態(tài)博弈3,2-1,3-1,10,0流浪漢政府不救濟(jì)救濟(jì)尋找工作游蕩社會(huì)福利博弈第2講完全信息靜態(tài)博弈3,2-1,3-1,10,0流浪漢政這個(gè)博弈不存在納什均衡。給定政府救濟(jì),流浪漢的最優(yōu)戰(zhàn)略是游蕩;給定流浪汗游蕩,政府的最優(yōu)戰(zhàn)略是不救濟(jì);給定政府不救濟(jì),流浪漢的最優(yōu)戰(zhàn)略是尋找工作;而給定流浪漢尋找工作,政府的最優(yōu)戰(zhàn)略是救濟(jì);如此等等,沒(méi)有一個(gè)戰(zhàn)略組合構(gòu)成納什均衡。第2講完全信息靜態(tài)博弈這個(gè)博弈不存在納什均衡。給定政府救濟(jì),流浪漢的最優(yōu)戰(zhàn)略是游蕩例2:猜謎游戲(matchingpennies)這個(gè)故事講的是,兩個(gè)兒童手里各拿著一枚硬幣,決定要顯示正面向上還是反面向上。如果兩枚硬幣同時(shí)正面向上或同時(shí)反面向上,兒童A付給兒童B1分錢;如果兩枚硬幣只有一枚正面向上,兒童B付給兒童A1分錢。這個(gè)博弈的支付矩陣如下:第2講完全信息靜態(tài)博弈例2:猜謎游戲(matchingpennies)這個(gè)故事講-1,11,-11,-1-1,1兒童B兒童A反面正面正面反面猜謎游戲第2講完全信息靜態(tài)博弈-1,11,-11,-1-1,1兒童B兒童A反面正面正面反面這個(gè)博弈事實(shí)上是一個(gè)零和博弈,一方所得即另一方所失,也沒(méi)有納什均衡。比如說(shuō),(正面,正面)不是納什均衡,因?yàn)榻o定B選擇正面,A的最優(yōu)戰(zhàn)略是反面;(反面,正面)也不是納什均衡,因?yàn)槿绻鸄選擇反面,B也將選擇反面。類似地,(正面,反面)和(反面,反面)都不是納什均衡。第2講完全信息靜態(tài)博弈這個(gè)博弈事實(shí)上是一個(gè)零和博弈,一方所得即另一方所失,也沒(méi)有納上述兩個(gè)博弈的顯著特征是,每一個(gè)參與人都想猜透對(duì)方的戰(zhàn)略,而每一個(gè)參與人又都不能讓對(duì)方猜透自己的戰(zhàn)略。這樣的問(wèn)題在諸如撲克比賽、橄欖球比賽、戰(zhàn)爭(zhēng)等情況中都會(huì)出現(xiàn)。在所有這類博弈中,都不存在納什均衡。但是,盡管上述兩個(gè)博弈不存在前面所定義的納什均衡,卻存在下面將要定義的混合戰(zhàn)略納什均衡。第2講完全信息靜態(tài)博弈上述兩個(gè)博弈的顯著特征是,每一個(gè)參與人都想猜透對(duì)方的戰(zhàn)略,而混合戰(zhàn)略納什均衡指的是參與人以一定的概率選擇某種戰(zhàn)略,比如說(shuō),參與人以0.3的概率選擇第1種戰(zhàn)略,以0.5的概率選擇第2種戰(zhàn)略,以0.2的概率選擇第3種戰(zhàn)略。如果一個(gè)參與人采取混合戰(zhàn)略,他的對(duì)手就不能準(zhǔn)確的猜出他實(shí)際上會(huì)選擇的戰(zhàn)略,盡管每個(gè)參與人都知道其他參與人不同戰(zhàn)略的概率分布。為了區(qū)分這種情況,我們將前面的納什均衡定義為“純”戰(zhàn)略納什均衡。第2講完全信息靜態(tài)博弈混合戰(zhàn)略納什均衡指的是參與人以一定的概率選擇某種戰(zhàn)略,比如說(shuō)考慮社會(huì)福利博弈的例子。設(shè)想政府以1/2的概率選擇救濟(jì),以1/2的概率選擇不救濟(jì)。那么,對(duì)流浪漢來(lái)說(shuō),選擇工作帶來(lái)的期望效用為:

1/2*2+1/2*1=1.5

選擇游蕩帶來(lái)的期望效用為:

1/2*3+1/2*0=1.5選擇任何混合戰(zhàn)略帶來(lái)的期望效用都是1.5,所以,流浪漢的任何一種戰(zhàn)略(純的或混合的)都是對(duì)政府所選擇的混合戰(zhàn)略的最優(yōu)反應(yīng)。第2講完全信息靜態(tài)博弈考慮社會(huì)福利博弈的例子。設(shè)想政府以1/2的概率選擇救濟(jì),以1第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈納什均衡要求每個(gè)參與人的混合戰(zhàn)略是給定對(duì)方的混合戰(zhàn)略下的最優(yōu)選擇。因此,在社會(huì)福利博弈中,是唯一的納什均衡。就是說(shuō),在均衡情況下,政府以0.5的概率選擇救濟(jì),以0.5的概率選擇不救濟(jì),流浪漢以0.2的概率選擇尋找工作,以0.8的概率選擇游蕩。這個(gè)結(jié)論也可以從反面來(lái)說(shuō)明確實(shí)是一個(gè)納什均衡。

第2講完全信息靜態(tài)博弈納什均衡要求每個(gè)參與人的混合戰(zhàn)略是給定對(duì)方的混合戰(zhàn)略下的最優(yōu)假定政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于0.2,那么,政府的唯一最優(yōu)的選擇是純戰(zhàn)略不救濟(jì);但如果政府以1的概率選擇不救濟(jì),流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟(jì)的戰(zhàn)略,流浪漢則選擇游蕩;如此等等。因此小于0.2不構(gòu)成納什均衡。類似地,假定政府認(rèn)為流浪漢尋找工作的概率嚴(yán)格大于0.2,那么政府的唯一最優(yōu)的選擇是純戰(zhàn)略救濟(jì);但如果政府以1的概率選擇救濟(jì),流浪漢的最優(yōu)選擇是游蕩,因此,大于0.2也不構(gòu)成納什均衡。第2講完全信息靜態(tài)博弈假定政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于0.2,那么,政上述混合戰(zhàn)略也可以用幾何圖形來(lái)表示。但參與人選擇均和戰(zhàn)略時(shí),他選擇任何一個(gè)純戰(zhàn)略的概率在0與1之間是連續(xù)的。現(xiàn)在,我們用反應(yīng)對(duì)應(yīng)(reactioncorrespondent)的概念來(lái)描述一個(gè)參與人對(duì)應(yīng)于其他參與人混合戰(zhàn)略的最優(yōu)選擇。和反應(yīng)函數(shù)的區(qū)別是:反應(yīng)函數(shù)表示的是一個(gè)參與人只有一個(gè)特定的戰(zhàn)略是其他人給定戰(zhàn)略的最優(yōu)選擇,而反應(yīng)對(duì)應(yīng)允許一個(gè)參與人有多個(gè)(甚至無(wú)窮多個(gè))戰(zhàn)略是其他人給定戰(zhàn)略的最優(yōu)選擇。政府和流浪漢的的反應(yīng)對(duì)應(yīng)分別為:第2講完全信息靜態(tài)博弈上述混合戰(zhàn)略也可以用幾何圖形來(lái)表示。但參與人選擇均和戰(zhàn)略時(shí),第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈在下圖中,畫出政府和流浪漢的反應(yīng)曲線,兩條反應(yīng)曲線的交叉點(diǎn)就是納什均衡點(diǎn)。第2講完全信息靜態(tài)博弈NE10.20.51在下圖中,畫出政府和流浪漢的反應(yīng)曲線,兩條反應(yīng)曲線的交叉點(diǎn)就結(jié)論:一個(gè)參與人選擇不同的純戰(zhàn)略的概率分布不是由他自己的支付決定的,而是由他的對(duì)手的支付決定的。由于這個(gè)原因,許多人認(rèn)為混合戰(zhàn)略納什均衡是一個(gè)難以令人滿意的概念。既然參與人在構(gòu)成混合戰(zhàn)略的不同純戰(zhàn)略之間是無(wú)差異的,他為什么不選擇一個(gè)特定的純戰(zhàn)略而要以特定的概率隨機(jī)地選擇不同的純戰(zhàn)略呢?原因是一個(gè)參與人選擇混合戰(zhàn)略的目的是給其他第2講完全信息靜態(tài)博弈結(jié)論:一個(gè)參與人選擇不同的純戰(zhàn)略的概率分布不是由他自己的支付參與人造成不確定性,這樣,盡管其他參與人知道他選擇某個(gè)特定純戰(zhàn)略的概率是多少,但他并不能猜透他實(shí)際上會(huì)選擇哪個(gè)純戰(zhàn)略。如果某個(gè)參與人嚴(yán)格偏好某個(gè)特定的純戰(zhàn)略,他的行為就會(huì)被其他參與人準(zhǔn)確地猜透,就不會(huì)有混合戰(zhàn)略的出現(xiàn)。盡管混合戰(zhàn)略不像純戰(zhàn)略那樣直觀,但它確實(shí)是一些博弈中參與人的合理行為方式,撲克比賽、劃拳等例子,參加者總是隨機(jī)行動(dòng)以使自己的行為不被對(duì)手所預(yù)測(cè)。第2講完全信息靜態(tài)博弈參與人造成不確定性,這樣,盡管其他參與人知道他選擇某個(gè)特定純海薩尼對(duì)混合均衡的解釋是,混合戰(zhàn)略均衡等價(jià)于不完全信息下的純戰(zhàn)略均衡。在社會(huì)福利博弈中,假定有兩類特征的流浪漢,一類選擇尋找工作,另一類選擇游蕩;每個(gè)流浪漢都知道自己的特征,但政府不知道流浪漢的特征,只知道一個(gè)流浪漢有20%的概率屬于第一類,有80%的概率屬于第二類。在這種情況下,政府在選擇自己的戰(zhàn)略時(shí)似乎面臨的是一位選擇混合戰(zhàn)略的流浪漢。經(jīng)濟(jì)學(xué)上的監(jiān)督博弈也是屬于這樣的例子。第2講完全信息靜態(tài)博弈海薩尼對(duì)混合均衡的解釋是,混合戰(zhàn)略均衡等價(jià)于不完全信息下的純監(jiān)督博弈是猜謎游戲的變種,他概括了諸如稅收檢查、質(zhì)量檢查、懲治犯罪、雇主監(jiān)督雇員等這樣一類情況。以稅收檢查為例,這個(gè)博弈的參與人包括稅收機(jī)關(guān)和納稅人。稅收機(jī)關(guān)的純戰(zhàn)略是檢查或不檢查,納稅人的純戰(zhàn)略是逃稅或不逃稅。下面是支付矩陣。第2講完全信息靜態(tài)博弈監(jiān)督博弈是猜謎游戲的變種,他概括了諸如稅收檢查、質(zhì)量檢查、懲第2講完全信息靜態(tài)博弈a-C+F,-a-Fa-C,-a0,0a,-a納稅人稅收機(jī)關(guān)不檢查檢查逃稅不逃稅稅收監(jiān)督博弈a:應(yīng)納稅款C:檢查成本F:是罰款假定:C<a+F第2講完全信息靜態(tài)博弈a-C+F,-a-Fa-C,-a0,第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈第2講完全信息靜態(tài)博弈監(jiān)督博弈的納什均衡與應(yīng)納稅款a、對(duì)逃稅的懲罰F、以及檢查成本C有關(guān)。對(duì)逃稅的懲罰越重,應(yīng)納稅款越多,納稅人逃稅的概率就越??;檢查成本越高,納稅人逃稅的概率越大。第2講完全信息靜態(tài)博弈監(jiān)督博弈的納什均衡與應(yīng)納稅款a、對(duì)逃稅的懲罰F、以及檢查成本前面討論的是不存在純戰(zhàn)略納什均衡但存在混合戰(zhàn)略納什均衡的博弈。有些博弈既存在純戰(zhàn)略均衡,也存在混合戰(zhàn)略均衡。所謂“性別站”就是這樣一個(gè)博弈。性別戰(zhàn)說(shuō)的是,一男一女約會(huì),或者看足球比賽,或者芭蕾舞演出,男的偏好足球,女的偏好芭蕾舞,但他們都寧愿在一起而不愿分開(kāi)。下面是支付矩陣。第2講完全信息靜態(tài)博弈前面討論的是不存在純戰(zhàn)略納什均衡但存在混合戰(zhàn)略納什均衡的博弈第2講完全信息靜態(tài)博弈2,10,00,01,2女男芭蕾足球足球芭蕾性別戰(zhàn)第2講完全信息靜態(tài)博弈2,10,00,01,2女男芭蕾足球這個(gè)博弈有兩個(gè)純戰(zhàn)略納什均衡:(足球,足球),(芭蕾,芭蕾)。事實(shí)上,這

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論