博弈論與信息經(jīng)濟(jì)學(xué)完全信息靜態(tài)博弈_第1頁
博弈論與信息經(jīng)濟(jì)學(xué)完全信息靜態(tài)博弈_第2頁
博弈論與信息經(jīng)濟(jì)學(xué)完全信息靜態(tài)博弈_第3頁
博弈論與信息經(jīng)濟(jì)學(xué)完全信息靜態(tài)博弈_第4頁
博弈論與信息經(jīng)濟(jì)學(xué)完全信息靜態(tài)博弈_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論與信息經(jīng)濟(jì)學(xué)第一章 完全信息靜態(tài)博弈 1838年庫(kù)諾特(Cournot)寡頭競(jìng)爭(zhēng)模型(數(shù)量戰(zhàn)) 1883年伯川德(Bertrand)寡頭競(jìng)爭(zhēng)模型(價(jià)格戰(zhàn)) 1944年馮諾依曼和摩根斯坦發(fā)表博弈論和經(jīng)濟(jì)行為 1950年納什(Nash)提出了納什均衡的概念。 1965年澤爾騰(Selten)提出了子博弈精煉納什均衡的概念 19671968年海薩尼(Harsanyi)提出了貝葉斯納什均衡的概念博弈論概述:發(fā)展歷程 19751991年澤爾騰(1975)、Kreps和Wilson(1982)、Fudenberg和Tirole(1991)提出了精煉貝葉斯納什均衡的概念. 1994年納什、海薩尼和澤爾

2、騰獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。博弈論概述:發(fā)展歷程1996年維克里,米爾利斯獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年阿克爾洛夫、斯彭斯和斯蒂格利茨獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2005年奧曼和謝林諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)博弈的分類分類是一種深化認(rèn)識(shí)的方法。博弈可以根據(jù)不同的標(biāo)志從不同的角度進(jìn)行多種分類。通過分類我們將對(duì)博弈有進(jìn)一步的了解,同時(shí)對(duì)博弈理論的結(jié)構(gòu)體系有初步的認(rèn)識(shí). 按參與人的多少分:二人博弈和多人博弈. 按策略空間是否有限分:有限策略博弈和無限策略博弈. 按各策略組合下參與人支付之和情況分:零和博弈、常和博弈和變和博弈. 按參與人行動(dòng)的順序分:靜態(tài)博弈和動(dòng)態(tài)博弈. 按信息是否完全分:完全信息博弈和不完全信息博弈. 按參與者是

3、否能達(dá)成具有約束力的協(xié)議分:非合作博弈與合作博弈博弈理論體系的結(jié)構(gòu)框架按下面博弈類型安排:靜態(tài)動(dòng)態(tài)完全信息完全信息完全信息靜態(tài)博弈動(dòng)態(tài)博弈不完全信息不完全信息不完全信息靜態(tài)博弈動(dòng)態(tài)博弈博弈論的基本概念1、囚徒困境 囚徒2 坦白 抵賴 囚 坦白 徒 1 抵賴 1、參與人(局中人)Players:一個(gè)博弈中的決策主體,他們各自的目的是通過選擇行動(dòng)(策略)以最大化自己的目標(biāo)函數(shù)(效用水平/支付函數(shù))。他們可以是自然人或團(tuán)體或法人,如企業(yè)、國(guó)家、地區(qū)、社團(tuán)、歐盟、北約等。 虛擬參與人(pseudo-player):指“自然” (nature)、“上帝” God,也即決定外生的隨機(jī)變量的概率分布的機(jī)制。

4、“某事在人、成事在天”的“天”;如出遠(yuǎn)門去旅游,可能很開心,也可能很尷尬(生病住醫(yī)院),兩者概率分布90%、10%或98%與2%或其他,由上帝決定。 在以后的討論中,我們記參與人為i,參與人集合記為,即=1,2, ,i , ,n ,即該博弈中共有n個(gè)參與人;為了討論的方便,把某個(gè)參與人i之外的其他參與人稱為的i對(duì)手記為- i ; N代表自然。 對(duì)參與人的決策來說,最重要的是必須有可供選擇的行動(dòng)集(策略集)和一個(gè)很好定義的支付函數(shù)。理性(rational)的兩種定義 1. 如果一個(gè)決策者在追逐其目標(biāo)時(shí)能前后一致地做決策,就稱他是理性的。2. 廣義而言指的是一種行為方式,就是在給定的約束條件下追求

5、效用最大化。具體地講,理性大致有以下三項(xiàng)內(nèi)容:(1)存在一組可供選擇的備選或替代方案;(2)每一種方案均對(duì)應(yīng)著某種特定的預(yù)期凈收益或滿足程度或目標(biāo)實(shí)現(xiàn)程度;(3)人們總是選擇那個(gè)能夠帶來最大預(yù)期凈收益的方案。討論:人真的是理性的嗎?2. 行動(dòng)(action or moves)行動(dòng)是參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。一般地,我們用ai表示第i個(gè)參與人的一個(gè)特定行動(dòng),Ai=ai表示可供i選擇的所有行動(dòng)的集合。在n人博弈中,n個(gè)參與人的行動(dòng)的有序集a=(a1,.,ai,.an)稱為行動(dòng)組合,其中的第i個(gè)元素表示第i個(gè)參與人的行動(dòng)。行動(dòng)的順序(the order of play)博弈中參與人實(shí)施決策活

6、動(dòng)的順序。同時(shí)或有先有后。其他因素不變,但順序不同,參與人的最優(yōu)選擇就不同,博弈的結(jié)果也不同。事實(shí)上,不同的順序安排意味著不同的博弈。靜態(tài)博弈和動(dòng)態(tài)博弈。 3. 信息(information)參與人有關(guān)該博弈的知識(shí),如關(guān)于N的選擇、其他參與人的策略集、支付函數(shù)、行動(dòng)時(shí)間等。信息集(information set)主要出現(xiàn)在動(dòng)態(tài)博弈中,可理解為參與人在特定時(shí)刻上對(duì)有關(guān)變量的值的知識(shí);一個(gè)參與人無法準(zhǔn)確知道的變量的全體屬于一個(gè)信息集。買古董。完美信息(perfect information)指一個(gè)參與人對(duì)其他參與人(包括N)的行動(dòng)選擇有準(zhǔn)確了解的情況,即一個(gè)信息集只包含一個(gè)值。動(dòng)態(tài)博弈的概念。完全

7、信息(complete information):指N不首先行動(dòng)或N的初始行動(dòng)被所有的參與人準(zhǔn)確觀察到的情況,即沒有事前的不確定性。完全信息意味著各個(gè)參與人的支付函數(shù)是共同知識(shí)。 顯然,不完全(incomplete)信息意味著不完美(imperfect)信息。共同知識(shí)(common knowledge) 是與信息有關(guān)的一個(gè)重要概念。共同知識(shí)指“所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道”。在博弈論中,一般假定參與人的行動(dòng)空間Ai和行動(dòng)順序是共同知識(shí)。一個(gè)關(guān)于共同知識(shí)的小游戲A還是B??jī)蓚€(gè)人的推理過程:我看到你身上的A,如果我身上是B的話。因?yàn)槲覀儌z

8、至少有一個(gè)人身上是A,因此你因此判斷自己身上的是A。但是由于你沒有說,因此我可以斷定自己身上是A。臟臉博弈題目:三個(gè)學(xué)生的臉都是臟的,但是他們各自都看不到自己的臉。老師對(duì)他們說,你們中至少有一個(gè)人的臉是臟的。三個(gè)學(xué)生對(duì)視一番后無人舉手,隨即又都舉手表明自己的臉是臟的。請(qǐng)問為什么?臟臉博弈的推理過程三個(gè)人分別稱為1號(hào),2號(hào),3號(hào)1號(hào)看到2號(hào)和3號(hào)的臉是臟的,他就做了以下推理:首先1號(hào)假設(shè)自己的臉是干凈的,那么2號(hào)將會(huì)看到一張干凈的臉和一張臟臉。因此(1號(hào)知道)2號(hào)會(huì)想:“如果我(2號(hào))的臉是干凈的,那么3號(hào)將會(huì)看到兩張干凈的臉,那么他就知道自己的臉是臟的,因此他就會(huì)舉手說自己的臉是臟的。但他并沒

9、有舉手,這就表明我(2號(hào))的臉是臟的?!币虼?號(hào)就會(huì)舉手說自己的臉是臟的。但事實(shí)上2號(hào)也沒有舉手,這就表明了1號(hào)最初的假設(shè)(自己的臉是干凈的)是錯(cuò)誤的。因此1號(hào)可以斷定自己的臉是臟的。同理每個(gè)人都會(huì)做這樣的推理,因此在觀察到?jīng)]有人舉手的情況下,他們都會(huì)舉手表明自己的臉是臟的。共同知識(shí)以上的推斷不僅要求每個(gè)參與人是理性的,還要求每個(gè)參與人知道每個(gè)參與人是理性的,以及每個(gè)參與人知道每個(gè)參與人知道每個(gè)參與人是理性的,等等。例如在兩個(gè)人的例子中,你是理性的,所以如果你看到我身上的B就知道你身上的是A,但正因?yàn)槲抑滥闶抢硇缘?,所以我才可以站在你的立?chǎng)上推理。也因?yàn)槲抑滥阒牢沂抢硇缘?,因此我知道你?/p>

10、會(huì)站在我的立場(chǎng)上推理。 4. 策略(strategies ):又稱策略,是參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候的什么情況下采取什么行動(dòng)。因而一個(gè)策略是參與人的一個(gè)“相機(jī)行動(dòng)方案”(contingent action plan)。記參與人i的一個(gè)策略為si,參與人i在一個(gè)博弈中的全部可供選擇的策略記為Si(策略集strategy set),即si Si , Si =s1 ,s2 , si , sn,表示參與人i 在該博弈中共有n個(gè)可行的策略。如果n個(gè)參與人每人從自己的Si中選擇一個(gè)策略si,則向量s=( s1,s2,si, sn)是一個(gè)策略組合(strategy prof

11、ile),參與人i之外的其他參與人的策略組合可記為s-i=( s1,s2,si-1 ,si+1 , sn)。注意: 1. 策略與行動(dòng)是兩個(gè)不同的概念,策略是行動(dòng)的規(guī)則(告訴參與者在什么情況下應(yīng)該做什么)而不是行動(dòng)本身?;仡櫳险绿岬降母赣H和女兒的博弈。 在靜態(tài)博弈中,由于參與人同時(shí)行動(dòng),沒有人能掌握他人的之前行動(dòng)的信息,故沒有可針對(duì)的行動(dòng),從而策略的選擇就變成了行動(dòng)的選擇,即策略和行動(dòng)是同一的. 2. 作為一種行動(dòng)規(guī)則,策略必須是完備的,就是說,策略要給出參與人在每一種可能想象到的情況下的行動(dòng)選擇,即使參與人并不預(yù)期這種情況會(huì)實(shí)際發(fā)生。5. 支付(payoffs):參與人從各種策略組合中獲得的收

12、益。收益往往采用效用(utility)概念。它或者是一個(gè)特定策略組合下某個(gè)參與人得到的確定效用水平,或者是期望效用水平。它是策略組合的函數(shù),所以也稱支付函數(shù)(payoff function),記為ui(s),ui(s)= ui(s1, s2, ,si,sn-1,sn). 1. 博弈的一個(gè)基本特征是一個(gè)參與人的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇;是策略組合的函數(shù)。 2. 支付是參與人真正關(guān)心的東西,參與人在博弈中的目標(biāo)就是選擇自己的策略以最大化自己的支付函數(shù)。注意6. 均衡(equilibrium)均衡是所有參與人的最優(yōu)策略組合。一般記為s*=( s1*,s2*,s

13、i*, sn*)7. 結(jié)果(outcome)結(jié)果是(博弈達(dá)到均衡時(shí))博弈分析者所感興趣的所有東西,包括均衡策略組合,均衡行動(dòng)組合,均衡支付組合等。博弈的策略式表述策略式表述又稱為標(biāo)準(zhǔn)式表述,包括以下幾方面的內(nèi)容:1. 博弈的參與人集合=1,2, ,i , ,n 2. 每個(gè)參與人的策略空間Si, i=1,2, ,n 3. 每個(gè)參與人的支付函數(shù)ui(s1, s2, ,si,sn-1,sn), i=1,2, ,n 策略式表述更適合于靜態(tài)模型,但也可用于動(dòng)態(tài)模型。博弈的策略式表述 囚徒困境 囚徒2 坦白 抵賴 囚 坦白 徒 1 抵賴G=S1 ,,Sn ;u1, ,un 博弈分析的目的:預(yù)測(cè)博弈的均衡結(jié)

14、果,即給定每個(gè)參與人都是理性的是共同知識(shí),什么是每個(gè)參與人的最優(yōu)策略?什么是所有參與人的最優(yōu)策略組合?占優(yōu)策略均衡(嚴(yán)格)占優(yōu)策略與占優(yōu)策略均衡的定義:見課本。一個(gè)參與人的最優(yōu)策略可能并不依賴于其他參與人的策略選擇,就是說,不論其他參與人選擇什么策略,他的最優(yōu)策略都是唯一的,這樣的最優(yōu)策略被稱為“占優(yōu)策略(dominant strategy)”。囚徒困境博弈中的占優(yōu)策略均衡 囚徒困境 囚徒2 坦白 抵賴 囚 坦白 徒 1 抵賴智豬博弈有一頭大豬和一頭小豬住在同一個(gè)豬圈里,豬圈的一側(cè)放者豬食槽,另一側(cè)安裝著一個(gè)控制食物供應(yīng)的按鈕。按一次按鈕,有8個(gè)單位的食物進(jìn)槽,但需承擔(dān)2個(gè)單位的成本。偌大豬小

15、豬同時(shí)到達(dá)豬食槽,大豬吃到5個(gè)單位的食物,小豬吃到3個(gè)單位的食物;若大豬先到,大豬吃7個(gè)單位的食物,小豬只能吃到1個(gè)單位;若小豬先到,小豬吃到4個(gè)單位食物,大豬也吃到4個(gè)單位食物。智豬博弈中的占優(yōu)策略 小豬 按 等待 按 3,1 2,4 大豬 等待 7,-1 0,0請(qǐng)列舉“搭便車”的現(xiàn)象沖開水、搞衛(wèi)生;股市上莊家與散戶劣策略和嚴(yán)格劣策略令si 和si是參與人i可選擇的兩個(gè)策略,如果對(duì)于其他參與人任何選擇s-i=(s1,si-1 , si+1 ,,sn),參與人i從si 得到的支付嚴(yán)格小于從si得到的支付,即:ui(si , s-i ) ui(si , s-i ), s-i 我們說策略si 嚴(yán)格

16、劣于策略si“重復(fù)剔除嚴(yán)格劣策略(iterated elimination of strictly dominated strategies)”首先,找出某個(gè)參與人的嚴(yán)格劣策略,并把它從他的策略空間中剔除,重新構(gòu)造一個(gè)已不包含該嚴(yán)格劣策略的博弈;其次,剔除新博弈中某個(gè)參與人的嚴(yán)格劣策略;重復(fù)上述過程,直到只剩下唯一的策略組合。這個(gè)唯一剩下的策略組合就是博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡”。 博弈方2 左 中 右 博弈 上 方 1 下 參與人2 參與人2 左 中 左 中參與 上 參與 上人1 下 人1 消去參與人2 進(jìn)一步消去 右策略后的博弈 參與人1下策略后的博弈重復(fù)剔除的占優(yōu)均衡策略組合

17、s*=(s*1,s*i , ,s*n)稱為重復(fù)剔除的占優(yōu)均衡,如果它是重復(fù)剔除嚴(yán)格劣策略后剩下的唯一的策略組合。策略組合(上,中)是均衡結(jié)局,將實(shí)現(xiàn)支付(1,2)。第一第二第三思考:占優(yōu)策略均衡、嚴(yán)格剔除的占優(yōu)均衡與共同知識(shí)的關(guān)系。 參與人左中右上 , 4, 0 5, 3參與人中 4, 0 0, 4 5, 3下 3, 5 3, 5 6, 6每個(gè)參與人都不存在嚴(yán)格劣策略納什均衡有n個(gè)參與人的策略式表述為博弈G=S1 ,,Sn ;u1, ,un ,策略組合s*=(s*1,s*i , ,s*n)是一個(gè)納什均衡,如果對(duì)于每一個(gè)i , s*i是給定其他參與人選擇s*-i=(s*1,s*i-1 , s*i

18、+1 ,,s*n)的情況下第i個(gè)參與人的最優(yōu)策略,即:ui(s*i , s*-i )ui(si , s*-i ), siSi ,i為了理解納什均衡的哲學(xué)含義,讓我們?cè)O(shè)想n個(gè)參與人在博弈之前協(xié)商達(dá)成一個(gè)協(xié)議,規(guī)定每一個(gè)參與人選擇一個(gè)特定的策略。我們要問的一個(gè)問題是,給定其他參與人都遵守這個(gè)協(xié)議,在沒有外在強(qiáng)制的情況下,是否有任何人有積極性不遵守這個(gè)協(xié)議?顯然,只有當(dāng)遵守協(xié)議帶來的效用大于不遵守協(xié)議時(shí)的效用,一個(gè)人才會(huì)遵守這個(gè)協(xié)議。如果沒有任何參與人有積極性不遵守這個(gè)協(xié)議,我們說這個(gè)協(xié)議是可以自動(dòng)實(shí)施的(self-enforcing),這個(gè)協(xié)議就構(gòu)成一個(gè)納什均衡;否則,它就不是一個(gè)納什均衡。納什均

19、衡是一種策略組合,使得每個(gè)參與人的策略是對(duì)其他參與人策略的最優(yōu)放應(yīng)。 納什均衡是博弈將會(huì)如何進(jìn)行的“一致”(consistent)預(yù)測(cè),這意指,如果所有參與人預(yù)測(cè)特定納什均衡會(huì)出現(xiàn),那么沒有參與人有動(dòng)力采用與均衡不同的行動(dòng)。因此納什均衡(也只有納什均衡)能具有性質(zhì)使得參與人能預(yù)測(cè)到它,預(yù)測(cè)到他們的對(duì)手也會(huì)預(yù)測(cè)到它,如此繼續(xù)。與之相反,任何固定的非納什均衡如果出現(xiàn)就意味著至少有一個(gè)參與人“犯了錯(cuò)”,或者是對(duì)對(duì)手行動(dòng)的預(yù)測(cè)上犯了錯(cuò),或者是(給定那種預(yù)測(cè))在最大化自己的收益時(shí)犯了錯(cuò)。 納什均衡通過了一致預(yù)測(cè)檢驗(yàn)并不就使得它們是好的預(yù)測(cè),在一些博弈格局中如果認(rèn)為可以獲得精確預(yù)測(cè)那會(huì)過于輕率,由此我們想

20、提請(qǐng)注意一個(gè)事實(shí),博弈的最可能結(jié)果實(shí)際上取決于比標(biāo)準(zhǔn)式所提供的更多的信息。例如,可能希望知道參與人對(duì)于此類博弈具有多少經(jīng)驗(yàn),他們是否來自同一種文化因此而分縣分享關(guān)于博弈將會(huì)如何進(jìn)行的特定期望,以及如此等等。 (Jean Tirole) P10-11每個(gè)參與人都不存在嚴(yán)格劣策略(下,右)是NE,將實(shí)現(xiàn)支付(6,6) 參與人左中右上 , 4, 0 5, 3參與人中 4, 0 0, 4 5, 3下 3, 5 3, 5 6, 6囚徒招認(rèn)沉默招認(rèn) 5, -5 0, -8囚徒沉默 -8, 0 -1 , -1囚徒的困境(沉默,沉默)帕累托優(yōu)于(招認(rèn),招認(rèn)) 有一頭大豬和一頭小豬住在同一個(gè)豬圈里,豬圈的一側(cè)放

21、者豬食槽,另一側(cè)安裝著一個(gè)控制食物供應(yīng)的按鈕。按一次按鈕,有8個(gè)單位的食物進(jìn)槽,但需承擔(dān)2個(gè)單位的成本。偌大豬小豬同時(shí)到達(dá)豬食槽,大豬吃到5個(gè)單位的食物,小豬吃到3個(gè)單位的食物;若大豬先到,大豬吃7個(gè)單位的食物,小豬只能吃到1個(gè)單位;若小豬先到,小豬吃到4個(gè)單位食物,大豬也吃到4個(gè)單位食物。練習(xí):智豬博弈(boxed pigs game) 小豬 去按 等待 去按 3,1 2,4 大豬 等待 7,-1 0,0大豬的收益外部化,小豬不勞而獲,免費(fèi)搭了大豬的便車。小雞博弈(the game of chicken) 設(shè)想湯姆和吉米是兩個(gè)頑皮的小孩,他們?cè)谛』锇榈墓膭?dòng)下要進(jìn)行一場(chǎng)關(guān)于勇氣的比賽:兩人分別

22、從一條獨(dú)木橋的兩端沖向?qū)Ψ?,誰退卻誰就是“小雞”。顯然,如果兩個(gè)人都向前沖,則兩敗俱傷,設(shè)支付水平為-2;如果一個(gè)勇進(jìn)而另一個(gè)退卻,則勇進(jìn)者受到小伙伴的歡呼,退卻者受到嘲諷,設(shè)支付分別為4和-1;若兩人同時(shí)退卻,則一起受到小伙伴的嘲笑,設(shè)支付為0,因?yàn)閮扇艘黄鹗艿匠靶Ρ绕鹨蝗藛为?dú)受到嘲笑要好受些。箭頭法 吉米 退卻 勇進(jìn) 退卻 湯姆 勇進(jìn)0,0-1,44,-1-2,-2有兩個(gè)均衡。實(shí)際會(huì)怎樣?混合策略NE定義Definition In the n-player normal-form game G=S1, , Sn; u1, , un, the mixed strategies(p1*,,pn

23、*) are a Nash equilibrium if each players mixed strategy is a best response to the other players mixed strategies: V (pi*,p-i*) V (pi,p-i*) must hold.(二)混合策略NE的求解支付等值法 112 113這種通過使對(duì)方選擇各個(gè)純策略的期望支付值相等來確定自己的策略空間上的最優(yōu)概率分布的方法被稱為“支付等值法”。支付最大化法 以猜硬幣游戲?yàn)槔?。令蓋硬幣方以r的概率選正面,以1-r的概率選反面,即P蓋=(r,1-r);猜硬幣方以q的概率猜正面,以1-q的

24、概率猜反面,即P猜=(q,1-q),有: V蓋(p蓋, p猜)=r(-1) q+1 (1-q)+(1-r)1 q+(-1) (1-q)= -4qr+2q+2r-1 V猜(p蓋, p猜)=q1r+(-1) (1-r)+(1-q)(-1) r+1 (1-r)=4qr-2q-2r+1解:MaxV蓋(p蓋, p猜)r得:q*=1/2MaxV猜(p蓋, p猜)q得:r*=1/2混合策略NE是蓋方在策略空間正面,反面上以概率分布P蓋*,=(1/2,1/2)進(jìn)行選擇,猜方也在策略空間正面,反面上以概率p猜*=(1/2,1/2)進(jìn)行選擇。對(duì)混合策略的辯護(hù):*混合策略表示使用不同純策略的大量參與人。 *Hars

25、anyi:混合可以解釋為參與人收益上微小的不可觀測(cè)變動(dòng)的結(jié)果。*博弈多次反復(fù)進(jìn)行時(shí)參與人實(shí)施某一純策略的不確定次數(shù)和時(shí)間。*P52 一個(gè)參與人實(shí)施混合策略的目的是給其他參與人造成不確定性,盡管其他參與人能推測(cè)到他選擇某個(gè)純策略的概率有多大,但卻不知道他到底會(huì)選哪個(gè)純策略。為了進(jìn)一步理解混合策略的實(shí)際意義,下面分析“監(jiān)察博弈”(Jean Tirole and Selten)監(jiān)察博弈“監(jiān)察博弈”是“Matching Pennies”的一種流行變種,它可以應(yīng)用于武器控制、犯罪預(yù)防和工人激勵(lì)。下圖是這一博弈的簡(jiǎn)單版本。一個(gè)工人為一個(gè)老板工作(參與人);工人可以偷懶或工作、老板可以監(jiān)察或不監(jiān)察(策略集)

26、;工人工作能為老板產(chǎn)生價(jià)值為v的產(chǎn)出,但會(huì)使自己花費(fèi)成本g。老板監(jiān)察要花費(fèi)成本h,但可以提供工人是否偷懶的證據(jù)。工人得到工資w(假設(shè)老板不允許根據(jù)觀測(cè)產(chǎn)出水平來?xiàng)l件化工資),如果工人被抓住在偷懶,則他得到0(由于有限責(zé)任的原因)。兩認(rèn)同時(shí)選擇他們 的策略(特別地,老板在決定是否監(jiān)察工人時(shí)不知道工人是否會(huì)選擇偷懶)。為了限制要考察的情形數(shù)量,假設(shè)gh 0;為了使分析更有趣,還假設(shè)w g(否則工作對(duì)于工人來說會(huì)是一個(gè)嚴(yán)格劣策略)。 監(jiān)察 不監(jiān)察 偷懶 0,-h w,-w 不偷懶 w-g,v-w-h w-g,v-wP*(偷懶)=h/w,P*(監(jiān)察)=g/w武器核查、工商打假、不定期抽查等等戀人之爭(zhēng)

27、battle of the sexes一對(duì)戀人,小娟和大海,在不同的地方上班,兩人都很珍惜周末能夠在一起的時(shí)間。某周末,小娟花高價(jià)購(gòu)得兩張芭蕾舞門票,大海也好不容易搞到兩張足球賽門票。小娟從小酷愛芭蕾,大海是個(gè)十足的足球迷,怎么辦?顯然如果各自分開過周末,那才是雙方最不樂意的事。 大 海 芭蕾 足球 芭蕾 小娟 足球2,11,20,00,0Battle of the sexes存在兩個(gè)純策略NE:(芭蕾,芭蕾)和(足球,足球)。無法形成一致的預(yù)期,結(jié)果不確定。Schelling(1960)認(rèn)為,在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來達(dá)到一個(gè)“聚點(diǎn)”(focalpoint)均衡

28、。這些信息可能與社會(huì)文化習(xí)慣、參與人過去博弈的歷史等有關(guān)。促成出現(xiàn)的另一種方法是參與人在博弈開始之前進(jìn)行不花什么成本的“廉價(jià)磋商”(cheaptalk).Aumann(1974)證明,如果參與人可以根據(jù)某個(gè)共同觀測(cè)到的信號(hào)進(jìn)行博弈,就可能出現(xiàn)“相關(guān)均衡”(correlatedequilibrium)。如天氣 拋硬幣如果兩個(gè)人都很任性,誰也不讓步,誰也不肯讓對(duì)方得意又確實(shí)離不開對(duì)方,那就變成實(shí)施混合策略:(小娟)選足球不甘心,選芭蕾又怕大海不樂意。大海也一樣。那么最優(yōu)的概率分布是什么?令小娟策略空間芭蕾,足球上的概率分布為(,),大海策略空間芭蕾,足球上的概率分布為(,),那么:小娟 (-)(1

29、-)=3rq+1-r-q最優(yōu)化q*=1/3V大海=12 (-)(1-)=3rq+2-2q-2r最優(yōu)化r*=2/3所以,混合策略NE是:小娟以2/3的概率選芭蕾,以1/3的概率選足球;大海以1/3的概率選芭蕾,以2/3的概率選足球。其效率是:小娟2/3 = V大海1最差的效率是兩人都為對(duì)方著想,又沒有事前溝通,結(jié)果小娟去了足球場(chǎng),而大海去了劇場(chǎng)。(三)混合策略與反應(yīng)對(duì)應(yīng) P56回顧Matching Pennies,雙方都會(huì)實(shí)施混合策略,其NE是r* =q* =(1/2,1/2)。這里,從另一個(gè)角度說明這樣的概率分布確實(shí)是一個(gè)“不動(dòng)點(diǎn)”。按照NE的條件,一個(gè)策略組合如過是一個(gè)NE,那么其中的每一個(gè)

30、策略都是參與人針對(duì)其他參與人策略組合的最優(yōu)反應(yīng),在純策略NE中,這個(gè)“最優(yōu)反應(yīng)”可能是一個(gè)具體的純策略(如在“Prisoners Dilemma”中),也可能是一個(gè)反應(yīng)函數(shù)(reaction function)(如在“Cournot Model of Duopoly”中)。而在一個(gè)混合策略NE中,這個(gè)“最優(yōu)反應(yīng)”將是一個(gè)概率或很多個(gè)概率被稱為“反應(yīng)對(duì)應(yīng)”(reaction correspondence)。以Matching Pennies 為例。r蓋方選正面的概率,q猜方猜正面的概率先看蓋方的最優(yōu)反應(yīng),記為r*=R(q):當(dāng)q1/2r*=R(q)=1當(dāng)q=1/20,1 當(dāng)q1/20猜方的最優(yōu)反

31、應(yīng)反應(yīng),記為q*=R(r)當(dāng)r1/2q*=R(r)=0,當(dāng)r=1/20,1,當(dāng)r1/21,反應(yīng)對(duì)應(yīng)與反應(yīng)函數(shù)的區(qū)別:作為NE,各個(gè)參與人的反應(yīng)應(yīng)該同時(shí)為最優(yōu),那么只要求兩個(gè)反應(yīng)對(duì)應(yīng)的交點(diǎn),用圖示法:rq01(正面)1(正面)1/21/2r*=R(q)q*=R(r)(四)Existence of Nash Equilibrium問題:是否所有的博弈都存在NE(純的或混合的)?*Nash在1950年證明:任何有限博弈,都至少存在一個(gè)NE。Theorem(Nash 1950):In the n-player normal- form game G=S1, , Sn; u1, , un, if n i

32、s finite and Si is finite for every i then there exists at least one Nash equilibrium, possibly involving mixed strategies.Nash theorem 的證明 略Wilson(1971)證明,幾乎所有有限博弈,都存在有限奇數(shù)個(gè)NE,包括純策略NE和混合策略NE。Oddness TheoremP63 例證,P67-69 證明Problems1、In the following normal-form game,what strategies survive iterated e

33、limination of strictly dominated strategies ?What are the pure-strategy Nash equilibrium? L C R T 2,0 1,1 4,2 M 3,4 1,2 2,3 B 1,3 0,2 3,0 2、Players 1 and 2 are bargaining over how to split 10 thousand dollars.Both players simultaneously name shares they would like to have,s1 and s2 ,where 0 s1 ,s2 1.If s1+s2 1, then the players receive the shares the

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論