博弈論最全完整-講解課件

上傳人：w*** IP屬地：貴州上傳時間：2023-07-30 格式：PPT 頁數(shù)：616 大小：3.02MB 積分：38 舉報 版權申訴

已閱讀5頁，還剩611頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

博弈論與信息經濟學

GameTheoryandEconomicsofInformation1a博弈論與信息經濟學

GameTheoryandEcon博弈論與信息經濟學

GameTheoryandEcon博弈論基本思想人們在日常生活中進行著博弈，與配偶，朋友，陌生人，老板/員工，教授等。類似的博弈也在商業(yè)活動、政治和外交事務、戰(zhàn)爭中進行著——在任何一種情況下，人們相互影響以達成彼此有利的協(xié)議或者解決爭端。博弈論為眾多學科提供了分析的概念和方法：經濟學和商學,政治科學,生物學,

心理學和哲學。2a博弈論基本思想人們在日常生活中進行著博弈，與配偶，朋友，陌生博弈論基本思想人們在日常生活中進行著博弈，與配偶，朋友，陌生如何在“博弈”中獲勝？日常生活中的博弈（“游戲”）往往指的是諸如賭博和運動這樣的東西：賭拋硬幣百米賽跑打網球/橄欖球Howcanyouwinsuchgames?許多博弈都包含著運氣、技術和策略。策略是為了獲勝所需要的一種智力的技巧。它是對于如何最好地利用身體（物質）的技巧的一種算計。3a如何在“博弈”中獲勝？日常生活中的博弈（“游戲”）往往指的是如何在“博弈”中獲勝？日常生活中的博弈（“游戲”）往往指的是什么是策略博弈？

WhatisaGameofStrategy?策略思考本質上涉及到與他人的相互影響。其他人在同一時間、對同一情形也在進行類似的思考。博弈論就是用來分析這樣交互式的決策的。理性的行為指的是：明白自己的目的和偏好，同時了解自己行動的限制和約束，然后以精心策劃的方式選擇自己的行為，按照自己的標準做到最好。博弈論對理性的行為又從新的角度賦予其新的含義——與其他同樣具有理性的決策者進行相互作用。博弈論是關于相互作用情況下的理性行為的科學。4a什么是策略博弈？

WhatisaGameofStr什么是策略博弈？

WhatisaGameofStr如何在博弈中獲勝？……真的能在博弈中（總是）獲勝嗎？對手和你一樣聰明！

許多博弈相當復雜，博弈論并不能提供萬無一失的應對辦法。5a如何在博弈中獲勝？5a如何在博弈中獲勝？5a如何在博弈中獲勝？5a例1：無謂競爭（TheGPARatRace）你所注冊的一門課程按照比例來給分：無論卷面分數(shù)是多少，只有40％的人能夠得優(yōu)秀，40％的人能得良好。所有學生達成一個協(xié)議，大家都不要太用功，如何？想法不錯，但無法實施!稍加努力即可勝過他人，誘惑大矣。問題是，大家都這么做。這樣一來，所有人的成績都不比大家遵守協(xié)議來得高。而且，大家還付出了更多的功夫。正因為這樣的博弈對所有參與者存在著或大或小的潛在成本，如何達成和維護互利的合作就成為一個值得探究的重要問題。存在雙贏的博弈嗎？6a例1：無謂競爭（TheGPARatRace）你所注冊的例1：無謂競爭（TheGPARatRace）你所注冊的例2：焦點博弈

“WeCan’tTaketheExam,

BecauseWeHadaFlatTire”兩個學生想要推遲考試，謊稱由于返校途中輪胎漏氣，未能很好地備考。教授分別對他們提出了問題：“哪個輪胎漏氣?”如何應答？他們本應該預計到教授的招數(shù)，提前準備好答案。在博弈中，參與者應該向前看到未來的行動，然后通過向后推理，推算出目前的最佳行動。如果雙方都沒有準備，他能夠獨立地編出一個相互一致的謊言嗎？7a例2：焦點博弈“WeCan’tTaketheExa例2：焦點博弈“WeCan’tTaketheExa例2：焦點博弈

“WeCan’tTaketheExam,

BecauseWeHadaFlatTire”“乘客側前輪”看起來是一個合乎邏輯的選擇。但真正起作用的是你的朋友是否使用同樣的邏輯，或者認為這一選擇同樣顯然。并且是否你認為這一選擇是否對他同樣顯然；反之，是否她認為這一選擇對你同樣顯然?！源祟愅啤Ｒ簿褪钦f，需要的是對這樣的情況下該選什么的預期的收斂。這一使得參與者能夠成功合作的共同預期的策略被稱為焦點。心有靈犀一點通。8a例2：焦點博弈“WeCan’tTaketheExa例2：焦點博弈“WeCan’tTaketheExa例2：焦點博弈

“WeCan’tTaketheExam,

BecauseWeHadaFlatTire”我們無法從所有這樣的博弈的結構中找到一般和本質的東西，來保證這樣的收斂。某些博弈中，由于偶然的外因可以對策略貼標簽，或者參與者之間擁有某些共同的知識體驗，導致了焦點的存在。沒有某個這樣的暗示，默契的合作就完全不可能。9a例2：焦點博弈“WeCan’tTaketheExa例2：焦點博弈“WeCan’tTaketheExa例3：為什么教授如此苛刻？許多教授強硬地規(guī)定，不進行補考，不允許遲交作業(yè)或論文。教授們?yōu)楹稳绱丝量?？如果允許某種遲交，而且教授又不能辨別真?zhèn)?，那么學生就總是會遲交。期限本身就毫無意義了。避免這一“滑梯”通常只有一種辦法，就是“沒有例外”的策略。10a例3：為什么教授如此苛刻？許多教授強硬地規(guī)定，不進行補考，不例3：為什么教授如此苛刻？許多教授強硬地規(guī)定，不進行補考，不例3：為什么教授如此苛刻？問題是，一個好心腸的教授如何維持如此鐵石心腸的承諾？他必須找到某種使拒絕變得強硬和可信的方法。拿行政程序或者學校政策來做擋箭牌在課程開始時做出明確和嚴格的宣布通過幾次嚴打來獲得“冷面殺手”的聲譽11a例3：為什么教授如此苛刻？問題是，一個好心腸的教授如何維持如例3：為什么教授如此苛刻？問題是，一個好心腸的教授如何維持如導論博弈均衡與一般均衡博弈論與諾貝爾經濟學獎獲得者博弈論的基本概念與類型主要參考文獻12a導論博弈均衡與一般均衡12a導論博弈均衡與一般均衡12a導論博弈均衡與一般均衡12a導論一、博弈均衡與一般均衡13a導論一、博弈均衡與一般均衡13a導論一、博弈均衡與一般均衡13a導論一、博弈均衡與一般均衡1案例：囚犯困境抵賴坦白抵賴-1，-1-9，0坦白0，-9-6，-6支付嫌疑人B嫌疑人A14a案例：囚犯困境支付嫌疑人B嫌疑人A14a案例：囚犯困境支付嫌疑人B嫌疑人A14a案例：囚犯困境支與傳統(tǒng)微觀經濟學的比較一致性利益最大化原則均衡原則不一致人與人之間的關系-個人理性導致集體非理性-設計協(xié)調性機制-滿足個人理性前提下達到集體理性信息不完全-委托-代理理論、信號傳遞與信息篩選模型15a與傳統(tǒng)微觀經濟學的比較一致性15a與傳統(tǒng)微觀經濟學的比較一致性15a與傳統(tǒng)微觀經濟學的比較一致導論二、博弈論與諾貝爾經濟學獎獲得者16a導論二、博弈論與諾貝爾經濟學獎獲得者16a導論二、博弈論與諾貝爾經濟學獎獲得者16a導論二、博弈論與諾1994年諾貝爾經濟學獎獲得者美國人約翰-海薩尼(JohnC.Harsanyi)和美國人約翰-納什(JohnF.NashJr.)以及德國人萊因哈德-澤爾騰(ReinhardSelten)

獲獎理由：在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻，對博弈論和經濟學產生了重大影響。

17a1994年諾貝爾經濟學獎獲得者美國人約翰-海薩尼(John1994年諾貝爾經濟學獎獲得者美國人約翰-海薩尼(John約翰·納什

1928年生于美國約翰·海薩尼

1920年生于美國萊因哈德·澤爾騰，1930年生于德國18a約翰·納什

1928年生于美國約翰·萊因哈德·澤爾騰，193約翰·納什

1928年生于美國約翰·萊因哈德·澤爾騰，1931996年諾貝爾經濟學獎獲得者英國人詹姆斯·莫里斯(JamesA.Mirrlees)和美國人威廉-維克瑞(WilliamVickrey)獲獎理由：前者在信息經濟學理論領域做出了重大貢獻，尤其是不對稱信息條件下的經濟激勵理論的論述；后者在信息經濟學、激勵理論、博弈論等方面都做出了重大貢獻。19a1996年諾貝爾經濟學獎獲得者19a1996年諾貝爾經濟學獎獲得者19a1996年諾貝爾經濟學獎詹姆斯·莫里斯

1936年生于英國威廉·維克瑞，1914-1996，生于美國20a詹姆斯·莫里斯

1936年生于英國威廉·維克瑞，1914-1詹姆斯·莫里斯

1936年生于英國威廉·維克瑞，1914-12001年諾貝爾經濟學獎獲得者三位美國學者喬治-阿克爾洛夫(GeorgeA.Akerlof)、邁克爾-斯彭斯(A.MichaelSpence)和約瑟夫-斯蒂格利茨(JosephE.Stiglitz)獲獎理由：在“對充滿不對稱信息市場進行分析”領域做出了重要貢獻。

21a2001年諾貝爾經濟學獎獲得者三位美國學者喬治-阿克爾洛夫(2001年諾貝爾經濟學獎獲得者三位美國學者喬治-阿克爾洛夫(約瑟夫·斯蒂格利茨，1943年生于美國的印第安納州，1967年獲美國麻省理工學院博士頭銜，曾擔任世界銀行的首席經濟學家，現(xiàn)任美國哥倫比亞大學經濟學教授喬治·阿克爾洛夫

1940年生于美國的紐黑文，1966年獲美國麻省理工學院博士頭銜，現(xiàn)為美國加利福尼亞州大學經濟學教授。邁克爾·斯彭斯

1948年生于美國的新澤西，1972年獲美國哈佛大學博士頭銜，現(xiàn)兼任美國哈佛和斯坦福兩所大學的教授。22a約瑟夫·斯蒂格利茨，1943年生于美國的印第安納州，1967約瑟夫·斯蒂格利茨，1943年生于美國的印第安納州，19672005年諾貝爾經濟學獎獲得者以羅伯特·奧曼色列經濟學家羅伯特－奧曼（RobertJ.Aumann）和美國經濟學家托馬斯·謝林（ThomasC.Schelling）

獲獎原因：“通過博弈論分析加強了我們對沖突和合作的理解”所作出的貢獻而獲獎。23a2005年諾貝爾經濟學獎獲得者以羅伯特·奧曼色列經濟學家羅伯2005年諾貝爾經濟學獎獲得者以羅伯特·奧曼色列經濟學家羅伯

羅伯特·奧曼托馬斯·謝林24a

導論三、博弈論的基本類型25a導論三、博弈論的基本類型25a導論三、博弈論的基本類型25a導論三、博弈論的基本類型25a合作博弈與非合作博弈合作博弈（cooperativegame）達成有約束力的協(xié)議（bindingagreement），強調團體理性，強調效率、公正、公平非合作博弈（non-cooperativegame）強調個人理性，其結果可能有效率，也可能無效率。26a合作博弈與非合作博弈合作博弈（cooperativegam合作博弈與非合作博弈合作博弈（cooperativegam納什均衡（NE）子博弈完美納什均衡（SPNE）貝氏納什均衡（BNE）完美貝氏納什均衡（PBNE）及序貫均衡（SE）完全信息

不完全信息靜態(tài)動態(tài)非合作博弈的基本分類27a納什均衡（NE）子博弈完美納什均衡（SPNE）貝氏納什均衡（納什均衡（NE）子博弈完美納什均衡（SPNE）貝氏納什均衡（靜態(tài)博弈與動態(tài)博弈

(staticgamesanddynamicgames)同時決策或者同時行動的博弈屬于靜態(tài)博弈；先后或序貫決策或者行動的博弈，屬于動態(tài)博弈即使決策或行動有先后，但只要局中人在決策時都還不知道對手的決策或者行動是什么，也算是靜態(tài)博弈28a靜態(tài)博弈與動態(tài)博弈

(staticgamesanddy靜態(tài)博弈與動態(tài)博弈

(staticgamesanddy完全信息博弈與不完全信息博弈

(gamesofcompleteinformationand

gamesofincompleteinformation)按照大家是否清楚對局情況下每個局中人的得益?！案鞣N對局情況下每個人的得益是多少”是所有局中人的共同知識（commonknowledge）。據(jù)“共同知識”的掌握分為完全信息與不完全信息博弈。29a完全信息博弈與不完全信息博弈

(gamesofcompl完全信息博弈與不完全信息博弈

(gamesofcompl完美信息博弈與不完美信息博弈

(gameswithperfectinformationand

gameswithimperfectinformation)是關于動態(tài)博弈進行過程之中面臨決策或者行動的參與人對于博弈進行迄今的歷史是否清楚的一種刻劃。如果在博弈進行過程中的每一時刻，面臨決策或者行動的參與人，對于博弈進行到這個時刻為止所有參與人曾經采取的決策或者行動完全清楚，則稱為完美信息博弈；否則位不完美信息。30a完美信息博弈與不完美信息博弈

(gameswithper完美信息博弈與不完美信息博弈

(gameswithper零和博弈與非零和博弈

(zero-sumgameandnon-zero-sumgame)如果一個博弈在所有各種對局下全體參與人之得益總和總是保持為零，這個博弈就叫零和博弈；相反，如果一個博弈在所有各種對局下全體參與人之得益總和不總是保持為零，這個博弈就叫非零和博弈。零和博弈是利益對抗程度最高的博弈。31a零和博弈與非零和博弈

(zero-sumgameand零和博弈與非零和博弈

(zero-sumgameand常和博弈與非常和博弈

（constant-sumgameandvariable-sumgame）如果一個博弈在所有各種對局下全體參與人之得益總和總是保持為一個常數(shù)，這個博弈就叫常和博弈；相反，如果一個博弈在所有各種對局下全體參與人之得益總和不總是保持為一個常數(shù)，這個博弈就叫非常和博弈。常和博弈也是利益對抗程度最高的博弈。非常和（變和）博弈蘊含雙贏或多贏。32a常和博弈與非常和博弈

（constant-sumgame常和博弈與非常和博弈

（constant-sumgame導論四、主要參考文獻33a導論四、主要參考文獻33a導論四、主要參考文獻33a導論四、主要參考文獻33a張維迎著，《博弈論與信息經濟學》，上海三聯(lián)書店、上海人民出版社，1996年版。RogerB.Myerson著：GameTheory（原文版、譯文版），中國經濟出版社，2001年版。王則柯、李杰編著，《博弈論教程》，中國人民大學出版社，2004年版。艾里克.拉斯繆森（EricRasmusen）著，《博弈與信息：博弈論概論》，北京大學出版社，2003年版。因內思·馬可-斯達德勒,J.大衛(wèi)·佩雷斯-卡斯特里羅著，《信息經濟學引論：激勵與合約》,上海財經大學出版社，2004年版。施錫銓編著，《博弈論》上海財大出版社，2000年版。謝識予編著，《經濟博弈論》，復旦大學出版社，2002年版。謝識予主編，《經濟博弈論習題指南》，復旦大學出版社，2003年版。34a34a34a34a課程主要內容第一章完全信息靜態(tài)博弈第二章完全信息動態(tài)博弈第三章不完全信息靜態(tài)博弈第四章不完全信息動態(tài)博弈第五章委托-代理理論第六章逆向選擇與信號傳遞35a課程主要內容第一章完全信息靜態(tài)博弈35a課程主要內容第一章完全信息靜態(tài)博弈35a課程主要內容第一章第一章完全信息靜態(tài)博弈博弈論的基本概念及戰(zhàn)略式表述納什均衡納什均衡應用舉例混合戰(zhàn)略納什均衡納什均衡的存在性與多重性36a第一章完全信息靜態(tài)博弈博弈論的基本概念及戰(zhàn)略式表述36a第一章完全信息靜態(tài)博弈博弈論的基本概念及戰(zhàn)略式表述36a第第一節(jié)

博弈論的基本概念

與戰(zhàn)略式表述37a第一節(jié)

博弈論的基本概念

與戰(zhàn)略式表述37a第一節(jié)

博弈論的基本概念

與戰(zhàn)略式表述37a第一節(jié)

博弈博弈論的基本概念與戰(zhàn)略式表述博弈論（gametheory）是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題。博弈的戰(zhàn)略式表述：G={N,(Si)iN,(Ui)iN}有三個基本要素：（1）參與人（players）iN={1,2,…,n}

；（2）戰(zhàn)略（strategies）,siSi(戰(zhàn)略空間)；（3）支付（payoffs）,ui=ui(s-i,si)。38a博弈論的基本概念與戰(zhàn)略式表述博弈論（gametheory）博弈論的基本概念與戰(zhàn)略式表述博弈論（gametheory）案例1：囚犯困境抵賴坦白抵賴-1，-1-9，0坦白0，-9-6，-6支付嫌疑人B嫌疑人A39a案例1：囚犯困境支付嫌疑人B嫌疑人A39a案例1：囚犯困境支付嫌疑人B嫌疑人A39a案例1：囚犯困均衡與均衡結果均衡戰(zhàn)略（坦白，坦白）均衡支付（-6，-6）40a均衡與均衡結果均衡戰(zhàn)略（坦白，坦白）40a均衡與均衡結果均衡戰(zhàn)略（坦白，坦白）40a均衡與均衡結果均衡第二節(jié)納什均衡占優(yōu)戰(zhàn)略均衡重復剔除的占優(yōu)戰(zhàn)略均衡納什均衡41a第二節(jié)納什均衡占優(yōu)戰(zhàn)略均衡41a第二節(jié)納什均衡占優(yōu)戰(zhàn)略均衡41a第二節(jié)納什均衡占優(yōu)戰(zhàn)略均完全信息靜態(tài)博弈的幾點特性同時出招，出招一次；知道博弈結構與游戲規(guī)則（共同知識）；不管是否溝通過，無法做出有約束力的承諾（非合作）

42a完全信息靜態(tài)博弈的幾點特性同時出招，出招一次；42a完全信息靜態(tài)博弈的幾點特性同時出招，出招一次；42a完全一、占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略：不管對手戰(zhàn)略為何，該參與人可找到一最佳戰(zhàn)略。定義：在博弈G={N,(Si)iN,(Ui)iN}中，如果對所有的參與人i,si*是它的占優(yōu)戰(zhàn)略，那么所有參與人選擇的戰(zhàn)略組合（s1*,…,sn*）成為該對策的占優(yōu)戰(zhàn)略均衡。43a一、占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略：不管對手戰(zhàn)略為何，該參與人可找到一一、占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略：不管對手戰(zhàn)略為何，該參與人可找到一案例1：囚犯困境抵賴坦白抵賴-1，-1-9，0坦白0，-9-6，-6支付嫌疑人B嫌疑人A44a案例1：囚犯困境支付嫌疑人B嫌疑人A44a案例1：囚犯困境支付嫌疑人B嫌疑人A44a案例1：囚犯困“囚犯困境”的擴展兩個寡頭企業(yè)選擇產量公共產品的供給軍備競賽經濟改革結論：一種制度安排，要發(fā)生效力。必須是一種納什均衡；否則，制度安排便不能成立。45a“囚犯困境”的擴展兩個寡頭企業(yè)選擇產量45a“囚犯困境”的擴展兩個寡頭企業(yè)選擇產量45a“囚犯困境”價格大戰(zhàn)低價高價低價3，36，1高價1，65，5支付百事可樂可口可樂46a價格大戰(zhàn)支付百事可樂可口可樂46a價格大戰(zhàn)支付百事可樂可口可樂46a價格大戰(zhàn)支付百事可樂可口可案例2：智豬博弈豬圈里圈兩頭豬，一頭大豬，一頭小豬。豬圈的一頭有一個豬食槽，另一頭安裝一個按鈕，控制著豬食的供應。按一下按鈕會有10個單位的豬食進槽，但誰按按鈕誰就要付出2個單位的成本。若大豬先到，大豬吃到9個單位，小豬只能吃1個單位；若同時到，大豬吃7個單位，小豬吃3個單位；若小豬先到，大豬吃6個單位，小豬吃4個單位。支付如表。47a案例2：智豬博弈豬圈里圈兩頭豬，一頭大豬，一頭小豬。豬圈的案例2：智豬博弈豬圈里圈兩頭豬，一頭大豬，一頭小豬。豬圈的案例2：智豬博弈按等待按5，14，4等待9，-10，0支付小豬大豬48a案例2：智豬博弈支付小豬大豬48a案例2：智豬博弈支付小豬大豬48a案例2：智豬博弈支付小智豬博弈的擴展股份公司承擔監(jiān)督經理職能的大股東與小股東股票市場上炒股票的大戶與小戶市場中大企業(yè)與小企業(yè)在研發(fā)、廣告上的博弈公共產品的提供（富戶與窮戶）改革中不同利益分配對改革的推動49a智豬博弈的擴展股份公司承擔監(jiān)督經理職能的大股東與小股東49a智豬博弈的擴展股份公司承擔監(jiān)督經理職能的大股東與小股東49a二、重復剔除的占優(yōu)戰(zhàn)略均衡絕對劣勢戰(zhàn)略：si是一絕對劣勢戰(zhàn)略當且僅當存在另一戰(zhàn)略si’Si使得ui(si,s-i)<ui(si’,s-i)對所有s-iS-i均成立。（si’未必是優(yōu)勢戰(zhàn)略）重復剔除的占優(yōu)戰(zhàn)略均衡：逐次刪去絕對劣勢戰(zhàn)略得到唯一的占優(yōu)戰(zhàn)略。50a二、重復剔除的占優(yōu)戰(zhàn)略均衡絕對劣勢戰(zhàn)略：si是一絕對劣勢戰(zhàn)略二、重復剔除的占優(yōu)戰(zhàn)略均衡絕對劣勢戰(zhàn)略：si是一絕對劣勢戰(zhàn)略例：重復剔除的占優(yōu)戰(zhàn)略均衡2，30，23，41，12，74，5參與人2LMR參與人1UD51a例：重復剔除的占優(yōu)戰(zhàn)略均衡例：重復剔除的占優(yōu)戰(zhàn)略均衡例重復剔除的占優(yōu)戰(zhàn)略均衡4，35，16，22，18，43，63，09，62，8參與人2LMR參與人1UDM52a例重復剔除的占優(yōu)戰(zhàn)略均衡例重復剔除的占優(yōu)戰(zhàn)略均衡例重復剔除的占優(yōu)戰(zhàn)略均衡1，01，33，00，20，13，00，22，45，3參與人2LMR參與人1UDM53a例重復剔除的占優(yōu)戰(zhàn)略均衡例重復剔除的占優(yōu)戰(zhàn)略均衡三、納什均衡定義：指一戰(zhàn)略組合有以下特性：當參與人持此戰(zhàn)略后，任一參與人均無誘因偏離這一均衡；s*=(s1*,…,sn*)=(si*,s-i*)是一納什均衡，當且僅當對所有參與人而言，ui(si*,s-i*)ui(si’,s-i*)對所有si’Si

均成立。簡單而言，當s1*是對s2*的最適反應，s2*也是s1*的最適反應時，（s1*,s2*）就是二人博弈的納什均衡。命題1：納什均衡在占優(yōu)戰(zhàn)略重復剔除解法中不會被剔除命題2：重復剔除的嚴格占優(yōu)戰(zhàn)略均衡一定是納什均衡。54a三、納什均衡定義：指一戰(zhàn)略組合有以下特性：當參與人持此戰(zhàn)略后三、納什均衡定義：指一戰(zhàn)略組合有以下特性：當參與人持此戰(zhàn)略后例納什均衡求解0，44，05，34，00，45，33，53，56，6參與人2LMR參與人1UDM55a例納什均衡求解參與人2例納什均衡求解參與人2作業(yè)7，76，67，65，75，88，56，65，84，8乙左中右上中下甲一個兩人同時博弈的支付競爭如下所示，試求納什均衡。是否存在重復剔除占優(yōu)戰(zhàn)略均衡？56a作業(yè)7，76，67，65，75，88，56，65，84，8作業(yè)7，76，67，65，75，88，56，65，84，8第三節(jié)納什均衡應用舉例古諾（Cournot）寡頭模型沙灘賣冰豪泰林（Hotelling）價格競爭模型公共地的悲劇57a第三節(jié)納什均衡應用舉例古諾（Cournot）寡頭模型57a第三節(jié)納什均衡應用舉例古諾（Cournot）寡頭模型57a一、古諾寡頭模型特點：存在兩家廠商；同時行動確定產量。通過預測另一家廠商的產量來選擇自己的利潤最大化產量，尋求預測均衡。廠商1表示為：maxp(y1+y2e)y1-c(y1)，得出y1=f1(y2e)，同理得出y2=f2(y1e)，稱為反應函數(shù)，兩條曲線的交點為古諾模型的解。58a一、古諾寡頭模型特點：存在兩家廠商；同時行動確定產量。58a一、古諾寡頭模型特點：存在兩家廠商；同時行動確定產量。58a古諾寡頭模型的納什均衡反應函數(shù)y1=f1(y2)y2=f2(y1)（y1*,y2*）是該對策的納什均衡解。y1*y12y11

y10y2*y22y21y1oy2f1(y2)f2(y1)59a古諾寡頭模型的納什均衡反應函數(shù)y1*y12y11y古諾寡頭模型的納什均衡反應函數(shù)y1*y12y11y例題：古諾模型的解假設p=a-(y1+y2)，C1=y1c，C2=y2c則根據(jù)利潤最大化的一階條件分別得到反應函數(shù)y1=f1(y2)=(a-y2-c)/2，y2=f2(y1)=(a-y1-c)/2，求出均衡產量為（1/3(a-c)，1/3(a-c)），為納什均衡，均衡利潤為（1/9(a-c)2，1/9(a-c)2）60a例題：古諾模型的解假設p=a-(y1+y2)，C1=y1c，例題：古諾模型的解假設p=a-(y1+y2)，C1=y1c，古諾模型的解：與壟斷市場的比較假設為一壟斷企業(yè)，則有：

Max=y(a-y-c),得到壟斷企業(yè)的最優(yōu)產量

y=1/2(a-c)y1+y2=2/3(a-c)

壟斷利潤為=1/4(a-c)22/9(a-c)2寡頭競爭的總產量大于壟斷產量的原因在于每個企業(yè)在選擇自己的最優(yōu)產量時，只考慮對本企業(yè)利潤的影響，而忽視對另一個企業(yè)的外部負效應。61a古諾模型的解：與壟斷市場的比較假設為一壟斷企業(yè)，則有：61a古諾模型的解：與壟斷市場的比較假設為一壟斷企業(yè)，則有：61a寡頭廠商與壟斷廠商的比較1/3(a-c)1/2(a-c)1/2(a-c)y1oy2f1(y2)f2(y1)1/3(a-c)62a寡頭廠商與壟斷廠商的比較1/3(a-c)1/2寡頭廠商與壟斷廠商的比較1/3(a-c)1/20???1二、沙灘賣冰假設游客沿沙灘{0，1}間均勻分布，現(xiàn)有兩位賣冰者，他們會將攤位選在哪個位置？假設游客就近購買。生活中還有哪些類似的例子？63a0??0??三、豪泰林模型寡頭企業(yè)競爭戰(zhàn)略是價格伯川德（Bertrand）模型：產品同質，均衡價格等于邊際成本，類似于完全競爭市場均衡。豪泰林（Hotelling）模型：存在產品差異，均衡價格不等于邊際成本，壟斷性提高64a三、豪泰林模型寡頭企業(yè)競爭戰(zhàn)略是價格64a三、豪泰林模型寡頭企業(yè)競爭戰(zhàn)略是價格64a三、豪泰林模型寡頭假定長度為1的線性城市，消費者均勻分布在[0，1]區(qū)間內，分布密度為1；兩個商店1、2分別位于x=0，x=1，即城市的兩端；消費者購買商品的旅行成本與商店的距離成反比，單位距離的成本為t；住在x的消費者在兩個商店之間是無差異的，需求D1=x，D2=1-x，x滿足：p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。0x1商店1商店2豪泰林模型：以空間上差異為例65a假定長度為1的線性城市，消費者均勻分布在[0，1]區(qū)間內，分假定長度為1的線性城市，消費者均勻分布在[0，1]區(qū)間內，分豪泰林模型：以空間上差異為例根據(jù)兩個商店的利潤函數(shù)，1=(p1-c)x,2=(p2-c)(1-x)選擇使利潤最大化的價格，得到一階條件，求得p1*=p2*=c+t，均衡利潤1=2=t/2旅行成本越高，產品差異越大，均衡價格從而均衡利潤也越高。原因：隨著旅行成本上升，不同商店出售的產品之間的替代性下降，每個商店對附近的消費者的壟斷能力加強，當旅行成本為零時，不同商店的產品之間具有完全的替代性，則為伯川德均衡結果。66a豪泰林模型：以空間上差異為例根據(jù)兩個商店的利潤函數(shù)，1=(豪泰林模型：以空間上差異為例根據(jù)兩個商店的利潤函數(shù)，1=(四、公共地的悲劇生物學家和生態(tài)學家哈丁（GarrettHarden）在《科學》（1968年，第162卷）發(fā)表《公地的悲劇》?？紤]一塊對所有的人都開放的牧場，在著的制度下，可以預期，每一個放牧的人都會在公地上放牧盡可能多的牲口。增加一頭牲口既有正效用，也有負效用。正效用是牲口的銷售收入，增加一頭為+1負效用使每增加一頭帶來的過度放牧的損失，每一個放牧著承擔-1/n放牧者合理的決策是增加牲口，直至馬瘦毛長，公地毀滅。67a四、公共地的悲劇生物學家和生態(tài)學家哈丁（GarrettHa四、公共地的悲劇生物學家和生態(tài)學家哈丁（GarrettHa四、公共地的悲劇資源沒有排他性產權：草地放牧、公海捕魚、小煤窯的過度開發(fā)；另一類是人們向其中排放廢物的公地。草地放牧：n個農民，每個擁有羊的數(shù)量為gi，G=gi，v(G)代表每只羊的價值，與草地上放牧的總數(shù)G相關，飼養(yǎng)量增加到一定程度，隨著數(shù)量繼續(xù)增加，羊的價值會下降，即v’(G)<0農民的利潤函數(shù)i=giv(gj)-gic最優(yōu)化的一階條件：i/gi=v(G)+giv’(G)-c=0增加一只羊有正效應（羊的價值）、負效應（新增羊使之前所有羊的價值下降）個人邊際成本小于社會邊際成本，個人最優(yōu)決定的飼養(yǎng)總量大于社會最優(yōu)決定的飼養(yǎng)總量68a四、公共地的悲劇資源沒有排他性產權：草地放牧、公海捕魚、小煤四、公共地的悲劇資源沒有排他性產權：草地放牧、公海捕魚、小煤五、斗雞博弈0，00，2退2，0-3，-3進退進12支付69a五、斗雞博弈0，00，2退2，0-3，-3進退進12支付五、斗雞博弈0，00，2退2，0-3，-3進退進12支付“斗雞博弈”的擴展夫妻間吵架警察與游行隊伍公共產品的供給（兩富戶修路）70a“斗雞博弈”的擴展夫妻間吵架70a“斗雞博弈”的擴展夫妻間吵架70a“斗雞博弈”的擴展夫妻間吵第四節(jié)混合戰(zhàn)略納什均衡71a第四節(jié)混合戰(zhàn)略納什均衡71a第四節(jié)混合戰(zhàn)略納什均衡71a第四節(jié)混合戰(zhàn)略納什均衡71a混合戰(zhàn)略（mixedstrategies）定義：*=(1*,…,n*)=(i*,-i*)是一納什混合戰(zhàn)略均衡，當且僅當對所有參與人而言，i*是-i*的最適反應，ui(i*,-i*)ui(I’,-i*)，對所有i’i成立)。持混合戰(zhàn)略的前提是在均衡時兩種戰(zhàn)略的報酬會相等，是預期支付最大化的推導結果。72a混合戰(zhàn)略（mixedstrategies）定義：*=(混合戰(zhàn)略（mixedstrategies）定義：*=(擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支付

p1-pq1-q參與人1:maxEu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1))=-pq+q-pq+p-pq-1+q+p-pq=-4pq+2q+2p-1一階條件為零求得：p=1/273a擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支擲硬幣的分析給定參與人1（q,1-q），參與人2的支付是：q+(-1)(1-q)（正面）=(-1)q+(1-q)（反面）;給定參與人2（p,1-p），參與人1的支付為：p(-1)+(1-p)（正面）=p+(-1)(1-p)（反面）；求得（1/2，1/2）是納什混合戰(zhàn)略均衡如果兩種戰(zhàn)略報酬不相等，那么就變?yōu)榧儜?zhàn)略（purestrategies）了。74a擲硬幣的分析給定參與人1（q,1-q），參與人2的支付是：q擲硬幣的分析給定參與人1（q,1-q），參與人2的支付是：q混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對方知道或猜到自己的選擇，因而必須在決策時利用隨機性；兩博弈方選擇每種策略的概率一定要恰好使對方無機可乘，即讓對方無法通過針對性地傾向某一策略而在博弈中占上風。例：在擲硬幣的博弈中，參與人1選正面、反面的概率q,1-q，一定要使參與人2選正面的和反面的期望得益相等。75a混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對方知道或猜到自己的選擇混合戰(zhàn)略均衡的博弈原則兩博弈方不能讓對方知道或猜到自己的選擇單純戰(zhàn)略與混合戰(zhàn)略的定義G={N,S,U}是一個戰(zhàn)略式有限博弈，參與人i的戰(zhàn)略空間S中的任一元素si稱為i的一個單純戰(zhàn)略（purestrategy）；定義在Si上的一個概率分布函數(shù)pi(si)代表了一個混合戰(zhàn)略（mixedstrategy）——這個戰(zhàn)略的內容是：參與人i以概率pi(sij)選擇單純戰(zhàn)略sij，而pi(sij)=1。單純戰(zhàn)略是混合戰(zhàn)略的特例，因為任一單純戰(zhàn)略si都可以理解為i以概率1選擇si，以0概率選取其他所有單純戰(zhàn)略。引入混合戰(zhàn)略，參與人的目標需要修改為“最大化自己的期望支付”76a單純戰(zhàn)略與混合戰(zhàn)略的定義G={N,S,U}是一個戰(zhàn)略式有限博單純戰(zhàn)略與混合戰(zhàn)略的定義G={N,S,U}是一個戰(zhàn)略式有限博Selton：小偷和守衛(wèi)的博弈

一小偷欲偷竊有一守衛(wèi)看守的倉庫，如果小偷偷竊時守衛(wèi)在睡覺，則小偷就能得手，偷得價值為V的贓物；如果小偷偷竊時守衛(wèi)沒有睡覺，則小偷就會被抓住。設小偷被抓后要坐牢，負效用為-P，守衛(wèi)睡覺而未遭偷竊有S的正效用，因睡覺被竊要被解雇，其負效用為-D。而如果小偷不偷，則他既無得也無失，守衛(wèi)不睡意味著出一份力掙一分錢，他也沒有得失。77aSelton：小偷和守衛(wèi)的博弈一小偷欲偷Selton：小偷和守衛(wèi)的博弈一小偷欲偷睡不睡偷V，-D-P，0不偷0，S0，0小偷守衛(wèi)支付小偷與守衛(wèi)的博弈78a小偷守衛(wèi)支付小偷與守衛(wèi)的博弈78a小偷守衛(wèi)支付小偷與守衛(wèi)的博弈78a小偷守衛(wèi)支付小偷與守衛(wèi)的博守衛(wèi)得益（睡）S01pt（小偷偷的概率）pt*pt*/-D-D/小偷的混合策略S到-D連線的縱坐標是在橫坐標對應的小偷“偷”竊概率下的守衛(wèi)選擇“睡”的期望得益，即S(1-pt)+(-D)pt加重對守衛(wèi)的處罰在短期中的效果是使守衛(wèi)真正盡職，但在長期中恰恰是會降低盜竊發(fā)生的概率（激勵的悖論）79a守衛(wèi)得益（睡）S01pt（小偷偷的概率）pt*pt*/-D-守衛(wèi)得益（睡）S01pt（小偷偷的概率）pt*pt*/-D-小偷得益（偷）V01Pg（守衛(wèi)睡的概率）Pg*Pg*/-P-P/守衛(wèi)的混合策略小偷的混合策略分布不受P的影響，因此政府加重對小偷的懲罰在長期中并不能抑制盜竊，最多只能抑制短期的盜竊發(fā)生率，它的作用主要是使守衛(wèi)可以更多地偷懶80a小偷得益（偷）V01Pg（守衛(wèi)睡的概率）Pg*Pg*/-P-小偷得益（偷）V01Pg（守衛(wèi)睡的概率）Pg*Pg*/-P-齊威王田忌賽馬古代齊威王與大將田忌賽馬，田忌的謀士孫臏運用計謀幫助田忌以弱勝強。比賽規(guī)則：田忌與齊威王各出三匹馬，一對一比賽三場，每一場的輸方要賠1000斤銅給贏方。雙方的馬按實力都可以分為上、中、下，但齊威王的上、中、下均優(yōu)于田忌的上、中、下。實際上，田忌的上馬、中馬要優(yōu)于齊威王的中馬、下馬。比賽結果：田忌連輸三場；后孫臏建議，以上對中、以中對下、以下對上，結果以2：1贏得比賽。81a齊威王田忌賽馬古代齊威王與大將田忌賽馬，田忌的謀士孫臏運用計齊威王田忌賽馬古代齊威王與大將田忌賽馬，田忌的謀士孫臏運用計前述為單方面運用策略的故事，如果齊威王預料到田忌的做法，必然會改變各匹馬出場的次序。本博弈中博弈雙方的利益是完全對立的，是嚴格競爭的零和博弈，不會有純策略納什均衡，必然是一個混合策略均衡。假設齊威王采取六種戰(zhàn)略的概率分別為pa,pb,pc,pd,pe,pf（加總為1）,則田忌采取六種戰(zhàn)略的期望得益相等，則得出齊威王與田忌均以1/6的相同概率隨機選擇各自的六個純策略，構成本博弈唯一的混合策略納什均衡。齊威王田忌賽馬82a前述為單方面運用策略的故事，如果齊威王預料到田忌的做法，必然前述為單方面運用策略的故事，如果齊威王預料到田忌的做法，必然上中下上下中中上下中下上下上中下中上上中下3，-31，-11，-11，-1-1，11，-1上下中1，-13，-31，-11，-11，-1-1，1中上下1，-1-1，13，-31，-11，-11，-1中下上-1，11，-11，-13，-31，-11，-1下上中1，-11，-11，-1-1，13，-31，-1下中上1，-11，-1-1，11，-11，-13，-3齊威王田忌齊威王田忌賽馬83a上中下上下中中上下中下上下上中下中上上中下3，-31，-11上中下上下中中上下中下上下上中下中上上中下3，-31，-11齊威王田忌賽馬在上述混合策略下，齊威王的期望得益為1/6（3+1+1+1+1-1）=1；田忌的期望得益為1/6（1-3-1-1-1-1）=-1，即多次進行這樣的賽馬，齊威王平均每次能贏田忌1000斤銅，這是因為齊威王三匹馬的總體實力略勝田忌三匹馬總體實力的緣故84a齊威王田忌賽馬在上述混合策略下，齊威齊威王田忌賽馬在上述混合策略下，齊威混合策略反應函數(shù)將博弈方的策略空間擴展到包括混合策略，將納什均衡擴展到包括混合策略納什均衡以后，求納什均衡反應函數(shù)的分析方法也可以擴展到求混合策略納什均衡。反應函數(shù)即一博弈方對另一博弈方每種可能的決策內容的最佳反映決策構成的函數(shù)。在純策略的范疇內，反應函數(shù)是各博弈方選擇的純策略對其他博弈方純策略的反應。在混合策略的范疇內，博弈方的決策內容為選擇概率分布，反應函數(shù)就是一方對另一方的概率分布的反應。85a混合策略反應函數(shù)將博弈方的策略空間擴展到包括混合策略，將納什混合策略反應函數(shù)將博弈方的策略空間擴展到包括混合策略，將納什擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支付

1-q1-pp86a擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支pq01/2111/2p1=f(q)q2=f(p)當2出正面的概率q1/2，1出正面的概率為1，因為他出正面得到的預期收益大于他出反面；當2出正面的概率q1/2，1出正面的概率為0，因為他出反面的期望收益大于他出正面。87apq01/2111/2p1=f(q)q2=f(p)當2出正面pq01/2111/2p1=f(q)q2=f(p)當2出正面第五節(jié)納什均衡的存在性與多重性88a第五節(jié)納什均衡的存在性與多重性88a第五節(jié)納什均衡的存在性與多重性88a第五節(jié)納什均衡的存在混合戰(zhàn)略納什均衡純戰(zhàn)略納什均衡重復剔除占優(yōu)均衡占優(yōu)均衡不同均衡概念之間的關系89a占優(yōu)均衡不同均衡概念之間的關系89a占優(yōu)均衡不同均衡概念之間的關系89a占優(yōu)均衡不同均衡概念之間納什均衡的存在性每個有限戰(zhàn)略式博弈（參與人與戰(zhàn)略數(shù)目均為有限）都有納什均衡存在，這均衡有可能是混合戰(zhàn)略均衡納什均衡的多重性納什均衡不唯一，如性別戰(zhàn)90a納什均衡的存在性90a納什均衡的存在性90a納什均衡的存在性90a案例性別戰(zhàn)1，30，0足球0，02，1時裝足球時裝妻子支付

p1-pq1-q丈夫91a案例性別戰(zhàn)1，30，0足球0，02，1時裝足球時裝妻子支付案例性別戰(zhàn)1，30，0足球0，02，1時裝足球時裝妻子支付性別戰(zhàn)：混合策略均衡給定妻子分別以q,1-q的概率選擇時裝、足球，則丈夫選擇時裝、足球的期望收益相等，即1.q+0.(1-q)=0.q+3.(1-q)，解得妻子選擇時裝、足球的概率分別為（3/4，1/4）給定丈夫分別以p,1-p的概率選擇時裝、足球，則妻子選擇時裝、足球的期望收益相等，即2.p+0.(1-p)=0.p+1.(1-p)，解得妻子選擇時裝、足球的概率分別為（1/3，2/3）92a性別戰(zhàn)：混合策略均衡給定妻子分別以q,1-q的概率選擇時裝、性別戰(zhàn)：混合策略均衡給定妻子分別以q,1-q的概率選擇時裝、當妻子以（3/4，1/4）的概率分布隨機選擇時裝表演和足球，丈夫以（1/3，2/3）的概率隨機選擇時裝表演和足球時，雙方都無法通過單獨改變策略，即單獨改變隨機選擇純策略的概率分布而提高利益，因此雙方的上述概率分布的組合構成一個混合策略納什均衡。該混合策略納什均衡給妻子和丈夫各自帶來的期望收益分別為：q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4雙方的期望收益均小于純策略時的期望收益。性別戰(zhàn)：混合策略均衡93a當妻子以（3/4，1/4）的概率分布隨機選擇時裝表演和足球，當妻子以（3/4，1/4）的概率分布隨機選擇時裝表演和足球，qp01/3113/4q1=f(p)p2=f(q)夫妻之爭兩博弈方的反應函數(shù)如果p1/3，則妻子選擇時裝的期望得益小于選擇足球，因此妻子應選擇足球，即q=0；如果p1/3，則妻子選擇時裝的期望得益為大于選擇足球的得益，因此選時裝，即p=194aqp01/3113/4q1=f(p)p2=f(q)夫妻之爭兩qp01/3113/4q1=f(p)p2=f(q)夫妻之爭兩焦點均衡（focalpoint）當一個博弈有多個納什均衡時，博弈論并沒有一個一般的理論來證明納什均衡結果一定會出現(xiàn)。在現(xiàn)實生活中，參與人可能使用某些被博弈模型抽象掉的信息來達到一個“焦點”均衡。這些信息可能與社會文化習慣、參與人過去博弈的歷史有關。例，在性別戰(zhàn)中，如果今天是丈夫的生日，（足球、足球）可能是一個焦點均衡；而如果是妻子的生日，（時裝、時裝）可能是一個焦點均衡。還有分蛋糕等。95a焦點均衡（focalpoint）當一個博弈有多個納什均衡時焦點均衡（focalpoint）當一個博弈有多個納什均衡時課堂練習：求納什均衡2，40，0音樂會1，14，2足球音樂會足球男方女方支付

p1-pq1-q96a課堂練習：求納什均衡2，40，0音樂會1，14，2足球音樂會課堂練習：求納什均衡2，40，0音樂會1，14，2足球音樂會市場進入阻撓0，3000，300不進入-10，040，50進入斗爭默許進入者在位者支付威脅是可置信的嗎？97a市場進入阻撓0，3000，300不進入-10，040，50市場進入阻撓0，3000，300不進入-10，040，50作業(yè)1

春節(jié)前夕，某小鎮(zhèn)上兩個商鋪主甲和乙同時看到一個賺錢機會：去城里販一批鞭炮回來零售，購貨款加上運輸費用共5000元，如果沒有競爭對手，這批貨在小鎮(zhèn)上能賣6000元；但如果另一家商鋪同時在小鎮(zhèn)上賣鞭炮，價格下跌使得這批鞭炮只能賣4000元。請用戰(zhàn)略式表示支付矩陣；請找出納什均衡。98a作業(yè)1春節(jié)前夕，某小鎮(zhèn)上兩個商鋪主甲和乙同時看到一個賺錢作業(yè)1春節(jié)前夕，某小鎮(zhèn)上兩個商鋪主甲和乙同時看到一個賺錢作業(yè)二2，01，14，23，41，22，31，30，23，0乙左中右上中下甲一個兩人同時博弈的支付競爭如下所示，試求納什均衡。是否存在重復剔除占優(yōu)戰(zhàn)略均衡？99a作業(yè)二2，01，14，23，41，22，31，30，23，0作業(yè)二2，01，14，23，41，22，31，30，23，0第二章完全信息動態(tài)博弈博弈的擴展式表述子博弈精煉納什均衡子博弈精煉納什均衡舉例重復博弈和無名氏定理100a第二章完全信息動態(tài)博弈博弈的擴展式表述100a第二章完全信息動態(tài)博弈博弈的擴展式表述100a第二章完全第一節(jié)博弈的擴展式表述101a第一節(jié)博弈的擴展式表述101a第一節(jié)博弈的擴展式表述101a第一節(jié)博弈的擴展式表述10完全信息動態(tài)博弈一般以擴展型式來表示：G=(N,H,P,I,U)，包括5要素：（1）局中人N；（2）歷史H:博弈樹是一個多環(huán)節(jié)與枝干的集合，從單一的起始環(huán)節(jié)，直到終結環(huán)節(jié)，代表博弈歷史；（3）對每個環(huán)節(jié)的分配法則P:將每個環(huán)節(jié)（除終結環(huán)節(jié)外）分配給不同的局中人，并賦予行動時可選的策略；（4）局中人行動時的信息集合I；（5）對應局中人可能選擇策略，各局中人在終結環(huán)節(jié)所得到的報酬U。102a完全信息動態(tài)博弈一般以擴展型式來表示：G=(N,H,P,I,完全信息動態(tài)博弈一般以擴展型式來表示：G=(N,H,P,I,122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）戰(zhàn)略式表述(strategicformrepresentation)多用矩陣2,2-1,-1-1,-11,12LSLS1擴展式表述(extensiveformrepresentation)多用博弈樹戰(zhàn)略式與擴展式103a122LLSSLS（2，2）（-1，-1）（-1，-1）（1122LLSSLS（2，2）（-1，-1）（-1，-1）（1-3，-3-3，-31，01，00，10，00，10，0AB（進入，進入）進入不進入（進入，不進入）（不進入，進入）（不進入，不進入）市場進入博弈的標準式進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0市場進入的擴展式104a-3，-3-3，-31，01，00，10，00-3，-3-3，-31，01，00，10，00在市場進入博弈中：A有兩個行動：“進入”、“不進入”。由于是先行動者，只有兩個戰(zhàn)略：選擇“進入”或“不進入”。

B有兩個行動：“進入”、“不進入”。但是，有4個戰(zhàn)略：(1)若A選擇“進入”，B選擇“進入”，若A選擇“不進入”，B選擇“進入”，即

（進入，進入）(2)若A選擇“進入”，B選擇“進入”，若A選擇“不進入”，B選擇“不進入”，即

（進入，不進入）(3)若A選擇“進入”，B選擇“不進入”，若A選擇“不進入”，B選擇“不進入”，即（不進入，進入）(4)若A選擇“進入”，B選擇“不進入”，若A選擇“不進入”，B選擇“不進入”，即（不進入，不進入）105a在市場進入博弈中：A有兩個行動：“進入”、“在市場進入博弈中：A有兩個行動：“進入”、“博弈樹的構成1．結(nodes)：結包括決策結(decitionnodes)和終點結(terminalnodes)兩類。決策結是參與人采取行動的時點，終點結是博弈行動路徑的終點。在博弈樹中，“誰在什么時候行動”用在決策結旁邊標注參與人的辦法來表示。參與人的支付標注在博弈樹終點結處。2．枝(branches)：在博弈樹上，枝是從一個決策結到它的直接后續(xù)結的連線，每一個枝代表參與人的一個行動選擇。3．信息集(informationsets)：博弈樹上的所有決策結分割成不同的信息集。每一個信息集是決策結集合的一個子集。該子集包括所有滿足下列條件的決策結：(1)每一個決策結都是同一參與人的決策結；(2)該參與人知道博弈進入該集合的的某個決策結，但不知道自己究竟處于哪一個決策結。106a博弈樹的構成1．結(nodes)：結包括決策結(decit博弈樹的構成1．結(nodes)：結包括決策結(decit122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）

結nodes信息集分單節(jié)信息集和多節(jié)信息集；如果用虛線匡起來表示2知道自己位于信息集內，但不知道是哪一點，因為他沒能觀察到對手的行動；如果博弈樹的所有信息集都是單結的，稱為完美信息博弈107a122LLSSLS（2，2）（-1，-1）（-1，-1）（1122LLSSLS（2，2）（-1，-1）（-1，-1）（1122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）完美信息（perfectinformation）與

不完美信息(imperfectinformation)122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）不完美信息：2不能區(qū)分1是采用了L還是S完美信息：2能區(qū)分1是選擇了L還是S108a122LLSSLS（2，2）（-1，-1）（-1，-1）（1122LLSSLS（2，2）（-1，-1）（-1，-1）（1第二節(jié)

子博弈精煉納什均衡子博弈子博弈精煉納什均衡求解方法：逆向歸納法承諾行動與子博弈精煉納什均衡109a第二節(jié)

子博弈精煉納什均衡子博弈109a第二節(jié)

子博弈精一、子博弈（sub-game）子博弈定義：在一個擴展型博弈中，如果一個博弈由它的一個決策結及其所有后續(xù)結構成，并滿足（1）起始結是一個單結的信息結;（2）子博弈保留了原博弈的所有結構，則稱它為原博弈的一個子博弈（子博弈）。110a一、子博弈（sub-game）子博弈定義：在一個擴展型博弈中一、子博弈（sub-game）子博弈定義：在一個擴展型博弈中（1）起始結是一個單結的信息結122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）122LLSSLS（2，2）（-1，-1）（-1，-1）（1，1）x1x2111a（1）起始結是一個單結的信息結122LLSSLS（2，2）（（1）起始結是一個單結的信息結122LLSSLS（2，2）（（2）子博弈保留了原博弈的所有結構：子博弈的信息集和支付向量都直接繼承自原博弈122LLSSLSx1x23333112a（2）子博弈保留了原博弈的所有結構：子博弈的信息集和支付向量（2）子博弈保留了原博弈的所有結構：子博弈的信息集和支付向量進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0抵賴坦白ABB抵賴坦白坦白抵賴-1，-1-9，00，-9-6，-6在市場進入博弈中，包含3個子博弈（包括原博弈）。而在囚徒博弈中，只有一個子博弈（？）113a進入不進入ABB進入不進入不進入進入收益：-3，-31，進入不進入ABB進入不進入不進入進入收益：-3，-31，二、子博弈精煉納什均衡子博弈精煉納什均衡定義：在博弈G中，如果s*=(s1,…,sn)是G的一個納什均衡，并且對所有可能的子博弈而言仍是一個納什均衡，則稱s*=(s1,…,sn)為一個子博弈精煉納什均衡114a二、子博弈精煉納什均衡子博弈精煉納什均衡定義：114a二、子博弈精煉納什均衡子博弈精煉納什均衡定義：114a二市場進入博弈的納什均衡進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0-3，-3-3，-31，01，00，10，00，10，0AB（進入，進入）進入不進入（進入，不進入）（不進入，進入）（不進入，不進入）該博弈中有三個納什均衡：不進入，（進入，進入）進入，（不進入，進入）進入，（不進入，不進入）前兩個均衡的結果(進入，不進入)，即A進入，B不進入；第二個均衡結果是(不進入，進入)，即A不進入，B進入如果理論得到這樣的結果，無助于預測博弈參與人的行為。此外，納什均衡假定，每一個參與人選擇的最優(yōu)戰(zhàn)略是在所有其他參與人的戰(zhàn)略選擇給定時的最優(yōu)反應，即參與人并不考慮自己的選擇對其他人選擇的影響，因而納什均衡很難說是動態(tài)博弈的合理解。115a市場進入博弈的納什均衡進入不進入ABB進入不進入不進入進入收市場進入博弈的納什均衡進入不進入ABB進入不進入不進入進入收必須在多個納什均衡中剔除不合理的均衡解，即所謂“不可置信威脅”。子博弈精煉納什均衡是對納什均衡概念的最重要的改進。它的目的是把動態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開。正如納什均衡是完全信息靜態(tài)博弈解的基本慨念一樣，子博弈精煉納什均衡是完全信息動態(tài)博弈解的基本概念。①{不進入，（進入，進入）}②{進入，（不進入，進入）}③{進入，（不進入，不進入）}進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0前邊得到的三個納什均衡中，均衡①意味著當A不進入時，B選擇進入；而當A選擇進入時，B仍選擇進入（B威脅無論如何都要進入市場）。顯然，當A選擇進入時，B仍選擇進入是不合理的，如果A進入市場，B選擇“不進入”比選擇“進入”收益要更大，理性的B不會選擇進入，而A知道B是理性的，因此也不會把該戰(zhàn)略視為B會選擇的戰(zhàn)略。因此，B的戰(zhàn)略（進入，進入）是不可置信威脅。116a必須在多個納什均衡中剔除不合理的均衡解，即所謂“不可置信威脅必須在多個納什均衡中剔除不合理的均衡解，即所謂“不可置信威脅均衡③意味著當A進入時，B選擇不進入；而當A選擇不進入時，B仍選擇進入（B威脅無論如何都不進入市場）。顯然，當A選擇不進入時，B仍選擇不進入是不合理的，B的戰(zhàn)略是不可置信的。

①{不進入，（進入，進入）}②{進入，（不進入，進入）}③{進入，（不進入，不進入）}只有均衡②是合理的：如果A進入，B不進入；如果A不進入，B進入。因為A是先行動者，理性的A會選擇“進入”（他知道B是理性的，B不會選擇“進入”），而理性的B選擇“不進入”。觀察博弈樹上的三個均衡中，B的不可置信戰(zhàn)略中的反應，在第二階段B開始行動的兩個子博弈中不是最優(yōu)；而合理的納什均衡中，B的戰(zhàn)略在所有子博弈中都是最優(yōu)的，與A的第一階段可能選擇的行動構成該子博弈的納什均衡。進入不進入ABB進入不進入不進入進入收益：AB-3，-31，00，10，0①②③①②③117a均衡③意味著當A進入時，B選擇不進入；而均衡③意味著當A進入時，B選擇不進入；而只有當一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的時，它才是一個合理的、可置信的戰(zhàn)略。子博弈精煉納什均衡就是要剔除掉那些只在特定情況下是合理的而在其他情況下并不合理的行動規(guī)則。

子博弈精煉納什均衡：如果參與者的戰(zhàn)略在每一個子博弈中都構成了納什均衡，則稱納什均衡是子博弈精練的(澤爾滕，1965)。為簡單起見，假定博弈有兩個階段，第一階段參與人1行動，第2階段參與人2行動，并且2在行動前觀測到1的選擇。令A1是參與人1的行動空間，A2是參與人2的行動空間。當博弈進入第二階段，給定參與人1在第一階段的選擇為a1∈A1，參與人2面臨的問題是：顯然參與人2的最優(yōu)選擇a2*依賴于參與人1的選擇a1。用a2*＝R(a1)代表上述最優(yōu)化問題的解(即2的反應函數(shù))。因為參與人1應該預測到參與人2在博弈的第二階段將按a2*＝R(a1)的規(guī)則行動，參與人1在第一階段面臨的問題是：118a只有當一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況只有當一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況令上述問題的最優(yōu)解為a1*。那么，這個博弈的子博弈精煉納什均衡為{a1*,R2(a1)}，均衡結果為{a1*,R2(a1*)}。(a1*,R2(a1*))是一個精煉均衡，因為a2*＝R2(a1)在博弈的第二階段是最優(yōu)的。除a2*＝R2(a1)之外，任何其他的行為規(guī)則都不滿足精練均衡的要求。上述思路就是逆向歸納法尋找子博弈精煉納是均衡的基本思路。119a令上述問題的最優(yōu)解為a1*。那么，這個博弈的令上述問題的最優(yōu)解為a1*。那么，這個博弈的甲乙（2，2）（1，0）（3，1）上下左右乙（2，1）左右乙{左，左}{左，右}{右，左}{右，右}2，22，22，12，11，03，11，03，1

上下甲120a甲乙（2，2）（1，0）（3，1）上下左右乙（2，1）左右甲乙（2，2）（1，0）（3，1）上下左右乙（2，1）左右納什均衡子博弈精煉納什均衡三個納什均衡：（上，{左，左}）（下，{左，右}）（下，{右，右}）排除（上，{左，左}），（下，{右，右}），只有（下{左，右}）是子博弈精煉納什均衡121a納什均衡子博弈精煉納什均衡三個納什均衡：121a納什均衡子博弈精煉納什均衡三個納什均衡：121a納什均衡三、求解方法：逆推法

逆向歸納法求解子博弈精煉納什均衡的過程，實質是重復剔除劣戰(zhàn)略過程在擴展式博弈上的擴展：從最后一個決策結開始依次剔除掉每個子博弈的劣戰(zhàn)略，最后生存下來的戰(zhàn)略構成精煉納什均衡。如同重復剔除的占優(yōu)均衡要求“所有參與人是理性的”是共同知識一樣，用逆向歸納法求解均衡也要求“所行參與人是理性的”是共同知識。122a三、求解方法：逆推法逆向歸納法求解子博三、求解方法：逆推法逆向歸納法求解子博122軟軟脆脆軟脆（0，0）（10，20）（20，10）（0，0）逆推法：例1123a122軟軟脆脆軟脆（0，0）（10，20）（20，10）（0122軟軟脆脆軟脆（0，0）（10，20）（20，10）（0甲丙乙上東下西左右（4，2，3）（1，7，8）（5，3，4）（7，6，6）丙丙（2，1，9）（0，4，2）逆推法：例2124a甲丙乙上東下西左右（4，2，3）（1，7，8）（5，3，4）甲丙乙上東下西左右（4，2，3）（1，7，8）（5，3，4）進入者在位者（0，300）（40，50）（-10，0）不進入進入默許斗爭0，3000，300不進入-10，040，50進入斗爭默許進入者在位者支付逆推法：例3125a進入者在位者（0，300）（40，50）（-10，0）不進入進入者在位者（0，300）（40，50）（-10，0）不進入四、承諾行動（commitment）與

子博弈精煉納什均衡納什均衡之所以不是精煉均衡，是因為不可置信的威脅存在，如父母與子女之間的博弈。如果參與人在博弈前采取措施改變行動空間或支付函數(shù)，原來不可置信威脅就變得可置信，博弈的精煉均衡就會改變；將改變博弈結果而采取的措施稱為“承諾行動”完全承諾，如破釜沉舟、軍事博弈不完全承諾，增加行動成本126a四、承諾行動（commitment）與

子博弈精煉納什均衡納四、承諾行動（commitment）與

子博弈精煉納什均衡納承諾行動與博弈結果春節(jié)前夕，某小鎮(zhèn)上兩個商鋪主甲和乙同時看到一個賺

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論最全完整-講解課件

文檔簡介

溫馨提示

最新文檔

評論

博弈論最全完整-講解課件

文檔簡介

溫馨提示

最新文檔

評論

相關文檔