版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
微觀經(jīng)濟學主講人韓松第十章博弈論初步知識結(jié)構(gòu)知識結(jié)構(gòu)博弈論靜態(tài)博弈不完全信息動態(tài)博弈完全信息基本要素逆向歸納法博弈樹支付矩陣純策略均衡混合策略均衡條件策略下劃線法納什均衡囚徒困境第一節(jié)策略和行為一、博弈的定義企業(yè)行為相互影響,每個人進行的決策和采取的行動都會對其他人產(chǎn)生影響,根據(jù)其他人的可能反應來決定自己的決策和行動。在策略性環(huán)境中,所進行的策略性決策和采取的策略性行動就是所謂的博弈
(Game),進行博弈研究就是博弈論(GameTheory)。1944年馮·諾依曼和摩根斯頓共著《博弈論與經(jīng)濟行為》,將博弈論用于經(jīng)濟領(lǐng)域。第一節(jié)策略和行為一博弈的定義1769年,匈牙利的工程師坎比林為奧地利皇后做出一臺會“下”棋的機器。阿倫·圖靈的紙上機器。貝爾實驗室克勞迪·申朗提出的A策略和B策略。1951年,“計算機之父”——馮·諾依曼領(lǐng)導的研
究小組設(shè)計出ENIAC一號。[資料]下棋的機器[資料]下棋的機器李世石與谷歌AlphaGo進行最后一輪較量,最終人機大戰(zhàn)的總比分定格在1:
4。[視頻]圍棋人機大戰(zhàn)[視頻]圍棋人機大戰(zhàn)第一節(jié)策略和行為二、要素和類型參與者:進行決策的個體至少有兩個,有時可引入一個虛擬參與人如“自然”;策略:在一項規(guī)則下一組可選擇行動集合;支付:各自的報酬,即所得到的支付,都是所有策略共同作用的結(jié)果——支付組合。從多角度進行博弈分類,如兩人博弈和多人博弈、零和博弈和非零和博弈、有限博弈和無限博弈、同時博弈和動態(tài)博弈。第一節(jié)策略和行為二要素和類型合作博弈與非合作博弈:能否達成有約束力協(xié)議;重復博弈與非重復博弈:具有連續(xù)性的特點;零和博弈與非零和博弈:你的所失正是我的所得。完全且完美信息博弈完全但不完美信息博弈不完全信息博弈海薩尼轉(zhuǎn)換(含自然)[資料]博弈的類型[資料]博弈的類型類型區(qū)別內(nèi)容完全信息針對策略集和支付集完美信息針對記憶(過程),信息結(jié)點是唯一的第二節(jié)純策略均衡一、寡頭和支付矩陣假定在某個寡頭市場上有甲、乙兩個廠商。列出一個只有兩方廠商參加并且同時進行決策的簡單博弈。用一個以二元數(shù)組為元素的矩陣
(亦稱博弈矩陣或支付矩陣)進行描述和分析。第二節(jié)純策略均衡一寡頭和支付矩陣甲廠商合作不合作乙廠商合作不合作51235617第二節(jié)純策略均衡二、條件策略和組合把甲廠商在乙廠商選擇合作條件下最優(yōu)策略(不合作)叫做甲廠商的條件優(yōu)勢策略,因此與這一條件策略相聯(lián)系的策略組合就叫條件優(yōu)勢策略組合。條件策略包括參與人的條件策略及組合。第二節(jié)純策略均衡二條件策略和組合甲廠商合作不合作乙廠商合作不合作51235617一位日本的收藏家無法決定讓誰來拍賣畫作,于是要求佳士得與蘇富比老板猜拳定勝負。佳士得老板向員工們討教猜拳策略,最后,在一名主管11歲女兒建議下,決定出招……[思考]猜拳出什么招?[思考]猜拳出什么招第二節(jié)純策略均衡三、納什均衡當廠商的條件策略組合恰好相同,從而都不再有單獨改變策略的傾向時,整個博弈就達到均衡是博弈的解,稱為納什均衡。納什均衡是參與者在該策略組合上,任何單獨改變策略都不會得到好處;當所有其他人都不改變時,沒有人會改變自己的策略。假定支付不變時,由于存在著成本和風險,參與者也不愿意單獨地改變策略。第二節(jié)純策略均衡三納什均衡天才與瘋子僅有一線之隔,瘋子變常人的欣慰等同對天才淪為平庸的惋惜。[視頻]納什的命運[視頻]納什的命運[案例]華容道的納什均衡孔明曰:“亮夜觀乾象,操賊未合身亡。留這人情,教云長做了,亦是美事?!毙略唬骸跋壬袼?,世所罕及![案例]華容道的納什均衡孔明小道大路曹操小道大路逃脫空等拿下被捉拿下被捉逃脫空等小豬按鍵等待大豬按鍵等待9-1001544[案例]孫劉的智豬博弈孔明笑曰:“亮借一帆風,直至江東,憑三寸不爛之舌,說南北兩軍互相吞并。若南軍勝,共誅曹操以取荊州之地;若北軍勝,則我乘勢以取江南可也?!鼻G州是赤壁之戰(zhàn)最重要的戰(zhàn)果之一,卻被出力很少的劉備摘去了。[案例]孫劉的智豬博弈第二節(jié)純策略均衡四、下劃線法條件均衡策略,用下劃線分別來表示甲廠商和乙廠商的條件策略。在甲廠商的支付矩陣中,找出每一列的最大數(shù)字;在乙廠商的支付矩陣中,找出每一行的最大數(shù)字。都有下劃線的組合。第二節(jié)純策略均衡四下劃線法甲廠商合作不合作乙廠商合作不合作51235617————第二節(jié)純策略均衡五、納什均衡的特性在同時博弈中,純策略的納什均衡有可能存在也可能不存在。在納什均衡存在的條件下,它可能是惟一的也可能不惟一。如果納什均衡存在,它可能是最優(yōu)的也可能不是最優(yōu)的。第二節(jié)純策略均衡五納什均衡的特性甲廠商合作不合作乙廠商合作不合作41235614————第二節(jié)純策略均衡六、囚徒困境無論其他參與者采取什么策略,某一參與者惟一的最優(yōu)策略就是他的占優(yōu)策略,任何一方都不想偏離各自認為的最優(yōu)策略。囚徒困境(Prisoners’
Dilemma)反映個人理性和團體理性的沖突,從個人理性角度出發(fā)選擇占優(yōu)策略結(jié)局,從整體來看卻是最差的。根據(jù)“看不見的手”的原理,理性人在追求自己利益中,會同時增進整體福利。第二節(jié)純策略均衡六囚徒困境[案例]空城計的占優(yōu)策略諸葛亮對司馬懿的思想軌跡是相當了解;諸葛亮的行徑司馬懿也能做出理性判斷。[案例]空城計的占優(yōu)策略曹家使用殺掉司馬捉拿放走2010-151-103-158諸葛守城棄城司馬進攻撤退平手逃脫××被捉拿下拿下被捉雙方都存在著偷換策略的誘惑,不穩(wěn)定狀態(tài)。即使兩個囚徒事先訂立攻守同盟(死不坦白),最終也將會背叛同盟。每個囚徒希望對方選擇抵賴而自己坦白從而獲釋;當他們都這么想并這么做的時候,就形成都坦白的左上角結(jié)局。甲方坦白不坦白乙方坦白不坦白-200-1-1-8-80-20————[案例]囚徒困境[案例]囚徒困境第三節(jié)混合策略均衡一、混合策略組合將純策略賦予不同的概率向量,是參與人的某種混合策略。形成期望支付,求得條件混合策略。第三節(jié)混合策略均衡一混合策略組合甲廠商上下乙廠商左右19284637q1
q2p1p2————在每一個參與人都只有有限多個純策略的博弈中,至少存在一個混合策略納什均衡。第三節(jié)混合策略均衡二、混合策略均衡第三節(jié)混合策略均衡二混合策略均衡op1q111乙廠商0.50.7甲廠商·e·······▲▲1/21/2▲▲▲▲1×1/2▲▲1×1/2[思考]快餐店會扎堆么?[思考]快餐店會扎堆么第四節(jié)動態(tài)博弈一、競爭者-壟斷者威脅策略一定具有可信性,才能起到作用。第四節(jié)動態(tài)博弈一競爭者-壟斷者壟斷者容忍抵抗競爭者進入退出023021-24壟斷者容忍抵抗競爭者進入退出053041-22“中國人不怕原子彈,死一半也沒什么,照樣接著搞社會主義?!睆姍?quán)政治、單邊主義和恐怖活動都增加著文明毀滅的危險——局部核戰(zhàn)爭已是不可忽視的現(xiàn)實威脅?!半y道上個世紀的夢魘又回來了嗎???”[案例]核武環(huán)峙中國[案例]核武環(huán)峙中國第四節(jié)動態(tài)博弈二、博弈樹博弈樹模型又稱為擴展型博弈模型,用博弈樹來描述的序貫博弈又叫做擴展型博弈。第四節(jié)動態(tài)博弈二博弈樹競爭者壟斷者abc壟斷者進入退出容忍抵抗容忍抵抗defg(1,4)(-2,2)(0,5)(0,3)起點中間點終點·······蒙特卡洛樹搜索,借助價值網(wǎng)絡與策略網(wǎng)絡,最初通過模仿人類玩家,嘗試匹配職業(yè)棋手。一旦達到一定的熟練程度,它開始和自己對弈,強化學習,它在用技巧,根本沒有用力氣。[資料]AlphaGo的AI[資料]AlphaGo的AI第四節(jié)動態(tài)博弈三、逆向歸納法在所有的納什均衡中,找到最有可能實現(xiàn)的策略組合,這就是對納什均衡的精練。逆向歸納法的兩個步驟:第一,從最后階段每一個決策點開始,確定參與人此時所選擇策略,并把其他策略刪除;第二,對簡化博弈重復刪除程序,直到最后的最簡博弈。實際上,逆向歸納策略總是屬于納什均衡,盡管納什均衡并不一定是逆向歸納策略。第四節(jié)動態(tài)博弈三逆向歸納法[案例]戀愛的蜈蚣博弈[1﹐1][0﹐3][2﹐2][8﹐11][9﹐9][7﹐10][1﹐4]+1+1+1+11+1+1+[10﹐10]芳芳芳芳芳呆呆呆呆呆[案例]戀愛的蜈蚣博弈第四節(jié)動態(tài)博弈四、順序與優(yōu)勢動態(tài)博弈的行動存在著先后順序,一些具有先動優(yōu)勢(First-moverAdvantage),另一些具有后動優(yōu)勢(Second-moverAdvantage)。在不完全信息下順序更重要:產(chǎn)量競爭可能有先動優(yōu)勢,價格競爭可能有后動優(yōu)勢,但有的博弈如抓鬮沒有先動和后動優(yōu)勢。優(yōu)勢是指自己某個策略相比較其他策略有優(yōu)勢,而不是相比對手策略一定有優(yōu)勢。第四節(jié)動態(tài)博弈四順序與優(yōu)勢
支付次序ABCDE[案例]海盜分金幣[案例]海盜分金幣97
012
0第四輪第三輪第二輪
第一輪
×
×
×
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年河北省張家口市單招職業(yè)傾向性測試題庫及參考答案詳解
- 2026年三門峽職業(yè)技術(shù)學院單招職業(yè)適應性考試題庫及參考答案詳解
- 2026年福建江夏學院單招職業(yè)技能測試題庫帶答案詳解
- 2026年浙江師范大學行知學院單招職業(yè)適應性測試題庫及參考答案詳解1套
- 2026年河南科技職業(yè)大學單招職業(yè)技能測試題庫附答案詳解
- 四川省南充市嘉陵一中2024-2025學年高二上學期第二次月考(11月)物理試題含答案物理答案
- 稅務專項面試題目及答案
- 個人租酒店租賃合同協(xié)議書范本
- 在2025年全縣安排部署2026年元旦春節(jié)期間煙花爆竹管控工作部署會議上的講話
- 2025年浙商銀行合肥分行社會招聘備考題庫及答案詳解一套
- 2025年新《中國傳統(tǒng)文化》考試復習題(附答案)
- 醫(yī)保支付改革與科室績效激勵性調(diào)整策略
- 貨車掛靠租賃協(xié)議書
- 行車搬遷改造協(xié)議書
- 3D打印與機器人融合的個體化骨科精準手術(shù)方案
- 綿竹市2025年公開招聘社區(qū)專職工作者(91人)考試筆試備考試題及答案解析
- 2026審計署京內(nèi)直屬事業(yè)單位招聘國內(nèi)高校應屆畢業(yè)生20人筆試考試參考試題及答案解析
- 長期照護師安全理論模擬考核試卷含答案
- 遼寧省遼西重點高中2025-2026學年高一上學期11月期中考試數(shù)學試題(原卷版)
- 甘肅省慶陽市七區(qū)2024-2025學年高一上學期期末聯(lián)考語文試題
- 2025年行政事業(yè)單位資產(chǎn)管理自檢自查報告
評論
0/150
提交評論