版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第第3講講:納納什什均衡(均衡(Nash Equilibrium)混合混合策略策略意義上的分析意義上的分析1我們已經(jīng)學(xué)習(xí)了如下四種博弈的基本分析思路和方法: I、嚴(yán)格上策均衡分析 II、嚴(yán)格下策反復(fù)消去法 III、劃線法 IV、箭頭法 其中,前兩種是以策略之間的絕對優(yōu)劣關(guān)系為基礎(chǔ),后兩種是以策略之間的相對優(yōu)劣關(guān)系為基礎(chǔ)。2 前述四種納什均衡分析方法無法對如下兩類博弈的博弈方的選擇和博弈結(jié)果作明確前述四種納什均衡分析方法無法對如下兩類博弈的博弈方的選擇和博弈結(jié)果作明確的預(yù)測,也就無法給博弈方提供明確的建議:的預(yù)測,也就無法給博弈方提供明確的建議: 不存在納什均衡的博弈,如猜硬幣博弈。不存在納什均
2、衡的博弈,如猜硬幣博弈。 納什均衡不唯一的博弈,如夫妻之爭博弈。納什均衡不唯一的博弈,如夫妻之爭博弈。3 需要引入需要引入“混合策略混合策略”和和“混合策略納什均衡混合策略納什均衡”概念概念4混合策略混合策略 博弈博弈方以一定的概率分布在可選策略中隨機(jī)選擇的決策方式,在分析原來沒有納什方以一定的概率分布在可選策略中隨機(jī)選擇的決策方式,在分析原來沒有納什均衡的博弈時有非常重要的意義。均衡的博弈時有非常重要的意義。 在博弈論中,通常把這種策略選擇方式稱為在博弈論中,通常把這種策略選擇方式稱為“混合策略混合策略”(Mixed Strategy)。與此)。與此對應(yīng)地,把博弈中原來意義上的策略稱為對應(yīng)地
3、,把博弈中原來意義上的策略稱為“純戰(zhàn)略純戰(zhàn)略”(Pure Strategy)。)。5混合策略的較正式混合策略的較正式定義定義:6純策略與混合策略之間的純策略與混合策略之間的關(guān)系關(guān)系 純策略可以看作為特殊的混合策略,即選擇相應(yīng)純策略的概率為純策略可以看作為特殊的混合策略,即選擇相應(yīng)純策略的概率為1,選擇其余純策,選擇其余純策略的概率為略的概率為0的混合策略。的混合策略。 如如“猜硬幣博弈猜硬幣博弈”中,純策略中,純策略“蓋正面蓋正面”可以看做為(可以看做為(1,0),純策略),純策略“蓋反面蓋反面”可以看做為(可以看做為(0,1)。)。78 混合策略可以看作純策略的擴(kuò)展,即如果給一個博弈的每個博
4、弈方的純策略空間賦混合策略可以看作純策略的擴(kuò)展,即如果給一個博弈的每個博弈方的純策略空間賦予不同的概率分布,就形成了不同的混合策略。予不同的概率分布,就形成了不同的混合策略。9需要在混合策略的意義上定義納什需要在混合策略的意義上定義納什均衡均衡 博弈方的策略從博弈方的策略從“純策略純策略”擴(kuò)展到擴(kuò)展到“混合策略混合策略”。 博弈方的策略空間從博弈方的策略空間從“純策略空間純策略空間”擴(kuò)展到擴(kuò)展到“混合策略空間混合策略空間”。10混合策略意義上的納什均衡,簡稱為混合策略意義上的納什均衡,簡稱為“混合混合策略納什均衡策略納什均衡”。 納什均衡的本質(zhì)規(guī)定性是納什均衡的本質(zhì)規(guī)定性是“均衡策略組合滿足各
5、博弈方的策略相互是對其他博弈方策均衡策略組合滿足各博弈方的策略相互是對其他博弈方策略的最佳對策略的最佳對策”。111.確定確定“混合策略納什均衡混合策略納什均衡”的的方法方法 期望得益最大化法;期望得益最大化法; 期望得益等值法期望得益等值法; 反應(yīng)函數(shù)法。反應(yīng)函數(shù)法。12 以以“猜硬幣博弈猜硬幣博弈”為例為例13猜硬幣猜硬幣博弈博弈 博弈的混合策略納什均衡為博弈的混合策略納什均衡為“蓋硬幣方蓋硬幣方”以以1/2的概率隨機(jī)選擇純策略的概率隨機(jī)選擇純策略“蓋正面蓋正面”,“猜硬幣方猜硬幣方”以以1/2的概率隨機(jī)選擇純策略的概率隨機(jī)選擇純策略“猜正面猜正面”。14期望得益最大化期望得益最大化法法1
6、516171819 期望得益等值法期望得益等值法20212223242526期望得益等值期望得益等值法法 博弈的混合策略納什均衡為博弈的混合策略納什均衡為“蓋硬幣方蓋硬幣方”以以1/2的概率隨機(jī)選擇純策略的概率隨機(jī)選擇純策略“蓋正面蓋正面”,“猜硬幣方猜硬幣方”以以1/2的概率隨機(jī)選擇純策略的概率隨機(jī)選擇純策略“猜正面猜正面”。這與利用。這與利用“期望得益最大期望得益最大化法化法”獲得的結(jié)果完全一致獲得的結(jié)果完全一致。27“期望得益等值法期望得益等值法”的思路的思路總結(jié)總結(jié) 令各個博弈方隨機(jī)選擇純策略的概率分布,滿足使對方或其他博弈方采用不同純策令各個博弈方隨機(jī)選擇純策略的概率分布,滿足使對方
7、或其他博弈方采用不同純策略的期望得益相同,從而計算出各個博弈方隨機(jī)選擇各純策略的概率略的期望得益相同,從而計算出各個博弈方隨機(jī)選擇各純策略的概率。28 反應(yīng)函數(shù)法反應(yīng)函數(shù)法29反應(yīng)函數(shù)反應(yīng)函數(shù)法法 將博弈方的策略空間擴(kuò)展到混合策略,將納什均衡擴(kuò)展到包括混合策略納什均衡以將博弈方的策略空間擴(kuò)展到混合策略,將納什均衡擴(kuò)展到包括混合策略納什均衡以后,求純策略納什均衡的反應(yīng)函數(shù)法也可以擴(kuò)展到求混合策略納什均衡。后,求純策略納什均衡的反應(yīng)函數(shù)法也可以擴(kuò)展到求混合策略納什均衡。303132333435363738混合策略反應(yīng)函數(shù)法混合策略反應(yīng)函數(shù)法 反應(yīng)函數(shù)是一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反
8、應(yīng)決策組成的函反應(yīng)函數(shù)是一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策組成的函數(shù)數(shù) 在純策略的范疇中,反應(yīng)函數(shù)是個博弈方選擇的純策略對其他博弈方純策略的反在純策略的范疇中,反應(yīng)函數(shù)是個博弈方選擇的純策略對其他博弈方純策略的反應(yīng)應(yīng) 在混合策略的范疇內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是以方對另在混合策略的范疇內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是以方對另一方的概率分布的反應(yīng),同樣也是一定的概率分布一方的概率分布的反應(yīng),同樣也是一定的概率分布39 確定確定“混合策略納什均衡混合策略納什均衡”的方法的方法 期望得益最大化法;期望得益最大化法; 期望得益等值法期望得益等值法; 反應(yīng)函數(shù)法。反應(yīng)函數(shù)法。40 2.納什均衡的存在性納什均衡的存在性41納什納什定理定理42用通俗的語言,納什定理就是說用通俗的語言,納什定理就是說“每一個有限博弈都每一個有限博弈都至少有一個混合策略納什均衡至少有一個混合策略納什均衡”該定理說明了納什該定理說明了納什均衡的普遍存在性,這也就意味著納什均衡分析在我均衡的普遍存在性,這也就意味著納什均衡分析在我們遇到的大多數(shù)博弈問題中,都是一種基本的分析方們遇到的大多數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深度解析(2026)《GBT 19203-2003復(fù)混肥料中鈣、鎂、硫含量的測定》
- 大連萬達(dá)集團(tuán)采購經(jīng)理考試題目
- 企業(yè)資產(chǎn)管理員筆試題及答案
- 塑料螺釘項目可行性分析報告范文
- 特殊藥物(如抗凝藥)相關(guān)上消化道出血內(nèi)鏡處理
- 深度解析(2026)GBT 18942.2-2003高聚物多孔彈性材料 壓縮應(yīng)力應(yīng)變特性的測定 第2部分 高密度材料
- 深度解析(2026)《GBT 18916.1-2021取水定額 第1部分:火力發(fā)電》
- 深度解析(2026)《GBT 18829.6-2002纖維粗度的測定》
- 華為公司招聘銷售部經(jīng)理面試題及答案
- 蒸煮設(shè)備項目可行性研究報告(總投資20000萬元)(84畝)
- 2024年通用直升機(jī)相關(guān)項目運營指導(dǎo)方案
- 《臺式香腸烤制方法》課件
- 常用計量值控制圖系數(shù)表
- 馬克思主義經(jīng)典著作選讀智慧樹知到課后章節(jié)答案2023年下四川大學(xué)
- 慢性阻塞性肺疾病急性加重期機(jī)械通氣
- 傳染病學(xué)智慧樹知到課后章節(jié)答案2023年下溫州醫(yī)科大學(xué)
- 濕熱滅菌驗證方案及報告
- 工業(yè)區(qū)位因素及其變化高一地理人教版(2019)必修二
- 2022年5月CATTI英語三級口譯實務(wù)真題(最全回憶版)
- 畫法幾何知到章節(jié)答案智慧樹2023年浙江大學(xué)
- 少年宮剪紙社團(tuán)活動記錄
評論
0/150
提交評論