版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第13章對(duì)策論2/6/20231課件教學(xué)目標(biāo)與要求【教學(xué)目標(biāo)】1.理解下列基本概念:矩陣對(duì)策,矩陣對(duì)策三要素,最優(yōu)純策略與最優(yōu)混合策略,鞍點(diǎn)和對(duì)策值2.算法要求:(1)會(huì)用“超優(yōu)原則”和“最大最小”原則求矩陣對(duì)策的最優(yōu)純策略(2)會(huì)用“線性規(guī)劃”方法求矩陣對(duì)策的最優(yōu)混合策略(3)了解純策略和混合策略的納什均衡求取。【知識(shí)結(jié)構(gòu)】2/6/20232課件2/6/20233課件本章主要內(nèi)容13.1對(duì)策論的基本概念13.1.1對(duì)策模型的基本要素13.1.2對(duì)策問題的分類13.2矩陣對(duì)策的純策略13.2.1優(yōu)超原則13.2.2最大最小原則13.3矩陣對(duì)策的混合策略13.3.1混合策略的概念13.3.2圖解法13.3.3線性規(guī)劃法13.4納什均衡13.4.1純策略納什均衡的劃線法13.4.2混合策略納什均衡的LP方法13.4應(yīng)用舉例案例13-1市場競爭策略案例13-2對(duì)抗賽項(xiàng)目確定本章小結(jié)2/6/20235課件13.1.1對(duì)策模型的基本要素1.局中人局中人(players)是指參與競爭的各方,每方必須有獨(dú)立的決策能力和承擔(dān)風(fēng)險(xiǎn)的能力。(如:田忌、齊王)2.策略集在對(duì)策問題中,局中人為了應(yīng)對(duì)其他局中人的行動(dòng)而采取的方案和手段稱為該局中人的一個(gè)策略(strategy)。3.贏得及贏得函數(shù)局中人采用不同策略對(duì)策時(shí),各方總是有得或有失,統(tǒng)稱贏得(payoff)或得益。(上中下)(上下中)(中上下)(中下上)(下上中)(下中上)(上中下)3,-31,-11,-11,-1-1,11,-1(上下中)1,-13,-31,-11,-11,-1-1,1(中上下)1,-1-1,13,-31,-11,-11,-1(中下上)-1,11,-11,-13,-31,-11,-1(下上中)1,-11,-11,-1-1,13,-31,-1(下中上)1,-11,-1-1,11,-11,-13,-32/6/20236課件13.1.2對(duì)策問題的分類局中人之間是否允許合作?策略選擇是否與時(shí)間有關(guān)?局中人多寡?贏得值代數(shù)和是否為0?2/6/20237課件13.2矩陣對(duì)策的純策略為求出對(duì)策模型的解,首先需要對(duì)雙方的對(duì)策條件作如下的假設(shè)。(1)對(duì)策雙方的行為是理智的,對(duì)策略的選擇不存在任何僥幸心理。(2)局中人選取策略的目標(biāo)是收益最大或損失最小。(3)局中人同時(shí)選取各自的行動(dòng)策略,且不知道對(duì)方選取哪一個(gè)策略。(4)對(duì)策中的有關(guān)規(guī)定和要求,局中人是知道的。2/6/20239課件13.2.1超優(yōu)原則1.對(duì)若恒有則稱超優(yōu)于2.對(duì)若恒有則稱超優(yōu)于【例13.2】第3行優(yōu)超于第2行,第1行優(yōu)超于第5行第1列優(yōu)超于第5列,第4列優(yōu)超于第2列
第1行優(yōu)于2、3行
最優(yōu)純策略(α1,β2)2/6/202310課件【例13.3】某地區(qū)有甲、乙兩家企業(yè)生產(chǎn)同種產(chǎn)品,采取相同的價(jià)格出售,為了提高市場份額,均采取做廣告的方式擴(kuò)大自己的銷售量。甲和乙均有三種廣告策略。甲企業(yè)所占的市場份額增加的百分?jǐn)?shù)如下面矩陣A所示。2/6/202311課件13.3.1混合策略的概念【例13.5】猜硬幣游戲:甲、乙兩個(gè)兒童玩猜硬幣游戲,甲手中拿著一枚硬幣,把硬幣蓋在桌子上,讓兒童乙猜是正面向上還是反面向上。如若猜對(duì)甲給乙1元錢,猜錯(cuò)乙給甲1元錢。猜硬幣游戲?qū)儆诰仃噷?duì)策,兒童甲的策略有出正面向上(α1)和出反面向上(α2),兒童乙的策略有猜正面向上(β1)和猜反面向上(β2)。2/6/202313課件13.3.1混合策略的概念設(shè)甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反面(β2)的概率1-y。則乙兩個(gè)策略的期望值分別為:當(dāng)x<0.5時(shí),
,理性的兒童乙會(huì)選擇猜反面;
當(dāng)x>0.5時(shí),
,理性的兒童乙會(huì)選擇猜正面;(3)當(dāng)x=0.5時(shí),
,兒童乙不論采取何種策略,平均贏得都是零。乙的策略同理甲的策略最優(yōu)混合策略2/6/202314課件13.3.1混合策略的概念由于甲乙都是理智的,故混合擴(kuò)充:設(shè)有矩陣對(duì)策混合擴(kuò)充2/6/202315課件13.3.2圖解法圖解法求解矩陣對(duì)策,一般適用于贏得矩陣為或的對(duì)策問題,對(duì)于和都較大的對(duì)策問題就不適用了。下面通過例子來說明這種方法。解設(shè)甲的混合策略為x,(1-x),x∈[0,1],則乙分別使用β1,β2,β3時(shí),甲贏得值:01xx*72β153β2211β3步驟:(1)繪制x數(shù)軸,標(biāo)出x取值范圍[0,1](2)x取0和1,確定三條直線端點(diǎn),繪制三條甲贏得值直線(3)由于乙是理智的,甲的贏得值只能是最小的(粗線所示)(4)甲只能在最小中取最大,對(duì)應(yīng)的策略為
,最優(yōu)對(duì)策值為V*=49/11【例13.7】求解矩陣對(duì)策,其中2/6/202317課件13.3.2圖解法01xx*72β153β2211β3從圖還可以看出局中人乙的最優(yōu)混合策略為β2β3的組合.故β1的概率為0.設(shè)β2,β3的概率為y,(1-y).由效率矩陣:可知,當(dāng)甲使用α1,α2,時(shí),乙的損失值為:由于甲是理智的,故乙取最大損失(粗線)乙會(huì)在最大損失中找出最小,即乙最優(yōu)混合策略為:01yy*3α11152α2y分別取0和1,繪制圖形如下:2/6/202318課件13.3.3線性規(guī)劃法乙采取策略組合y1,…,yn時(shí),是從利己主義出發(fā)的,會(huì)使自己的期望損失最小(也即甲的贏得最小)甲會(huì)使用某種策略組合x1,…,xm,使得在最小贏得的概率組合盡可能地大.因此有:2/6/202319課件綜上所述,二人零和對(duì)策可以表述成一對(duì)對(duì)偶規(guī)劃:【例13.7】解寫出一對(duì)對(duì)偶模型解得:求得最優(yōu)混合局勢:2/6/202321課件13.4納什均衡2/6/202322課件13.4納什均衡表示成贏得矩陣:如果某情況下無一參與者可以獨(dú)自行動(dòng)而增加收益,則此策略組合被稱為納什均衡點(diǎn)?!凹{什均衡”,也叫非合作均衡,由諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者——美國普林斯頓大學(xué)約翰·納什提出?!凹{什均衡”描述的就是一種非合作博弈均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。所以“納什均衡”是對(duì)馮·諾依曼和摩根斯坦的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。納什均衡也分為純策略與混合策略.純策略可采取“劃線法”;混合策略可采取線性規(guī)劃方法。2/6/202323課件13.4.2混合策略納什均衡的LP方法由于納什均衡所解決的問題不是二人零和對(duì)策,故對(duì)策雙方的贏得矩陣不是同一個(gè)矩陣,其LP模型也不是一對(duì)對(duì)偶問題。設(shè)甲、乙的贏得矩陣分別為A和B,混合策略概率分別為:對(duì)于收益等贏得值,有收益最大化maxV(即min1/V)模型如下:對(duì)于成本等損失值,有損失最小化minV(即max1/V)模型如下:2/6/202325課件【例13.8】對(duì)下表(收益值)求取納什均衡。解甲的收益矩陣乙的收益矩陣A的3、4行收益值不大于第1行,刪除B的3、4列收益值不大于第1列,刪除收益矩陣簡化及使用概率如下:乙的收益矩陣各元素+4,對(duì)甲、乙建立LP模型并求解如下:,2/6/202326課件2/6/202329課件解決方案這是一個(gè)納什均衡問題。在甲的收益矩陣中,第2行的收益值均不小于第1、3行,故是一個(gè)純策略問題,即李參加仰泳比賽。由于甲是理智的,他會(huì)讓李參加仰泳比賽,而乙對(duì)付甲的最優(yōu)策略時(shí),王參加3個(gè)項(xiàng)目比賽時(shí)的收益值分別為15、13、15。可見王參加仰泳和蛙泳成本是一樣的,各以0.5的概率參加。決策建議甲隊(duì)李參加仰泳比賽;乙隊(duì)王參加參加仰泳或蛙泳比賽。甲隊(duì)得分12分,乙隊(duì)得分15分。2/6/202330課件本章小結(jié)對(duì)策論是研究具有競爭性質(zhì)的現(xiàn)象,并為參加者各方提供對(duì)策方法的數(shù)學(xué)理論。無論何種對(duì)策,構(gòu)成一個(gè)對(duì)策現(xiàn)象的共同特征是具有三個(gè)基本要素:局中人、策略集和損益值。本章重點(diǎn)研究的是矩陣對(duì)策,又稱為二人有限零和對(duì)策,是指兩個(gè)局中人、每一局中人策略數(shù)量都是有限的且在任何一對(duì)策略組合下兩個(gè)局中人的損益值之和始終為零的對(duì)策。通常矩陣對(duì)策表示為G={S1,S2,A}在求解矩陣對(duì)策時(shí),我們可以采取以下步驟:首先用嚴(yán)格下策反復(fù)消去法對(duì)贏得矩陣進(jìn)行簡化。判斷對(duì)策是否存
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 區(qū)域經(jīng)理面試題庫及答案
- 2026年縣鄉(xiāng)教師選調(diào)考試《教師職業(yè)道德》題庫100道及參考答案(培優(yōu))
- 2026年勞務(wù)員考試題庫附完整答案【全優(yōu)】
- 2026年材料員考試備考題庫(綜合題)
- 2026年縣直事業(yè)單位招聘職業(yè)能力測試題庫附參考答案【完整版】
- 2026年江蘇財(cái)會(huì)職業(yè)學(xué)院單招職業(yè)適應(yīng)性考試模擬測試卷附答案解析
- 2026年二級(jí)注冊(cè)建筑師之法律法規(guī)經(jīng)濟(jì)與施工考試題庫500道及完整答案(歷年真題)
- 2026吉林能源投資集團(tuán)招聘面試題及答案
- 2025江蘇南通市蘇錫通科技產(chǎn)業(yè)園區(qū)招商服務(wù)有限公司第二批次招聘延期考試筆試模擬試題及答案解析
- 2026年(通訊維修工)理論知識(shí)考試題庫帶答案(精練)
- 物業(yè)反恐防暴培訓(xùn)
- 【完整版】2026國考《行測》真題(行政執(zhí)法)
- 2025年床上四件套市場調(diào)研:純棉印花需求與圖案美觀度分析
- 2025年度物流行業(yè)市場調(diào)研:產(chǎn)業(yè)規(guī)模、政策支持及數(shù)字化趨勢報(bào)告
- 2025年及未來5年市場數(shù)據(jù)中國拖拉機(jī)制造市場競爭態(tài)勢及投資戰(zhàn)略規(guī)劃研究報(bào)告
- 廣東省廣州市越秀區(qū)2024-2025學(xué)年八年級(jí)上學(xué)期期末考試英語試題
- 地震波速反演方法-洞察及研究
- 百年未有之大變局課件
- 2025年時(shí)事政治考試100題及答案
- 應(yīng)急救援電源
- 電力行業(yè)電力工程設(shè)計(jì)師崗位招聘考試試卷及答案
評(píng)論
0/150
提交評(píng)論