版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第六章 對策論,基本概念,對策論又稱博弈論,研究沖突對抗條件下最優(yōu)決策問題的理論。 策略形勢:不完全競爭條件下的對抗行為,各方收益由自身行為和其他方行為共同決定。,基本要素 局中人(I ):有權決定自己行動方案的對策參加者,理性人 策略集(S ):供局中人選擇的實際可行完整行動方案的集合, 一局對策中,各局中人選定策略的集合,稱局勢 贏得函數( H(s) ):對于任一局勢,局中人的贏得值。支付函數,嚴格占優(yōu)策略/嚴格劣勢策略 上策均衡/納什均衡,典型案例和重要結論,結論1:不要選擇嚴格劣勢策略。 結論2:個人理性選擇導致非最優(yōu)。 結論3:學會換位思考。,囚徒困境 智豬博弈,求解方法:刪除嚴格劣
2、勢策略,矩陣對策的基本理論,局中人個數:二個,多個 策略集中的個數:有限,無限 支付/贏得代數和:零和,非零和 局中人是否合作:非合作,合作 局中人行動時間:靜態(tài),動態(tài) 局中人對他者信息了解程度:完全信息,非完全信息 對策次數:單次,重復,對策/博弈分類,課程目標,理解并掌握矩陣對策的純策略 理解并掌握矩陣對策的混合策略 掌握矩陣對策的求解方法,矩陣對策的策略,純策略:確定的選擇某策略 混合策略:以某一概率分布選擇各策略。,矩陣對策的純策略,的贏得矩陣 或的支付矩陣 的贏得矩陣為-A 。,1、矩陣對策的一般表達,矩陣對策的純策略,例:田忌賽馬 局中人:田忌(I)、齊王(II) S1 =(上、中
3、、下),(上、下、中),(中、上、下), (中、下、上),(下、中、上),(下、上、中)= S2,1、矩陣對策的一般表達,矩陣對策的純策略,-8 2 -10 -3,9 2 6,理智行為:從各自最不利情形中選擇最有利 I:最大最小原則 II:最小最大原則,平衡局勢:雙方均可接受,且對雙方都是最穩(wěn)妥的結果。 (2 ,2),局中人I和II的最優(yōu)純策略。,2、矩陣對策解的引例,矩陣對策的純策略,從上例看出,矩陣A中平衡局勢(2 ,2)對應的元素a22既是其所在行的最小元素,也是其所在列的最大元素,即有 ai2a22 a2j i=1,2,3,4 j=1,2,3,3、矩陣對策的最優(yōu)純策略,矩陣對策的純策略
4、,1 2 3 1,3 7 4 6,3、矩陣對策的最優(yōu)純策略,矩陣對策的純策略,對于一個對策G=S1, S2, A, 若 有 則稱局勢(i*, j*)為對策G的 鞍點,V = a i*j*為對策G的值。,注:在矩陣中,一個數在所在行中是最大值,在所在列中是最小值,則被稱為鞍點。,4、矩陣對策的鞍點與解,矩陣對策的純策略,多鞍點與無鞍點對策 例: 設有一矩陣對策如下,求它的解。,局勢(1, 2),(1, 4),(3, 2)(3, 4)均構成鞍點,此對策有多個解。,4、矩陣對策的鞍點與解,矩陣對策的純策略,性質1:無差別性 若(i1 ,j1)和(i2,j2)是對策G的兩個解,則 ai1j1 = ai
5、2j2 性質2:可交換性 若(i1 ,j1)和(i2,j2)是對策G的兩個解,則(i1 ,j2)和(i2,j1)也是對策G的兩個解。 矩陣對策的值唯一。即當一個局中人選擇了最優(yōu)純策略后,他的贏得值不依賴于對方的純策略。,5、矩陣對策純策略的性質,作業(yè),P385 習題 12.2 12.3 12.4,矩陣對策的混合策略,3 4,5 6,無鞍點,1、混合策略,矩陣對策的混合策略,1、混合策略,矩陣對策的混合策略,2、混合局勢,3、贏得期望,4、混合策略對策模型,矩陣對策的混合策略,5、最優(yōu)混合策略,設 ,是矩陣對策 的混合擴充。,矩陣對策的混合策略,5、最優(yōu)混合策略,矩陣對策的混合策略,定理2:矩陣
6、對策G在混合策略意義下有解的充要條件是: 存在 ,使得對于任意 ,有,2、最優(yōu)混合策略,矩陣對策的混合策略,3、最優(yōu)混合策略解的引例,矩陣對策的解法,例:求解矩陣對策G= ,其中,解:(1)不存在鞍點,為混合策略求解問題。 (2)圖解法求解 設局中人I的混合策略為(x, 1-x)T, 。,0,1,I,I,II,II, 數軸上坐標為0和1的兩點分別做兩條垂線I-I和II-II。, 畫出局中人II的不同策略下局中人I的贏得線段。,2,5,7,2,3,11,1=2x+7(1-x),2=3x+5(1-x),3=11x+2(1-x),圖解法,僅適用于贏得矩陣為2n或m2階的矩陣對策問題。,1: v11
7、= 2x+7(1-x) 2 : v12 = 3x+5(1-x) 3 : v13 = 11x+2(1-x),由于局中人II理性,局中人I從最少可能收入中選擇最大的一個,為局中人I的最優(yōu)對策。B2, 求解方程組可得最優(yōu)混合策略和矩陣對策的值。,圖解法,0,1,I,I,II,II,2,5,7,2,3,11,1=2x+7(1-x),2=3x+5(1-x),3=11x+2(1-x),B1,B2,B3,B4,聯立過B2點兩條直線的方程組為,可解得,則,局中人I 的最優(yōu)策略為,由圖可見局中人II的混合策略只有2和3組成。,設局中人II的最優(yōu)混合策略為 ,且,P365 例10,圖解法, 求局中人II的最優(yōu)混合
8、策略。,同理,可得局中人II的贏得,,1: v21 = 3y2+11y3 2 : v22 = 5y2+2y3,畫出贏得線段,見右圖,局中人I理性,局中人II取最大損失的最小值,聯立方程組可得,解得,方程組法,定理:設 ,則 為G的解的充要條件是: 存在數v,使得x*,y*分別是下列不等式組的解,且v = VG。,若xi*,yj*均不為0,則上述不等式的求解即可轉化為下列兩個方程組的求解問題。,注:若上述兩個方程組存在非負解x*,y* ,即矩陣對策的解。若不存在非負解,則將上述方程組中的某些等式轉化為不等式,繼續(xù)求解。 由于事先假設xi*,yj*均不為0,故,當最優(yōu)策略的某些分量為0時,方程組可能無解,因此該方法具有一定的局限性。,方程組法,例:求解矩陣對策G= ,其中A為,解:(1)刪除劣勢策略,得到,無鞍點,和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030中國出境旅游市場消費行為與政策影響研究報告
- 2025年數據庫系統(tǒng)工程師考試專項訓練題庫及答案
- 工程造價咨詢服務規(guī)范及方案設計
- 職場英語溝通技巧培訓資料
- 2025-2030湘菜食材供應鏈優(yōu)化與成本控制分析
- 2025-2030湘菜堂食與外賣產品結構差異分析
- 2025-2030消防預警設備后服務市場商業(yè)模式創(chuàng)新與盈利預測
- 2025-2030消防無人機巡檢系統(tǒng)行業(yè)市場現狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030消防安全系統(tǒng)性能測試認證及保險理賠條款協調性分析
- 2025-2030消費級機器人產品市場接受度與價格策略研究
- 地坪漆施工方案范本
- 2025寧波市甬北糧食收儲有限公司公開招聘工作人員2人筆試參考題庫及答案解析
- 綜合醫(yī)院心身疾病診治
- 港口安全生產管理模版
- 產房與兒科交接登記表
- 2022-2023學年四川省宜賓市高一(下)期末數學試卷(含解析)
- 教你填《廣東省普通高中學生檔案》精編版
- 韓國語topik單詞-初級+中級
- 克林頓1993年就職演講+(中英文)
- 商業(yè)倫理與會計職業(yè)道德(第四版)第五章企業(yè)對外經營道德規(guī)范
- DB13 5161-2020 鍋爐大氣污染物排放標準
評論
0/150
提交評論