版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
編寫組決策理論與方法第一講競爭型決策概述專題七競爭型決策主要內(nèi)容博弈的基本概念1完全信息靜態(tài)博弈2典型案例3競爭無處不在引例博弈論(gametheory)主要是解決決策者之間沖突和合作的理論。具體來講,是解決決策主體的行為在發(fā)生直接的相互作用時,人們?nèi)绾芜M行決策以及這種決策的均衡問題。引例一.基本概念
囚徒困境囚徒乙坦白抵賴囚徒甲坦白(-8,-8)(0,-10)抵賴(-10,0)(-1,-1)警方拘捕了兩個同案的犯罪嫌疑人(囚徒)后,為防止串供,將其分開拘押,隔離審問。對他倆的政策是:若一人招供但另一人未招,則招者立即被釋放,未招者判入獄10年;若二人都招則兩人各判刑8年;若兩人都不招則未獲證據(jù)但因私入民宅各拘留1年。
如果都是理性的個體,應(yīng)該作何決策?典型的博弈現(xiàn)象可以看出:1.兩個囚徒?jīng)Q策時都已自己的最大利益為目標,結(jié)果是無法實現(xiàn)最大利益或者是較大利益;2.也反應(yīng)了一個很深刻的問題,即個體理性與集體理性之間的矛盾,即從個體利益出發(fā)的行為往往不能實現(xiàn)集體的最大利益;3.同時也揭示了個體理性本身存在的內(nèi)在矛盾,即從個體利益出發(fā)的行為最終也不一定能真正實現(xiàn)個體利益的最大化。典型的博弈現(xiàn)象
博弈就是一些人或組織在一定的環(huán)境和規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行動或策略中進行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。博弈的概念要素博弈的參與者。又稱博弈方或局中人,是指博弈中獨立決策、獨立承擔(dān)結(jié)果的決策主體。
博弈的要素參與者的支付
。每個參與者從各種策略組合中獲得的收益或效用,它是策略組合s的函數(shù),所以也被稱為支付函數(shù)。記博弈方i的支付函數(shù)為ui(s)
。
要素博弈的要素以上是博弈問題的三個基本要素博弈的標準式囚徒困境中參與者:嫌犯甲和嫌犯乙策略集:{坦白,拒絕}支付:博弈結(jié)束,參與者得到的回報。雙方的支付由所選策略決定。當(dāng)兩個嫌犯都選擇“坦白”時,他們的支付都是-1,即坐牢1年。要素博弈的要素博弈方的信息。博弈的次序。所有隨機事件的概率分布擴展要素分類博弈的分類參與者的數(shù)量:兩人博弈和多人博弈參與者策略的數(shù)量:有限博弈和無限博弈收益情況:零和博弈、常和博弈和變和博弈行動的順序:靜態(tài)博弈、動態(tài)博弈、信息結(jié)構(gòu):完全信息博弈和不完全信息博弈參與者理性:非合作博弈和合作博弈分類博弈的分類參與者的數(shù)量:兩人博弈和多人博弈兩人博弈就是存在兩個各自獨立決策,但策略和支付具有相互依存與制約關(guān)系的博弈方的決策問題。多人博弈是指有三個或三個以上參與者進行的博弈。參與者尋求自身最大利益的決策活動,只是現(xiàn)在其他參與者不是一個,在分析參與者的策略行為時,不僅要考慮兩兩之間的相互作用,還要考慮參與者可能會形成聯(lián)盟。分類博弈的分類參與者策略的數(shù)量:有限博弈和無限博弈有限博弈:參與者的數(shù)量和所有策略集合都是有限的。無限博弈:只要參與者數(shù)量或某一個參與者的策略集合是無限的,該博弈稱無限博弈。分類博弈的分類收益情況:零和博弈、常和博弈和變和博弈零和博弈:所有參與者的得益總和始終為零的博弈,其是最常見的一種博弈類型,同時也是被研究得最早、最多的博弈問題。常和博弈:所有參與者的得益總和始終為某一非零常數(shù)的博弈,常用于分析固定份額財富或資源的分配。變和博弈:博弈中參與者的利益總和會隨著策略組合的不同而變化。分類博弈的分類行動的順序:靜態(tài)博弈、動態(tài)博弈、重復(fù)博弈靜態(tài)博弈:所有參與者同時采取行動,或者,雖然行動有先后次序但是參與者無法看到別人的行動。動態(tài)博弈:參與者的決策行動是有先后順序的,而且后決策行動的參與者能夠觀察到先決策行動的參與者所選擇的策略的博弈。如下棋游戲和紙牌游戲。重復(fù)博弈:同一個博弈反復(fù)進行所構(gòu)成的整體博弈過程,構(gòu)成重復(fù)博弈的一次性博弈叫作“元博弈”或者“階段博弈”。分類博弈的分類信息結(jié)構(gòu):完全信息博弈和不完全信息博弈
在網(wǎng)上流傳著這樣一個故事。一個古董商發(fā)現(xiàn)一個人用珍貴的茶碟裝貓食,于是假裝對他的貓非常喜愛,想從他手里買下這只貓。貓主人一口回絕。為此古董商狠心出了高價,才說服貓主人成交。成交后,古董商裝作不經(jīng)意地說:“這個碟子它用習(xí)慣了,就一塊兒送我吧。”貓主人微微一笑:“你知道用這個碟子,我賣了多少貓嗎?”
在這個故事中,古董商掌握著“茶碟是古董”這個信息,非常得意,并自作聰明地認為養(yǎng)貓人不知道。誰知貓主人不但知道,而且還利用了古董商“認為自己不知道”的錯誤認識,更勝一籌。信息的重要性分類博弈的分類信息結(jié)構(gòu):完全信息博弈和不完全信息博弈
完全信息博弈:每個參與者對其他參與者的策略集合及支付函數(shù)有準確認識的博弈。
不完全信息博弈:至少部分參與者不完全了解其他參與者支付情況的博弈。分類博弈的分類參與者理性:非合作博弈和合作博弈
合作博弈:強調(diào)集體理性和效率,參與者的決策是以集體目標最大化為驅(qū)動。
非合作博弈:強調(diào)個體理性,即個體利益最大化。
行動順序信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動態(tài)博弈子博弈精煉納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動態(tài)博弈精煉貝葉斯納什均衡澤爾騰(1975)博弈的分類二.完全信息靜態(tài)博弈
完全信息靜態(tài)博弈概念內(nèi)涵每一參與者都擁有其他所有參與者的特征、策略集和支付函數(shù)等方面的準確信息,這樣的博弈稱為完全信息博弈。參與者同時行動,或者非同時行動但后行動者觀察不到先行動者的選擇的博弈,稱為靜態(tài)博弈。同時滿足完全信息和靜態(tài)兩個條件的博弈稱為完全信息靜態(tài)博弈。囚徒博弈石頭剪子布田忌賽馬無限策略博弈(古諾博弈)……擁有支付函數(shù)的準確信息:1.指支付函數(shù)是確定的;2.支付函數(shù)是公共信息。
常見分析方法囚徒困境中,“雙方都坦白”是極為可能出現(xiàn)的結(jié)果,而且這一結(jié)果非?!胺€(wěn)定”:假如任何一個人單方面改變自己的選擇,將會得到更差的結(jié)果。所以沒有人單方面更改策略,雙方處于一個膠著狀態(tài),即均衡狀態(tài)。怎樣分析并求得這個均衡?
常見分析方法占優(yōu)戰(zhàn)略均衡
重復(fù)剔除占優(yōu)戰(zhàn)略均衡
劃線法
箭頭法
常見分析方法占優(yōu)戰(zhàn)略均衡
占優(yōu)戰(zhàn)略就是指不管其他參與者策略為何,該參與者總能可找到一個最佳策略。這個最優(yōu)策略稱為上策。如果在競爭型決策中每個參與者都有上策,這些上策所構(gòu)成的策略組合必然會受到所有參與者的歡迎,這樣的策略組合稱為該博弈的一個均衡點,稱為“占優(yōu)戰(zhàn)略均衡”。
常見分析方法占優(yōu)戰(zhàn)略均衡
常見分析方法占優(yōu)戰(zhàn)略均衡
占優(yōu)戰(zhàn)略均衡分析是最基本的博弈分析方法,占優(yōu)戰(zhàn)略均衡非常穩(wěn)定,根據(jù)它可以做出最肯定的預(yù)測,因為它反映了博弈方對策略的絕對偏好,只要找到占優(yōu)戰(zhàn)略均衡,博弈分析任務(wù)基本完成。實際上經(jīng)常出現(xiàn)所有參與者都沒有上策,如石頭剪刀布游戲。
不具有普遍適用性。
常見分析方法重復(fù)剔除占優(yōu)戰(zhàn)略均衡
如果一個參與者的某個策略給他帶來的收益總是比另一種策略所帶來的收益少,該策略對于該參與者來說就是“嚴格下策”,無論在什么時候,參與者都不會選擇該策略。
因此,可以將包含該策略的所有策略組合消去,這樣就可以簡化博弈局面,一直循環(huán)往復(fù),不斷消去“嚴格下策”,直到只剩一個策略組合為止,這個策略組合就是該博弈局面的均衡點,這種均衡稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”,也稱為“嚴格下策反復(fù)消去占優(yōu)戰(zhàn)略均衡”。
常見分析方法重復(fù)剔除占優(yōu)戰(zhàn)略均衡
常見分析方法重復(fù)剔除占優(yōu)戰(zhàn)略均衡
步驟:1、首先找出某一博弈參與人的嚴格下策,將它剔除掉,重新構(gòu)造一個不包括已剔除下策的博弈;2、然后繼續(xù)剔除這個新的博弈中某一參與人的嚴格下策;3、重復(fù)進行這一過程,直到剩下唯一的參與人策略組合為止。
常見分析方法劃線法
基本思路:找出一個參與者針對其他參與者每種策略或策略組合(對多人博弈)的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得益的策略,在其支付值下劃線。若存在一個策略組合,使得所有參與者的支付值下都劃了線,則該策略組合就是一個均衡點。
常見分析方法劃線法
乙
左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)
常見分析方法劃線法
乙
左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)
常見分析方法劃線法
乙
左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)
常見分析方法劃線法
乙
左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)
常見分析方法劃線法
乙
左中右甲上(0,4)(4,0)(5,3)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6)
常見分析方法箭頭法
基本思路:考察在每個策略組合處各個參與者能否通過單獨改變自己的策略而增加收益,如能,則從所分析的策略組合對應(yīng)的支付值數(shù)組引一箭頭,指向改變策略后策略組合對應(yīng)的支付數(shù)組,若博弈局面存在一策略組合,其支付值數(shù)組只有進來的箭頭而沒有出去的箭頭,則該策略組合就是均衡點。該方法實質(zhì)上是一種“趨利避害”的動態(tài)分析方法。
常見分析方法箭頭法
亞當(dāng)
坦白抵賴杰克坦白(-8,-8)(0,-10)抵賴(-10,0)(-1,-1)三.典型案例
智豬博弈大豬按等待小豬按(1,5)(-1,9)等待(4,4)(0,0)豬圈中有一頭大豬和一頭小豬,在豬圈的一端設(shè)有一個按鈕,每按一下,位于豬圈另一端的食槽中就會有10單位的豬食進槽,但每按一下按鈕會耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,則大豬吃到9單位食物,小豬僅能吃到1單位食物;如果兩豬同時到食槽,則大豬吃7單位,小豬吃3單位食物;如果小豬先到,大豬吃6單位而小豬吃4單位食物。下表給出這個博弈的支付矩陣。
案例:智豬博弈智豬博弈沒有占優(yōu)戰(zhàn)略均衡。大豬沒有上策,也沒有嚴格下策。小豬有一個下策“按”,因為無論大豬作何選擇,小豬選擇“等待”是比選擇“按”更好一些的策略。如果小豬是理性的,小豬會剔除“按”,而選擇“等待”;大豬知道小豬會選擇“等待”,從而自己選擇“按”,所以,可以預(yù)料博弈的結(jié)果是(等待,按)。
案例:智豬博弈大豬按等待小豬按(1,5)(-1,9)等待(4,4)(0,0)力量成為弱勢(1)根據(jù)智豬博弈的結(jié)論,在一個雙方公平、公正、合理和共享的競爭環(huán)境下,有時占優(yōu)勢的一方最終得到的結(jié)果卻有悖于其初始理性。(2)占有更多資源者,必須承擔(dān)更多的義務(wù)。大豬出力,小豬搶食,這已經(jīng)成為當(dāng)今國際社會的一條規(guī)則。任何一個大國如果想要維護自己的利益,就必須自己動手,同時還要允許一幫小國從中牟利。
案例:智豬博弈案例:俾斯麥海的??諏?943年2月,第二次世界大戰(zhàn)中的日本,在太平洋戰(zhàn)區(qū)已經(jīng)處于劣勢。為扭轉(zhuǎn)局勢,日本統(tǒng)帥山本五十六統(tǒng)率下的一支艦隊策劃了一次軍事行動:由集結(jié)地——南太平洋的新不列顛群島的蠟包爾出發(fā),穿過俾斯麥海,開往新幾內(nèi)亞的萊城,支援困守在那里的日軍。案例:俾斯麥海的??諏?/p>
當(dāng)盟軍獲悉此情報后,盟軍統(tǒng)帥麥克阿瑟命令太平洋戰(zhàn)區(qū)空軍司令肯尼將軍組織空中打擊。
日本統(tǒng)帥山本五十六心里很明白:在日本艦隊穿過俾斯麥海的三天航行中,不可能躲開盟軍的空中打擊,他要策劃的是盡可能減少損失。案例:俾斯麥海的??諏刮磥?天氣象預(yù)報:北線陰雨,能見度差;
南線晴好
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職大氣污染防治管理(管理技術(shù))試題及答案
- 2025年中職(城市綠化管理)綠化維護階段測試題及答案
- 2025年大學(xué)大三(焊接技術(shù)與工程)焊接修復(fù)技術(shù)綜合測試題及答案
- 2025年大學(xué)納米材料與技術(shù)(納米材料技巧)試題及答案
- 2026年銀耳類食品(膠質(zhì)檢測)試題及答案
- 教學(xué)臨時用電安全技術(shù)課件
- 中國采礦技術(shù)
- 養(yǎng)老院老人康復(fù)設(shè)施維修人員考核獎懲制度
- 青島新東方國際雙語學(xué)校項目EPC項目工期履約總結(jié)交流
- 養(yǎng)老院工作人員獎懲制度
- 高鐵安全衛(wèi)士動車組車底智能檢測機器人34課件
- 初三期末寒假家長會課件
- 2025智能交通毫米波雷達交通狀態(tài)檢測器
- 物業(yè)公司快遞柜合作協(xié)議書范本
- 四人合伙協(xié)議書
- 植樹問題52道應(yīng)用練習(xí)題(帶答案)
- 【八年級下冊數(shù)學(xué)北師大版】第三章 圖形的平移與旋轉(zhuǎn)(9類壓軸題專練)
- 中建項目安全總監(jiān)競聘
- 公司股權(quán)分配方案模板
- 電氣工程及自動化基于PLC的皮帶集中控制系統(tǒng)設(shè)計
- 舊設(shè)備拆除方案
評論
0/150
提交評論