版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第四章 序貫決策博弈,實驗 : 槍手博弈1,三個快槍手相互之間的仇恨到了不可調(diào)和的地步。這天他們?nèi)诮稚喜黄诙?,每個人的手都握住了槍把,一場生死決斗馬上就要開始 已知這三個人中甲槍法精準,十發(fā)八中;乙的槍法也不錯,十發(fā)六中,丙的槍法拙劣,十發(fā)四中。假如三個人同時開槍,決一死戰(zhàn),一槍后誰最后活下來的機會大一些?,實 驗 : 槍手博弈2,假設現(xiàn)在三個槍手決定輪流開槍,誰活下來的機會大一些?,實 驗 : 海 盜 分 寶,五個海盜搶到100顆寶石,他們決定按如下方法來分配:先抽簽決定順序(1,2,3,4,5);然后先由1號提出分配方案,其余的人進行表決,當且僅當半數(shù)和超過半數(shù)的人同意時,則按1號所提
2、方案分配,否則將1號扔進大海喂鯊魚,當1號方案被否決,則由2號提出分配方案,其余的人進行表決,以此類推,假定這些海盜都是理性人,問第一個海盜應提出怎樣的分配方案才能獲得通過并使自己的收益最大?,本章討論動態(tài)博弈,所有博弈方都對博弈過程和得益完全了解的完全且完美信息動態(tài)博弈。這類博弈也是現(xiàn)實中常見的基本博弈類型。由于動態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對動態(tài)博弈分析的概念和方法,特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動態(tài)博弈模型。,主要內(nèi)容,1、序貫博弈的定義和表示方法 2、尋找序貫博弈納什
3、均衡的“箭頭排除確定法”(舊版教材上稱為虛線排除確定法) 3、尋找序貫博弈納什均衡的“倒推法” 4、先動優(yōu)勢和后動優(yōu)勢 5、“倒推法”的缺陷,一、序貫博弈的定義和表示方法,假如某個壟斷企業(yè)一年可以賺10億元的利潤,假定別的企業(yè)為了進入該行業(yè)需要投資4億元。當新的企業(yè)準備進入時,原有壟斷企業(yè)有兩種決策 (1)“容忍”,但利潤要變?yōu)?億元。這時新的企業(yè)可以得5億,減去4億投資,仍有1億。 (2)“抵抗”,例如降低價格,企業(yè)的利潤變?yōu)?億元,且新的企業(yè)也只得2億,但減去投資,虧損2億。 誰先動?潛在進入者,簡稱“進入者” 如何表示該博弈? 分析“進入者”和“壟斷者”的純策略。,博 弈 樹,用博弈樹來
4、表示序貫博弈。 它描述了博弈參與人的一個序貫決策過程,從博弈數(shù)的根開始,到末端點結(jié)束。 擁有初始決策節(jié)點的局中人先做出決策,他的決策引出博弈樹的棱,而棱的末端將是下一個局中人做出決策,依此類推。,進入障礙博弈,進入者,進入,不進,壟斷者,容忍,抵抗,容忍,抵抗,(1,5),(-2,2),(0,10),(0,4),壟斷者,a,b,c,“進入者”和“壟斷者”的純策略,“進入者” 的有兩個純策略:進入和不進入 “壟斷者”的有四個純策略: 不管你怎樣,我總是容忍容忍,容忍 不管你怎樣,我總是對抗對抗,對抗 你進我對抗,你不進我忍對抗,容忍 你進我忍,你不進我對抗容忍,對抗 注:花括號第一項表示壟斷者在
5、上決策節(jié)點b,即進入者選擇進入時他要選擇的行動,第二項表示壟斷者在下決策節(jié)點c,即進入者選擇不進入時他要選擇的行動。,假設壟斷企業(yè)的老板交給你這樣的策略:對抗,容忍,你明白應該如何行動嗎? 策略就是一個完整的行動計劃,使得你可以把它交給另外一個人,讓他知道如何代表你去執(zhí)行這個策略。 什么是計劃:“如果對手選A,我將采取行動X,如果,我將采取行動。”,行動與策略,在同時決策博弈中,行動就是策略。 但在序貫決策博弈中,行動是指每一個決策點上局中人的決策變量或行動的具體抉擇。策略就是一個完整的行動計劃。,策略組合,該博弈有八種可能的策略組合: ( 進入,(上)容忍,(下)容忍 ) ( 進入,(上)對
6、抗,(下)對抗 ) ( 進入,(上)對抗,(下)容忍 ) ( 進入,(上)容忍,(下)對抗 ) ( 不進,(上)容忍,(下)容忍 ) ( 不進,(上)對抗,(下)對抗 ) ( 不進,(上)對抗,(下)容忍 ) ( 不進,(上)容忍,(下)對抗 ),支 付,進入者純策略與壟斷者的“計劃型”策略形成策略組合,構(gòu)成一條路徑。 支付對應每條路徑,而不是對應每步選擇、行為。 支付向量中,數(shù)字的排列按局中人的出場順序出現(xiàn)。(進入者,壟斷者),八種策略組合對應的支付,( 進入,(上)容忍,(下)容忍 )(1,5) ( 進入,(上)對抗,(下)對抗 )(-2,2) ( 進入,(上)對抗,(下)容忍 )(-2,
7、2) ( 進入,(上)容忍,(下)對抗 )(1,5) ( 不進,(上)容忍,(下)容忍 )(0,10) ( 不進,(上)對抗,(下)對抗 )(0,4) ( 不進,(上)對抗,(下)容忍 )(0,10) ( 不進,(上)容忍,(下)對抗 )(0,4),二、尋找序貫博弈的納什均衡,例如:如圖所示的情侶博弈,分析該博弈的納什均衡?,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),男方和女方的純策略,男方有兩個純策略:足球和芭蕾 女方有四個純策略: 不管你怎樣,我總是芭蕾芭蕾,芭蕾 不管你怎樣,我總是足球足球,足球 你選擇什么,我就選擇什么足球,芭蕾 你
8、選擇什么,我就不選擇什么芭蕾,足球,八種策略組合,納什均衡在哪,該博弈有八種可能的策略組合: ( 足球,(上)足球,(下)足球 ) ( 足球,(上)足球,(下)芭蕾 ) ( 足球,(上)芭蕾,(下)足球 ) ( 足球,(上)芭蕾,(下)芭蕾 ) ( 芭蕾,(上)足球,(下)足球 ) ( 芭蕾,(上)足球,(下)芭蕾 ) ( 芭蕾,(上)芭蕾,(下)足球 ) ( 芭蕾,(上)芭蕾,(下)芭蕾 ),用箭頭排除確定法尋找納什均衡,將以上策略在博弈書中用粗線表示。 將存在單獨改變激勵的策略用箭頭標示。方法如下: (1)找到第二階段兩根粗線所對應的支付。 (2)比較這兩個支付前面的數(shù)字,如果大的數(shù)字所對
9、應的那條“樹枝”是細的,則男方存在單獨偏離的動機,則男方的策略選擇用箭頭標示。 (3)比較這兩個支付后面的數(shù)字,其中對應第一階段“樹枝”是細的那個數(shù)字可以不再考慮,因為男方?jīng)]選這個方向。它是“虛”的。 (4)因此只在男方選的那個“樹丫”上進行比較女方的支付,如果大的數(shù)字對應的“樹枝”是細的,則女方的策略選擇“樹枝”用箭頭標示。(P142),虛線排除確定法的缺陷,該方法可以找到納什均衡,但找不到博弈的最終結(jié)果。 均衡是策略的組合,而結(jié)果則是行動的組合。(P143) 因此,我們一般用倒推法(Backwards Induction)來尋找序貫博弈的結(jié)果。,三、尋找序貫博弈的結(jié)果倒推法,從動態(tài)博弈的最
10、后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應博弈方的行為選擇,一直到第一個階段的分析方法,稱為“倒推法” 或者“逆推歸納法”。 倒推法是動態(tài)博弈分析最重要、基本的方法。 步驟: 從博弈的最后一個階段開始分析,通過比較最后一個參與決策的局中人的支付,推斷他或她的選擇,從而將他不會選的策略“枝椏”砍掉,從而回到上一個階段,比較該階段參與決策的局中人的支付,將他或她不會選的策略砍掉,依此類推,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),倒推法:(1)在上面一個枝椏上,由于最后一階段是女方做決策,因此比較女方的支付1和0,將0所對應的芭蕾
11、策略砍掉,沒砍掉的打上箭頭。(2)在下面一個枝椏上,由于最后一階段是女方做決策,因此比較女方的支付-1和2,將-1所對應的足球策略砍掉,沒砍掉的打上箭頭。(3)回到第一個階段,比較帶箭頭的兩個策略男方的支付(因為此時男方做決策),將支付將較小的策略砍掉。,女,博 弈 樹,例如:仿冒和反仿冒博弈,練習:法律保障不足的開金礦博弈,3.2.3 逆推歸納法,乙,借,不借,(1,0),3.2.3 逆推歸納法,乙,借,不借,(1,0),(0,4),練習2:有法律保障的開金礦博弈,練習2:有法律保障的開金礦博弈,倒推法的評價,倒推法只能分析明確設定的博弈問題,要求博弈的結(jié)構(gòu),包括次序、規(guī)則和得益情況等都非常
12、清楚,并且各個博弈方了解博弈結(jié)構(gòu),相互知道對方了解博弈結(jié)構(gòu)。這些可能有脫實際的可能。 逆推歸納法也不能分析比較復雜的動態(tài)博弈。 在遇到兩條路徑利益相同的情況時倒推法也會發(fā)生選擇困難。 對博弈方的理性要求太高,不僅要求所有博弈方都有高度的理性,不允許犯任何錯誤,而且要求所有博弈方相互了解和信任對方的理性,對理性有相同的理解,或進一步有理性的“共同知識”。,四、先動優(yōu)勢與后動優(yōu)勢,在序貫情侶博弈中,任何一方率先采取行動可能得到的好處,都比他或她后行動可能得到的好處大。這種局中人先動得益大于后行得益的情況,叫做先動優(yōu)勢。 請比較:,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),
13、(-1,-1),(1,2),女,先動優(yōu)勢,當男方先動時,男方得2,女方得1,但當女方先動時,男方得1,女方得2。 “先下手為強”,女,足球,芭蕾,男,足球,芭蕾,足球,芭蕾,(1,2),(-1,-1),(0,0),(2,1),男,序貫博弈中的性別戰(zhàn),舉例:情侶博弈中往往是先動一方具有優(yōu)勢,因此男女雙方往往要搶先一步,獲得主動權,比如女方已經(jīng)買好了電影票,再比如男方曾經(jīng)多次告訴女方,世界杯就算不上班也要看!,后動優(yōu)勢,后動優(yōu)勢:后行動的得益比先行動的得益大的情況。 1.石頭、剪刀、布的游戲。 2.如何分蛋糕? 一塊蛋糕兩人分,怎么分才公平?你愿意是切還是挑? 3.兩家價格競爭的企業(yè),在定價方面是不是也有后動優(yōu)勢?,用矩陣來演示先動優(yōu)勢和后動優(yōu)勢,乙,進入,不進入,左,中,右,甲,甲有后動優(yōu)勢!,乙,進入,不進入,左,中,右,甲,甲、乙各有什么優(yōu)勢?,乙,上,下,左,右,甲,甲有先動優(yōu)勢,乙有后動優(yōu)勢??梢灶A料,利益驅(qū)動,原來同時決策的這個博弈,容易演化成甲先決策乙后做決策的序貫博弈。,乙,上,下,左,右,甲,五、博弈論給自己出難題,殘酷的蜈蚣博弈是說明逆推歸納法和博弈分析困難的經(jīng)典博弈。,(0,10000),猜猜看這個殘酷
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年心理診斷技術考試題庫及一套答案
- 2026廣東佛山南海區(qū)西樵鎮(zhèn)樵北中學招聘一名筆試備考試題及答案解析
- 2026年心理品格考試題庫及完整答案一套
- 2026四川內(nèi)江市隆昌市發(fā)展和改革局招聘2人筆試備考題庫及答案解析
- 2026年新疆輕工職業(yè)技術學院單招職業(yè)技能測試題庫附答案
- 2026年濰坊保密知識網(wǎng)上測試題及完整答案1套
- 2026年成都工貿(mào)職業(yè)技術學院單招綜合素質(zhì)考試模擬測試卷附答案
- 2026年廣東省汕尾市單招職業(yè)傾向性測試模擬測試卷附答案
- 2025內(nèi)蒙古呼和浩特春華水務開發(fā)集團有限責任公司招聘遞補進入體檢考察范圍人員筆試備考題庫及答案解析
- 2026云南云廣文化傳媒有限公司財務人員招聘1人筆試模擬試題及答案解析
- 四川省遂寧市射洪縣九年級2024-2025學年(上)期末化學試卷(含答案)
- 2025-2030中國器官芯片行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 醫(yī)院醫(yī)療保險費用審核制度
- 村衛(wèi)生室醫(yī)療質(zhì)量相關管理制度
- 非遺傳承人激勵機制探索-深度研究
- 中小學校園中匹克球推廣策略與實踐研究
- 2024年世界職業(yè)院校技能大賽高職組“體育活動設計與實施組”賽項考試題庫(含答案)
- 高中地理選擇性必修一(湘教版)期末檢測卷02(原卷版)
- 滬教版九年級化學上冊(上海版)全套講義
- 三角函數(shù)圖像變化課件
- 《內(nèi)存條知識培訓》課件
評論
0/150
提交評論