生產(chǎn)運作管理課堂報告:s02 戰(zhàn)略制定的博弈分析模型_第1頁
生產(chǎn)運作管理課堂報告:s02 戰(zhàn)略制定的博弈分析模型_第2頁
生產(chǎn)運作管理課堂報告:s02 戰(zhàn)略制定的博弈分析模型_第3頁
生產(chǎn)運作管理課堂報告:s02 戰(zhàn)略制定的博弈分析模型_第4頁
生產(chǎn)運作管理課堂報告:s02 戰(zhàn)略制定的博弈分析模型_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、博弈的三個基本要素: 1.局中人(Player): 參與對抗的各方;參與人是理性的、智能的。 2.策略集(Strategy set): 局中人選擇對付其它局中人的行動方案稱為策略。 某局中人的所有可能策略全體稱為策略集; 3.局勢對策的益損值(支付 Payoff): 各局中人各自使用一個對策就形成一個局勢,一個局勢決定了個局中人的對策結果(量化),稱為該局勢對策的益損值.,博弈的其它要素: 1.虛擬參與人(Pseudo-player) 指 “自然” (Nature)、“上帝” God,也即決定外生的隨機變量的概率分布的機制。 2.行動的順序(the order of play) 博弈中參與人實

2、施決策活動的順序。同時或有先有后。 其他因素不變,但順序不同,博弈的結果也不同。 不同順序意味著不同的博弈。靜態(tài)博弈和動態(tài)博弈。 3. 信息 (Information) 指一個博弈中參與人有關該博弈的知識,如關于N的選擇、其他參與人的策略集、支付函數(shù)、行動時間等. 完全信息、完美信息、共同知識、私人信息,“田忌賽馬”齊王在各局勢中的益損值表,齊王的策略集: S1=1, 2, 3, 4, 5, 6 田忌的策略集: S2=1, 2, 3, 4, 5, 6 下列矩陣稱齊王的贏得矩陣: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1

3、 1 -1 3 1 1 1 -1 1 1 3,二人有限零和對策: (又稱二人有限零和博弈、矩陣對策、矩陣博弈) 局中人為2; 每局中人的策略集中策略權目有限; 每一局勢的對策均有確定的損益值,并且對同一局勢的兩個局中人的益損值之和為零; 同時行動,靜態(tài)博弈。,記矩陣對策為: G = S1, S2, A “齊王賽馬”即是一個矩陣策略.,甲的策略集,乙的策略集,甲的贏得矩陣,矩陣對策的最優(yōu)純策略,在甲方贏得矩陣中: A=aijmn I 行代表甲方策略 i=1,2m J 列代表乙方策略 j=1,2n aij代表甲方取策略 i,乙方取策略 j, 這一局勢下甲的益損值,此時乙的益損值為-aij(零和性質(zhì)

4、)。 在討論各方采用的策略是必須注意一個前提就是對方是理智的。這就是要從最有把握取得的益損值情況考慮。,例:有交易雙方公司甲和乙,甲有三個策略1,2,3;乙有四個策略1,2,3,4,根據(jù)獲利情況建立甲方的益損值 贏得矩陣。 問:甲公司應采取什么策略比較適合?,甲:采取1至少得益3 2 0 3 -4 乙:采取1甲最多得益2(乙最少-2 ) 2 3 (乙-3 ) 3 0 (乙 0 ) 4 3 (乙-3 ),甲采取策略2 不管乙采取如何策略,都至少得益。 乙采取策略3 不管甲采取如何策略,都至少可以得益。(最多損失0) 分別稱甲,乙公司的最優(yōu)策略,由唯一性又稱最優(yōu)純策略。 最優(yōu)純策略存在前提: ma

5、x min aij = min max aij = v i j j i 又稱(2 ,3) 為對策G=s1,s2,A的鞍點。 值V為G的值。,純策略Nash均衡,Nash:電影美麗心靈A Beautiful Mind,Nash均衡,若策略(s1*, , sk-1*, sk*, sk+1*, , sn* ) 對任意參與人 i 和策略 k 均滿足: ui (s1*, , sk-1*, sk*, sk+1*, , sn* ) ui (s1*, , sk-1*, sk, sk+1*, , sn* ) 則稱(s1*, , sk-1*, sk*, sk+1*, , sn* ) 為該博弈的Nash均衡。,例1

6、:團體對抗賽 甲、乙兩隊開展三人制團體對抗賽,各隊的陣容安排視為一種策略,各種局勢下的損益值可由下面的甲的贏得矩陣所示:問兩隊在穩(wěn)妥原則下會選擇何種陣容?,解: max min aij = max 1, -3, -1=1 i j i min max aij = min 3, 1, 3 =1 j i j,故(1 ,2) 為上述對策的最優(yōu)純策略,例2:預先采購與大自然博弈 冬季消耗煤:冷 20噸 正常 15噸 暖 10噸 冬季煤價: 冷 20元 正常 15元 暖 10元 已知秋季煤價10元,問秋季應采購多少噸?,解:max min aij = max -300, -250, -200 = -200

7、 i j i min max aij = min -100, -150, -200 = -200 j i j,故(3 ,3) 為 上述對策的最 優(yōu)純策略,設矩陣對策 G =S1,S2,A 當 max min aij min max aij 時, i j j I 不存在最優(yōu)純策略。 任務轉變?yōu)椋?求解混合策略。,矩陣對策的混合策略,混合策略Nash均衡,例:設一個贏得矩陣如下:,例3:猜拳博弈 甲乙各出1,2,3中一個數(shù)字,兩人數(shù)字之和為m,若A為 奇數(shù),甲付給乙m;若為偶數(shù),乙付給甲m,求最優(yōu)策略。,解:max min aij = max -3, -3, -5 = -3 i j i min m

8、ax aij = min 4, 4, 6 = 4 j i j,不存在最 優(yōu)純策略,本例的最優(yōu)混合策略為:,甲: X* = (0.25,0.5,0.25)T V=0 乙: Y* = (0.25,0.5,0.25)T V=0,假設矩陣對策 G = S1, S2, A 甲方贏得矩陣 A=aijmn - 若存在兩行(列),s 行(列)的各元素均優(yōu)于 t 行(列)的元素,即 asjatj ,j=1,2n (ais ait , i=1,2m ) 稱甲方策略s優(yōu)超于t ( s優(yōu)超于t),優(yōu)超原則,當局中人甲方的策略t被其它策略所優(yōu)超時, 可在其贏得矩陣A中劃去第t行 (同理, 當局中人乙方的策略t被其它策略

9、所優(yōu)超時, 可在矩陣A中劃去第t列)。 如此得到階數(shù)較小的贏得矩陣A, 其對應的矩陣對策 G= S1, S2, A 與 G = S1, S2, A 等價, 即解相同。,被第3、4行所優(yōu)超,被第3行所優(yōu)超,被第 1、2 列所 優(yōu)超,例 設甲方的益損值 贏得矩陣。得到:,被第1行所優(yōu)超,被第1列所優(yōu)超,對A4計算,用線性規(guī)劃方法得到: (注意:余下的策略為3,4,1,2) 甲: X* = (0, 0, 1/15,2/15,0)T V=5 X*= (0, 0, 1/3 , 2/3 ,0)T 乙: Y* = (1/10,1/10, 0, 0, 0)T V=5 Y*= (1/2 , 1/2 , 0, 0

10、, 0)T 注: 利用有超原則化簡贏得矩陣時,有可能將原對策問題的解也劃去一些(多解情況); 線性規(guī)劃求解時有可能是多解問題。,反應函數(shù):分贓博弈,博弈方1和博弈方2就如何分10000元進行討價還價。 規(guī)則: 雙方同時提出自己要求的數(shù)額s1和s2, 0s1,s210000 s1+s210000,則兩博弈方的要求都得到滿足,即分別得s1和s2,但如果s1+s10000,則該筆錢就被沒收。 問該博弈的純策略納什均衡是什么?如果你是其中一個博弈方,你會選擇什么數(shù)額,為什么?,反應函數(shù),答案: 假設博弈方1選擇s1,給定博弈方2的策略,博弈方1將選擇Maxs1=10000-s2, 這就是博弈方1的反應

11、函數(shù). 同理, 博弈方2對于另一人的反應函數(shù)為s2=10000-s1 解得:s1, s2為滿足s1+s2=10000的任意值. 此外,如果雙方判斷彼此的選擇是相同的,則s1=5000, s2=5000,反應函數(shù):配比捐款,另一道題: 一個小鎮(zhèn)上,有N個人(人數(shù)大于3),每個人有100元,如果每人都捐款一筆(每人捐款數(shù)額可以不同,并可以為零),共募集到F元。那么李嘉誠愿意再拿出F元來,最后這筆錢給他們平均分配,也就是說,他們可以每人分得2F/N元。 問:在均衡的情況下,每人愿意集資多少?,反應函數(shù),答案: 假設捐款數(shù)量分別為s1, s2, ,sN. 給定其他人的策略,博弈方1的選擇是如下的反應函

12、數(shù): Max 2F/N-s1 = 2(s1+ s2+ +sN) /N-s1 可見,博弈方1的最佳選擇是取S1=0 同理,所有人選擇策略都是0. 思考:如何能夠通過機制設計,來保證這種捐助的成功?,兩個囚徒的選擇:或者供出同伙,或者抵賴。 各種選擇的后果:都抵賴:沒有證據(jù),均無罪釋放 都認罪:坦白從寬,均判處輕刑; 一人招供一人抵賴: 招供方無罪釋放,并有立功獎勵 抵賴方判處重刑,且判處罰金,1.囚徒困境,博弈說明: 完全信息靜態(tài)博弈 存在純策略Nash均衡 可用優(yōu)超求解,黃色為均衡解,延伸: (1)愛情博弈、軍備競賽、價格聯(lián)盟、股市博弈 (2)有限次重復囚徒博弈的解不變 (3)無限次重復囚徒博

13、弈,結果是二人互相信任 (4)多人重復囚徒博弈:只要有一人上次背叛,即背叛,為什么麥當勞、肯德基總是開在一起?,2.位置困境,博弈說明: 完全信息動態(tài)博弈 存在子博弈精煉Nash均衡,延伸: (1)電視節(jié)目扎推現(xiàn)象 (2)商業(yè)中心、產(chǎn)業(yè)集聚 (3)政黨爭議為何總是趨向中間路線?,兩人合作獵鹿,得鹿一頭(10)平分:各得價值5; 一人獵鹿一人獵兔:前者一無所有,后者得兔一只價值3; 二人均獵兔,各得兔一只,各得價值3.,3.獵鹿博弈,博弈說明: 完全信息靜態(tài)博弈 存在兩個純策略Nash均衡,黃色為均衡解,啟示: (1)企業(yè)強強聯(lián)合,接近于獵鹿模型的帕累托改善 (2)獵鹿模型是假設獵人雙方平均分配

14、獵物,如果分配權不同,可能無法帕累托改善 (3)多人狩獵博弈,根據(jù)分配可以分成既得利益集團與弱勢群體,大豬、小豬同槽,控制食物供應依靠按鈕。按一次按鈕有8個單位食物進槽,但需承擔2個單位的成本。按者后進槽。 若二者同時按按鈕同時進槽,大豬吃到5個食物,小豬3個 若小豬按按鈕大豬先進槽,大豬吃7個食物,小豬吃到1個 若大豬按按鈕小豬先進槽,大豬、小豬都吃到4個食物。,4.智豬博弈,博弈說明: 純策略均衡最優(yōu)策略:大豬按,小豬等待。 大豬的收益外部化,小豬不勞而獲,免費搭了大豬的便車。,黃色為均衡解,延伸: (1)新產(chǎn)品引入時,小企業(yè)的跟隨戰(zhàn)術 (2) 一個和尚挑水喝,兩個和尚抬水喝,三個和尚沒水

15、喝 (3) Scott公司 與可口可樂、百事可樂的競爭 (4) 股市上的小豬策略 (5) 改變機制,避免智豬搭便車,二人進行膽小鬼游戲,從兩頭沖向獨木橋。 如均勇進,則兩敗俱傷,效用均為-2; 若均膽怯,則受到嘲笑,效用為0; 如一方勇進一方膽怯,勇進方得到歡呼,效用4, 膽怯方受到嘲笑,效用-1.,5.膽小鬼博弈,博弈說明: 兩個純策略均衡最優(yōu)策略(膽怯,勇進)(勇進,膽怯) 狹路相逢勇者勝。,黃色為均衡解,延伸: (1)討債博弈 (2)房地產(chǎn)開發(fā)博弈 (3)賭博:跟還是不跟 (4) 贏者通吃輪流叫價拍賣,6.海盜分金,10個海盜分100金幣, 先由最兇殘的海盜來提出分配方案,然后大家一人一

16、票表決,如果有50%或以上的海盜同意這個方案,那么就以此方案分配,如果少于50%的海盜同意,那么這個提出方案的海盜就將被丟到海里去喂魚,然后由剩下的海盜中最兇殘的那個海盜提出方案,依此類推。,動態(tài)博弈的最優(yōu)策略: 96、0、1、0、1、0、1、0、1、0 先發(fā)優(yōu)勢很重要,先考慮只有2個海盜的情況(其他海盜已丟到海里)。記他們?yōu)镻1和P2,其中P2比較兇殘。P2的最佳方案當然是:他自己得100枚金幣,P1得0枚。投票時他自己的一票就足夠50%了。 往前推一步?,F(xiàn)在加一個更兇猛的海盜P3。P1知道P3知道他知道如果P3的方案被否決了,游戲就會只由P1和P2來繼續(xù),而P1就一枚金幣也得不到。所以P3

17、知道,只要給P1一枚金幣,P1就會同意他的方案。所以P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。 P4的情況差不多。他只要得兩票就可以了,給P2一枚金幣就可以讓他投票贊同這個方案,因為在接下來P3的方案中P2什么也得不到。P5也是相同的推理方法只不過他要說服他的兩個同伴,于是他給每一個在P4方案中什么也得不到的P1和P3一枚金幣,自己留下98枚。 依此類推。,延伸: (1)拉攏小人物,來對抗大人物 (2)歷史上的革命都是拉上貧苦大眾,練習:分豆子博弈,5個囚犯,分別按1-5號在裝有100顆綠豆的麻袋抓綠豆,規(guī)定每人至少抓一顆,而抓得最多和最少的人將被處死,而且,他們之間不能交

18、流,但在抓的時候,可以摸出剩下的豆子數(shù)。問他們中誰的存活幾率最大? 提示: 1,他們都是很聰明的人 2,他們的原則是先求保命,再去多殺人 3,100顆不必都分完 4,若有重復的情況,則也算最大或最小,一并處死,十支箭與四十追兵問題,假如你是一位英雄,手中的劍已經(jīng)折斷,而在你后面,正有一幫壞人追殺你。幸運的事,你騎著馬,而他們卻沒有。不幸的事,你的馬已經(jīng)筋疲力竭,而他們將最中會抓到你。幸好你有一把弓箭??上阒挥惺Ъ?。值得慶幸的事,作為一位英雄,你總是百發(fā)百中,從未失過手。糟糕的事,后面有四十個壞人,他們以一定的間隔在你身后橫向排開一隊,以最快的速度向前沖。他們離你很緊,已經(jīng)到了射程之內(nèi)。 請運用經(jīng)濟學的方法逃脫,7.最后通牒博弈,2個海盜分100金幣: A提出分配方案,如果B同意,則以此分配;若不同意,則雙方均一無所得,最優(yōu)策略: 1,99 后發(fā)優(yōu)勢也很重要,延伸: (1)男生給女生切蛋糕 (2)找工作時要求年薪很低,在進入選美博弈后看到的第一個頁面

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論