下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、經(jīng)典博弈故事之二情侶博弈,大海和小麗正在熱戀。難得的周末又到了,安排什么節(jié)目呢?周末晚上,中國(guó)足球隊(duì)要在世界杯外圍賽中和伊朗隊(duì)做生死之戰(zhàn)。大海是個(gè)超級(jí)球迷,國(guó)內(nèi)的甲級(jí)聯(lián)賽都不肯放過,何況是不爭(zhēng)氣的國(guó)家隊(duì)的生死大戰(zhàn)?也正好是這個(gè)周末的晚上,俄羅斯一個(gè)著名芭蕾舞團(tuán)蒞臨該市演出芭蕾舞劇胡桃夾子。麗娟最崇尚鋼琴、芭蕾這樣的高雅藝術(shù),對(duì)斯拉夫民族的歌唱和芭蕾更是崇拜得五體投地,她怎么肯放過正宗俄羅斯的芭蕾舞劇胡桃夾子?這么說,一個(gè)在家里看電視直播的足球,一個(gè)去劇院看芭蕾舞演出不就得了?問題在于他們是熱戀中的情侶,分開各自度過這難得的周末時(shí)光,才是最不樂意的事情。這樣一來,他們就面臨一場(chǎng)溫情籠罩下的“博弈
2、” 在情侶博弈中, 我們不妨這樣給大海和小麗的“滿意程度”賦值:如果大??辞蜃屝←愐粋€(gè)人去看芭蕾,雙方的滿意程度都為0;兩人一起去看足球,大海的滿意程度為2,小麗的滿意程度為1;兩人一起去看芭蕾,大海的滿意程度為1,小麗的滿意程度為2。應(yīng)該不會(huì)有小麗獨(dú)自看球而大海獨(dú)自去看芭蕾的可能,不過人們還是把它寫出來,設(shè)想因此雙方的滿意程度都是1。 試著用一個(gè)得益矩陣來描述大海和麗娟的情侶博弈,情侶博弈的得益矩陣,1 2,足球,芭蕾,芭蕾,足球,2 1,小 麗,大 海,0 0,1 1,靠左走還是靠右走,在一個(gè)沒有交通規(guī)范的農(nóng)村小路騎自行車,你應(yīng)該走在道路的哪一邊? 假如別人靠右(左)走,你也 靠右(左)走
3、,則不會(huì)相撞;反之,假如別人靠右(左)走,而你卻反其道而行之,偏要靠左(右)走,則必然相撞。 假設(shè)行走順利,每人獲益為1,相撞,則獲益為1, 畫出得益矩陣,交通博弈,靠左行,靠右行,靠左行,靠右行,1,1,1,1,-1,-1,-1,-1,甲,乙,經(jīng)典博弈故事之三智豬博弈,籠子里面有兩只豬,一只比較大,一只比較小?;\子很長(zhǎng),一頭有一個(gè)按鈕,另一頭是飼料的出口和食槽。按一下按鈕,將有相當(dāng)于10個(gè)單位的豬食進(jìn)槽,但是按按鈕以后跑到食槽所需要付出“勞動(dòng)”,加起來要消耗相當(dāng)于2個(gè)單位的豬食。問題是按鈕和食槽分置籠子的兩端,按按鈕的豬付出勞動(dòng)跑到食槽的時(shí)候,坐享其成的另一頭豬早已吃了不少。如果大豬先到,大
4、豬呼啦啦吃到9個(gè)單位,小豬只能吃到1個(gè)單位;如果同時(shí)到達(dá),大豬吃到7個(gè)單位;小豬吃到3個(gè)單位;如果小豬先到,小豬可以吃到4個(gè)單位,而大豬吃到6個(gè)單位。 畫出智豬博弈的得益矩陣,“智豬博弈”(boxed pigs),按,等待,按,等待,5,1,4,4,9,1,0,0,大 豬,小 豬,經(jīng)典博弈之四獵人博弈,設(shè)想在古代的一個(gè)地方,有兩個(gè)獵人。那時(shí)候,狩獵是人們的主要生計(jì)。為了簡(jiǎn)單起見,假設(shè)主要的獵物只有兩種: 鹿,兔子。在古代,人類的狩獵手段還比較落后,弓箭威力也有限。在這樣的條件下,我們可以進(jìn)一步假設(shè),兩個(gè)獵人一起去獵鹿,才能獵獲一只鹿,如果一個(gè)獵人單兵作戰(zhàn),他只能打到4只兔子。如果他打兔子,你去
5、獵鹿,他可以打到4只兔子,而你一無所獲,得0。 假設(shè)打到一只鹿,兩家平分,每家管10天;打到4只兔子,只能供一家吃4天。 畫出得益矩陣,獵人博弈得益矩陣,甲,乙,獵鹿 打兔,獵鹿,打兔,博弈論故事之五高薪養(yǎng)廉,“高薪養(yǎng)廉”是公務(wù)員制度方面的一種理論,我們分析一下“高薪”為什么能養(yǎng)廉? 假設(shè)甲乙為一家單位的主任和書記關(guān)系密切的國(guó)家公務(wù)員,7代表現(xiàn)在政府給他們的高薪。如果兩人受賄,因?yàn)榇\而一時(shí)不被人發(fā)現(xiàn),他們可以達(dá)到9的位置;而一旦“東窗事發(fā)”,他就要被撤職查辦, 不受賄一方得8 畫出得益矩陣,博弈論故事之五高薪養(yǎng)廉,我們把數(shù)據(jù)改變一下,變成薪水只有2,兩個(gè)串謀,同時(shí)受賄還是得9;一方受賄,一方
6、不受賄,則分別為2,3。 得益矩陣?,高薪養(yǎng)廉的得益矩陣,甲,受 賄 不 受 賄,受賄 不受賄,受 賄 不 受 賄,受賄 不受賄,乙,乙,甲,完全信息靜態(tài)博弈,完全信息:各博弈方都完全了解所有博弈方各種情況下得益 靜態(tài):博弈方是同時(shí)決策的,或者雖然各博弈方?jīng)Q策的時(shí)間不一定真正一致,但他們?cè)谧鰶Q策時(shí)互相不知道其他博弈方的策略。 完全信息靜態(tài)博弈:各博弈方同時(shí)決策,且所有博弈方對(duì)各方得益都了解的博弈。 如何求這一類博弈的解呢?博弈的結(jié)果如何?博弈各方最終的策略組合?,上策均衡法,上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策 上策:不管其它博弈方選擇什么策略,一博弈方的某個(gè)策
7、略給他帶來的得益始終高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;雙寡頭削價(jià)中“低價(jià)”。 上策均衡反應(yīng)了所有方的絕對(duì)偏好,因此是非常穩(wěn)定 ,可以作出最肯定的預(yù)測(cè)。 上策均衡不是普遍存在的,所以該方法失效 失效原因:,-3, -3,0, -6,-6, 0,-1, -1,坦 白,不坦白,坦 白,不坦白,兩個(gè)罪犯的得益矩陣,囚徒 2,囚 徒 1,嚴(yán)格下策反復(fù)消去法,嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略 思路: 任何理性的博弈方都不可能選擇嚴(yán)格下策 把不可能選擇的嚴(yán)格下策先排除掉排除法,從而留下較好的策略 做法: 首先
8、找出某博弈人的嚴(yán)格下策,把這個(gè)嚴(yán)格下策剔除后,剩下的是一個(gè)不包含已剔除劣策略的新的博弈;然后再剔除這個(gè)新的博弈中的嚴(yán)格下策;繼續(xù)這個(gè)過程,直到?jīng)]有劣策略存在。如果剩下的策略組合是唯一的,這個(gè)唯一的策略組合就是嚴(yán)格下策反復(fù)消去法的均衡,嚴(yán)格下策反復(fù)消去法,嚴(yán)格下策反復(fù)消去法,智豬博弈,按,等待,按,等待,5,1,4,4,9,1,0,0,大 豬,小 豬,嚴(yán)格下策反復(fù)消去法,適用面: 嚴(yán)格下策反復(fù)消去法的適用面比上策均衡要更大些 但也有很多博弈問題沒有嚴(yán)格下策:田忌賽馬、猜硬幣、情侶博弈、交通博弈、石頭剪刀布、此時(shí),該方法失效。 最大的用處:簡(jiǎn)化博弈 失效原因 不同策略之間沒有絕對(duì)的優(yōu)劣,而只存在相
9、對(duì)的、有條件的優(yōu)劣,劃 線 法,思路: 以策略之間的相對(duì)優(yōu)劣關(guān)系,而不是絕對(duì)優(yōu)劣關(guān)系為基礎(chǔ) 先找出自己針對(duì)其他博弈方每種策略或策略組合(多人博弈)的最佳對(duì)策, 然后在此基礎(chǔ)上,通過對(duì)其他博弈方策略選擇的判斷, 預(yù)測(cè)可能的結(jié)果和確定自己的最優(yōu)策略 只有,兩方均被劃線的策略組合,才是穩(wěn)定的策略表明給定一方采用該策略組合中的策略,則另一方也愿意采用該策略組合中的策略,該策略組合具有穩(wěn)定性。 但是,許多博弈根本不不存在確定性的結(jié)果,劃線法失效,比如猜硬幣沒有一個(gè)策略組合是雙方同時(shí)愿意接受的,這樣的博弈根本不可能有可以預(yù)言的博弈結(jié)果 也有時(shí):情侶博弈中,用劃線法有兩個(gè)策略組合同時(shí)下面劃線,這意味著兩個(gè)策
10、略組合中的雙方策略都是對(duì)對(duì)方策略的最佳對(duì)策都具有內(nèi)在的穩(wěn)定性但具體那一個(gè)會(huì)出現(xiàn),無法確定。,劃線法,課堂習(xí)題,用劃線法求出均衡解,C1,C2,C3,R1,R2,R3,0,4,4,0,5,3,4,0,0,4,5,3,3,5,3,5,6,6,箭 頭 法,思路: 對(duì)博弈中的每一個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加得益 與劃線法一樣都是基于策略之間的相對(duì)優(yōu)劣關(guān)系進(jìn)行分析的,所得到的結(jié)果也是一致的。 如果能,則從所分析的策略組合對(duì)應(yīng)的得益數(shù)組引一箭頭,到改變策略后策略組合對(duì)應(yīng)的得益數(shù)組 最后,只有指向,沒有離開的策略組合為均衡解穩(wěn)定沒有人愿意單獨(dú)改變,箭 頭
11、 法,納什均衡的定義,納什均衡:所有參與人的最優(yōu)策略的組合給定該策略中 別人的選擇,沒有人有積極性改變自己的選擇。 策略空間: 博弈方 的第 個(gè)策略: 博弈方 的得益: 博弈: 納什均衡:在博弈 中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合 中,任一博弈方 的策略,都是對(duì)其余博弈方策略的組合 的最佳對(duì)策,也即 對(duì)任意 都成立,則稱 為 的一個(gè)納什均衡,納什均衡的一致預(yù)測(cè)性質(zhì),一致預(yù)測(cè): 如果所有博弈方都預(yù)測(cè)一個(gè)特定博弈結(jié)果會(huì)出現(xiàn),所有博弈方都不會(huì)利用該預(yù)測(cè)或者這種預(yù)測(cè)能力,選擇與預(yù)測(cè)結(jié)果不一致的策略,即沒有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望,因此預(yù)測(cè)結(jié)果會(huì)成為博弈的最終結(jié)果 穩(wěn)定的和自我
12、強(qiáng)制的,所以是真正可預(yù)測(cè)的 反之,不具有一致預(yù)測(cè)性的博弈結(jié)果,則難以避免預(yù)測(cè)和行為之間的矛盾,甚至是自我否定的。 只有納什均衡才具有一致預(yù)測(cè)的性質(zhì) 一致預(yù)測(cè)性是納什均衡的本質(zhì)屬性 一致預(yù)測(cè)并不意味著一定能準(zhǔn)確預(yù)測(cè),因?yàn)橛卸嘀鼐?,預(yù)測(cè)不一致的可能,尋找納什均衡,C1,C2,C3,R1,R2,R3,100,100,0,0,50,101,50,0,1,1,60,0,0,300,0,0,200,200,納什均衡:舉例,廣告博弈 納什均衡:(做廣告,做廣告),企業(yè)1,企業(yè)2,上次的作業(yè),畫出田忌賽馬的得益矩陣 畫出猜硬幣博弈的得益矩陣 畫出石頭、剪子、布的得益矩陣 能否用我們今天的幾種方法得到均衡解?
13、 你覺得它們的最佳應(yīng)對(duì)策略是什么?,嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn),一、猜硬幣博弈,(1)不存在前面定義的納什均衡策略組合 (2)關(guān)鍵是不能讓對(duì)方猜到自己策略保持隨機(jī)性 這類博弈很多,引出混合策略納什均衡概念,混合策略、混合策略博弈 和混合策略納什均衡,混合策略:在博弈 中,博弈方 的策略空間為 ,則博弈方 以概率分布 隨機(jī)在其 個(gè)可選策略中選擇的“策略”,稱為一個(gè)“混合策略”,其中 對(duì) 都成立,且 混合策略擴(kuò)展博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個(gè)博弈,就是原博弈的“混合策略擴(kuò)展博弈) 混合策略納什均衡:包含混合策略的策略組合,構(gòu)成納什均衡任何博弈一方單獨(dú)改變自己的策略
14、,或者隨機(jī)選擇各個(gè)純策略的概率分布,都不能給自己增加任何利益,求混合策略納什均衡,思路: 各個(gè)博弈方選擇的純策略的概率分布,要求滿足使對(duì)方或其他博弈方采用不同策略的期望收益相同,一個(gè)例子,該博弈無純策略納什均衡,可用混合策略納什均衡分析,策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6,pA+pB=1; pC+pD=1,齊威王田忌賽馬,Pa Pb Pc Pd Pe Pf,Pg ph pi pj pk pl,多重均衡博弈和混合策略,情侶博弈的混合策略納什均衡,夫妻之爭(zhēng)博弈的混合策略納什均衡 策略 得益 妻子 (0.75,0.25) 0.67 丈夫 (1/3,
15、2/3) 0.75,制式問題,制式問題混合策略納什均衡 A B 得益 廠商1: 0.4 0.6 0.664 廠商2: 0.67 0.33 1.296,混合策略和嚴(yán)格下策反復(fù)消去法,在包括混合策略的情況下,關(guān)于嚴(yán)格下策反復(fù)消去法的結(jié)論仍然成立 即任何一方都不會(huì)采用任何嚴(yán)格下策,不管它們是純策略還是混合策略 嚴(yán)格下策反復(fù)消去法不會(huì)消去任何納什均衡,包括純策略和混合策略 如果經(jīng)過反復(fù)消去后留下的策略組合是唯一的,那么一定是納什均衡,混合策略和嚴(yán)格下策反復(fù)消去法,混合策略反應(yīng)函數(shù)反應(yīng)函數(shù):一博弈方對(duì)另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù),(r,1-r):蓋硬幣方選擇正反面的混合策略概率分
16、布 (q,1-q):猜硬幣方選擇正反面的混合策略概率分布,則蓋幣方的期望支付為:2r(1-2q)+(2q-1) 猜幣方的期望支付為:2q(2r-1)-(2r-1),猜硬幣博弈,蓋幣方的反應(yīng)函數(shù): 0 如果q1/2 r=0,1 如果q=1/2 1 如果q1/2,猜幣方的反應(yīng)函數(shù): 1 如果r1/2 q=0,1 如果r=1/2 0 如果r1/2,情侶博弈,納什均衡的選擇和分析方法擴(kuò)展,多重納什均衡博弈的分析 共謀和防共謀均衡,多重納什均衡博弈的分析,帕累托上策均衡 風(fēng)險(xiǎn)上策均衡 聚點(diǎn)均衡 相關(guān)均衡,一、帕累托上策均衡,(鷹鴿博弈) 這個(gè)博弈中有兩個(gè)純策略 納什均衡,(戰(zhàn)爭(zhēng),戰(zhàn)爭(zhēng)) 和(和平,和平)
17、,顯然 后者帕累托優(yōu)于前者,所 以,(和平,和平)是本 博弈的一個(gè)帕累托上策均衡。,二、風(fēng)險(xiǎn)上策均衡,考慮、顧忌博弈方、其他博弈方可能發(fā)生錯(cuò)誤等時(shí),帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮:風(fēng)險(xiǎn)上策均衡。下面就是兩個(gè)例子。,三、聚點(diǎn)均衡,利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡 文化、習(xí)慣或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù) 城市博弈(城市分組相同)、時(shí)間博弈(報(bào)出相同的時(shí)間)是聚點(diǎn)均衡的典型例子,實(shí)驗(yàn):城市博弈,規(guī)則:由兩個(gè)人各自獨(dú)立將上海、南京、長(zhǎng)春、哈爾濱四個(gè)城市分為2組(每組 兩個(gè)城市),若兩人分法相同則各得100元,否則沒有獎(jiǎng)金。,一、多人博弈中的共謀問題 本博弈的純策略納什均衡:(U,L,A)、(D,R,B) 前者帕累托優(yōu)于后者。博弈的結(jié)果會(huì)是什么呢? (U,L,A)有共謀 (Coalition)問題:博弈方1和2同時(shí)偏離。,共謀和防共謀均衡,二、防共謀均衡,如果一個(gè)博弈的某個(gè)策略組合滿足下列要求: (1)沒有任何單個(gè)博弈方的“串通”會(huì)改變博弈的結(jié)果,即單獨(dú)改變策略無利可圖; (2)給定選擇偏離的博弈方有再次偏離的自由時(shí),沒有任何兩個(gè)博弈方的串通會(huì)改變博弈的結(jié)果; (3)依此類推,直到所有博弈方都參加的串通也不會(huì)改變博弈的結(jié)果。 稱為“防共謀均衡”。 前面例子中:(D,R,B) 是防共謀均衡 (U,L,A)不是防共謀均衡,雜貨鋪定位,設(shè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 妊娠期免疫抑制劑治療窗管理策略
- 妊娠期代謝異常的營(yíng)養(yǎng)-內(nèi)分泌管理策略
- 妊娠合并地貧的產(chǎn)前基因診斷策略
- 鞍山美術(shù)考試題目及答案
- 大數(shù)據(jù)支持下社區(qū)慢病防控的精準(zhǔn)化路徑
- 醫(yī)學(xué)考試大題題庫及答案
- 2025年中職(調(diào)味品生產(chǎn)技術(shù))調(diào)味品制作階段測(cè)試題及答案
- 2025年大學(xué)建筑工程施工(鋼筋綁扎工藝)試題及答案
- 2025年中職(新能源汽車技術(shù))新能源汽車概論試題及答案
- 2025年中職電子電器應(yīng)用與維修(電子電器應(yīng)用)試題及答案
- 跨境電子商務(wù)教案
- 中國(guó)的“愛經(jīng)”(一)-《天地陰陽交⊥歡大樂賦》
- 心房鈉尿肽基因敲除小鼠的繁殖和鑒定
- 母嬰護(hù)理職業(yè)道德課件
- 廣元市利州區(qū)何家坪石材廠飾面用灰?guī)r礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 醫(yī)療廢物處理方案
- 船舶靠離泊作業(yè)風(fēng)險(xiǎn)辨識(shí)表
- 口腔頜面外科學(xué)(全)
- 安徽金軒科技有限公司 年產(chǎn)60萬噸硫磺制酸項(xiàng)目環(huán)境影響報(bào)告書
- 魔鬼理論之k線秘笈圖解課件
- 2023屆廣東省佛山市普通高中高三上學(xué)期教學(xué)質(zhì)量檢測(cè)(一模)物理試題含答案
評(píng)論
0/150
提交評(píng)論