版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
博弈論與決策論1、幾個定義定義1.1博弈論(GameTheory),亦名“對策論”、“賽局理論”,屬應用數(shù)學的一個分支,目前在生物學、經濟學、國際關系、計算機科學、政治學、軍事戰(zhàn)略和其他很多學科都有廣泛的應用。博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有斗爭或競爭性質現(xiàn)象的數(shù)學理論和方法。也是運籌學的一個重要學科。博弈論考慮游戲中的個體的預測行為和實際行為,并研究它們的優(yōu)化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。定義1.2序貫博弈是指參與者選擇策略有時間先后的博弈形式。因此,某些對局者可能率先采取行動,它是一種較為典型的動態(tài)博弈,而重復博弈則可視為一種特殊的動態(tài)博弈形式。在序貫博弈中,先行者可能占據(jù)一定的有利地位,我們把它叫做先行者優(yōu)勢。定義1.3決策論(Decisiontheory)決策論是根據(jù)信息和評價準則,用數(shù)量方法尋找或選取最優(yōu)決策方案的科學,是運籌學的一個分支和決策分析的理論基礎。在實際生活與生產中對同一個問題所面臨的幾種自然情況或狀態(tài),又有幾種可選方案,就構成一個決策,而決策者為對付這些情況所取的對策方案就組成決策方案或策略。2、序貫博弈之例例1:桌上有25枚硬幣,每次可以取1枚、2枚或者3枚。你與對手交替選擇,誰先選到第25枚硬幣誰就勝利。假設你首先選擇,你這樣才能保證自己勝利?解答:你應當這樣選擇:每次選擇的最后一個數(shù)依次為1、5、9、13、17、21、25,這樣無論對方如何選擇,你均可以保證自己勝利。也就是說你要保證每次最后選擇的是4n+1型的數(shù)。而這種保證是可以做到的,讀者可以思考一下原因。推廣1:此類游戲可以推廣到選擇4k+1枚硬幣的情形,優(yōu)勝策略也是保證每次最后選擇的是4n+1型的數(shù)。推廣2:設步長為a,(例1中步長為3),則形如(a+1)k+1枚硬幣的情形,優(yōu)勝策略也是保證每次最后選擇的是(a+1)n+1型的數(shù)。3、囚徒困境3.1警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:若一人認罪并作證檢控對方(相關術語稱“背叛”對方),而對方保持沉默,此人將即時獲釋,沉默者將判監(jiān)10年。若二人都保持沉默(相關術語稱互相“合作”),則二人同樣判監(jiān)1年。若二人都互相檢舉(相關術語稱互相“背叛”),則二人同樣判監(jiān)8年。寫成以下收益矩陣的情況:3.2由收益矩陣可以看出雙方沉默是最好的選擇,這與實際中“抗拒從嚴,坦白從寬”的原則恰好相反。但是分析個人的選擇則這個原則是正確的,對于個人來說坦白是最好的選擇,當分開審理時得到的結果是雙方認罪。假如罪犯懂得博弈論和互相相信對方,肯定會保持沉默。3.3本例說明的是個人理性選擇與集體理性選擇的矛盾。3.4注:(-8,-8)這一點實際上就是納什均衡點,(-1,-1)這一點就是實現(xiàn)帕累托效率的那一點,但是它不是納什均衡點。納什均衡:(通俗定義)給定A的選擇,B選擇對自己最有利的策略;即給定B的選擇,A選擇對自己最有利的策略。這樣選擇得到的均衡點就是納什均衡。帕累托效率:在沒有使任何人境況變壞的前提下,也不可能再使某些人的處境變好。(即損人才能利己)4、田忌賽馬4.1齊國的大將田忌和齊威王約定,進行賽馬。他們把各自的馬分成上、中、下三等,每一等級的馬齊威王都比田忌的強,但是田忌的上等馬比齊王的中等馬強,田忌的中等馬比齊王下等馬強,我們分析這個博弈。4.2寫成以下收益矩陣:4.3我們可以看到針對一場比賽田忌的上等馬對齊王的中等馬或者下等馬會勝利,田忌的中等馬對齊王的下等馬會勝利,但是按照三局兩勝制就只能按照孫臏的方法才能取得勝利了。即田忌的下等馬對齊王的上等馬,上等馬對中等馬,中等馬對下等馬就可以三局兩勝了。4.4本例田忌只有在齊王先選擇的時候做此回應才可能取勝。4.5此博弈為零和博弈(每次決策的和為零),無純策略博弈納什均衡,但是有混合策略(以概率0<p<1選擇策略)博弈納什均衡。5、軍備競賽5.1美國與蘇聯(lián)進行軍備競賽,相互競爭生產核導彈。假設雙方的收益關系可以寫成以下的收益矩陣形式:5.2此博弈有兩個納什均衡點(4,4)與(2,2);但是雙方不生產帶來的效益比雙方生產帶來的效益大。如何才能達到(4,4)這一點?5.3如果一方宣布它已經停止部署核導彈,并給予另一方充分的證據(jù)來證明它的選擇,那么,另一方也會停止部署核導彈。(因為4>3,實際上,博弈通常情況下會自動趨向于納什均衡點。5.4納什定理:每個有限策略式博弈至少擁有一種納什均衡。(純策略或者混合策略納什均衡)注:此定理的嚴格證明比較復雜。納什本人因為此定理獲得1994年的諾貝爾經濟學獎。6、綁架博弈6.1假設綁匪挾持人質,但是人質家里拿不出錢來贖人。如果綁匪棄放人質,但是他擔心人質會泄露身份。我們思考有什么辦法讓綁匪放心地棄放人質。假設收益情況可以寫成以下博弈樹的形式:(第一項為綁匪的收益,第二項為人質的收益)博弈樹6.2一種辦法是綁匪拍寫人質不雅的照片(艷照門),如果人質泄露綁匪的身份,那么綁匪可以通過發(fā)布這些照片使人質帶來名譽的損失。7、敲竹杠7.1假設你請承包商建設一個倉庫,但是快建成時發(fā)現(xiàn)顏色不好看,這時承包商說要更改顏色可以,交1500元,可能實際成本只要200元。另外好看的顏色對于客戶值1500元。如果你考慮到另請一個油漆工需要交200元,另外時間成本為1400元。那么恭喜你,你肯定愿意被敲竹杠了。具體收益可以寫成以下博弈樹的形式:博弈樹7.2解決被敲竹杠的辦法:有經驗的客戶會通過提前在合同中注明的辦法來解決。另外如果你知道某位承包商有敲竹杠的愛好,你也不會請他來承包此工程。8、圣彼得堡悖論8.1假設你花20元去做以下游戲:設定擲出硬幣的正面或者反面為成功,游戲者如果第一次投擲成功,得獎金2元,游戲結束;第一次若不成功,繼續(xù)投擲,第二次成功得獎金4元,游戲結束;這樣,游戲者如果投擲不成功就反復繼續(xù)投擲,直到成功,游戲結束。如果第n次投擲成功,得獎金元,游戲結束。這樣做值得嗎?8.2照數(shù)學期望的計算方法,將每一個可能結果的得獎值乘以該結果發(fā)生的概率即可得到該結果獎值的期望值。游戲的期望值即為所有可能結果的期望值之和。隨著n的增大,以后的結果雖然概率很小,但是其獎值越來越大,每一個結果的期望值均為1,所有可能結果的得獎期望值之和,即游戲的期望值,將為“無窮大”。按照概率的理論,多次試驗的結果將會接近于其數(shù)學期望。但是實際的投擲結果和計算都表明,多次投擲的結果,其平均值最多也就是幾十元。8.3利用電腦進行模擬試驗的結果說明,實際試驗的平均值—樣本均值是隨著實驗次數(shù)的增加而變化的。在大量實驗以后,其實驗均值X可以近似表示為X≈logn/log2,可見當實驗次數(shù)趨向無窮大的時候,樣本均值也趨向無窮大。比如100萬即
次實驗的平均值約等于6/0.301=19.9,即20元左右。8.4雖然這個游戲在原理上是公平的,但是幾乎沒有人有時間去做100萬次以上的這種拋硬幣游戲,故花20元去做此游戲是不值得的。當然,你有足夠的精力去做這件事,還是可以賺錢的。8.5丹尼爾·伯努利對這個悖論的解答在1738年的論文里,提出了效用的概念以挑戰(zhàn)以金額期望值為決策標準
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《朝花夕拾》父親的病課件
- 古代漢語職官介紹
- 2026年六安職業(yè)技術學院單招職業(yè)技能測試模擬測試卷附答案解析
- 古今中外文學史講解課件
- 2025年南京科技職業(yè)學院馬克思主義基本原理概論期末考試模擬題帶答案解析(必刷)
- 2024年重慶藝術工程職業(yè)學院馬克思主義基本原理概論期末考試題及答案解析(必刷)
- 2025年南京郵電大學通達學院馬克思主義基本原理概論期末考試模擬題附答案解析
- 2026年三峽旅游職業(yè)技術學院單招職業(yè)適應性考試模擬測試卷附答案解析
- 2025年山西能源學院馬克思主義基本原理概論期末考試模擬題及答案解析(必刷)
- 2025年廣東農工商職業(yè)技術學院馬克思主義基本原理概論期末考試模擬題及答案解析(必刷)
- 蘇教版數(shù)學三年級上冊備課計劃
- 大采高綜采工作面操作規(guī)程
- 保密車間出入管理制度
- 肯德基副經理養(yǎng)成課程
- 鐵路勞動安全 課件 第四章 機務勞動安全
- 智慧人社大數(shù)據(jù)綜合分析平臺整體解決方案智慧社保大數(shù)據(jù)綜合分析平臺整體解決方案
- 脊柱與四肢檢查課件
- 2024年河北省供銷合作總社招聘筆試參考題庫附帶答案詳解
- 宅基地及地上房屋確權登記申請審批表
- 醫(yī)療衛(wèi)生輿情課件
- 2024年甘肅省安全員A證考試題庫及答案
評論
0/150
提交評論