第2章博弈的基本知識(shí)

上傳人：知*** IP屬地：廣東上傳時(shí)間：2026-01-29 格式：PPT 頁數(shù)：28 大?。?37KB 積分：5.99 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩23頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第2章博弈的基本知識(shí)一、博弈的構(gòu)成要素1、參與人：參與人指的是一個(gè)博弈中的決策主體，他的目的是通過選擇行動(dòng)（或戰(zhàn)略）以最大化自己的支付（效用）水平。不作決策的被動(dòng)主體只當(dāng)作環(huán)境參數(shù)來處理。在房地產(chǎn)開發(fā)博弈中，有兩個(gè)參與人，即“開發(fā)商A“和“開發(fā)商B”，而寫字樓的需求者被當(dāng)做環(huán)境變量某省市場需求中”。博弈的外部環(huán)境（environoment）：外部環(huán)境的改變將影響博弈均衡2、行動(dòng)：行動(dòng)是參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。參與人的行動(dòng)可以是離散的，也可以是連續(xù)的。

囚徒困境寡頭產(chǎn)量競爭的古諾模型行動(dòng)組合和行動(dòng)順序3、信息：參與人有關(guān)博弈的知識(shí)，特別是有關(guān)“自然”的選擇、其他參與人的特征和行動(dòng)的知識(shí)。信息集：一個(gè)參與人無法準(zhǔn)確知道的變量的全體屬于一個(gè)信息集。自然：是指決定外生的隨機(jī)變量的概率分布的機(jī)制。

海薩尼轉(zhuǎn)換完美信息：一個(gè)參與人對(duì)其它參與人（包括虛擬參與人“自然”）的行動(dòng)有準(zhǔn)確了解的情況。完全信息：自然不首先行動(dòng)或自然的初始行動(dòng)被所有參與人準(zhǔn)確觀察到的情況，即沒有事前的不確定性。共同知識(shí)：每個(gè)博弈者都知道該事實(shí)，每個(gè)博弈者都知道每個(gè)博弈者都知道該事實(shí)，這樣無窮推演下去，也即是說，（每個(gè)博弈者都知道）k每個(gè)博弈者都知道該事實(shí)。例：兩個(gè)學(xué)生與一起玩猜帽子的游戲：學(xué)生甲學(xué)生乙頭上各戴有一頂帽子，帽子只可能是紅色或白色，而事實(shí)上每個(gè)學(xué)生戴的都是紅帽子。甲乙均可看到對(duì)方，但看不到自己帽子的顏按照先甲后已的順序依次問，“你能確定自己頭上帽子的顏色嗎？”學(xué)生只回答能或不能。此時(shí)兩學(xué)生的回答各是什么？進(jìn)一步宣布，“至少有一頂帽子是紅色！”那么兩人的回答又各是什么？4、戰(zhàn)略（strategy）：參與人在給定信息集的情況下的行動(dòng)規(guī)則，它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身。

策略（strategy）：參與者在給定信息集的情況下選擇行動(dòng)的規(guī)則，它規(guī)定參與者在什么情況下選擇什么行動(dòng)，是參與者的“相機(jī)行動(dòng)方案”，包括參與者采取行動(dòng)的完整描述。對(duì)于靜態(tài)博弈，策略等于行動(dòng)；對(duì)于動(dòng)態(tài)博弈，策略針對(duì)不同情況由一系列不同階段分別采取的行動(dòng)構(gòu)成?！皵巢环肝?，我不犯敵；敵若犯我，我必犯敵”理解：策略可以理解成指示參與人進(jìn)行博弈的一系列指令，必須毫無遺漏；參與人按照指令參與博弈，本身沒有任何主觀的直覺判斷意圖。相當(dāng)于計(jì)算機(jī)按照既定程序運(yùn)行，從而簡化了行為的分析。思考：理性限制使得參與者的思考過程機(jī)械化,從而實(shí)現(xiàn)數(shù)學(xué)建模5、結(jié)果：在規(guī)則允有行動(dòng)進(jìn)行完畢之后，最終結(jié)果怎樣。各博弈參與者采取不同的行動(dòng)會(huì)帶來不同的博弈結(jié)果。6、支付：在博弈論中，支付是指在一個(gè)特定的戰(zhàn)略組合下參與人得到的確定效用水平，或者是指參與人得到的期望效用水平。二、博弈的表示方式（一）博弈的規(guī)范式（二）博弈的擴(kuò)展式對(duì)弈：仙人對(duì)弈圖（局部放大圖，）“策略式”模型(Shapley，1973采用這一術(shù)語，最初采用“標(biāo)準(zhǔn)式”)策略式表述模型是把每一可行的策略向量與支付向量相聯(lián)系的函數(shù)（X1,…,Xn；u1,…,un）?！安呗允健北硎瞿Ｐ捅仨氄f明：（1）參與者集合{A,B}；（2）每個(gè)參與者的可行策略集合{N,NP}；（3）每個(gè)參與者采取某一可行的行動(dòng)組合時(shí)，所獲得的支付。注：策略式表述不涉及行動(dòng)順序。

-8，-80，-10-10，0-1，-1坦白P抵賴NP坦白P抵賴NP囚徒B囚徒A“擴(kuò)展式”模型(VonNeumann和O.Morgenstern，1944)擴(kuò)展式表述模型準(zhǔn)確描述了參與者的行動(dòng)順序和參與者采取行動(dòng)時(shí)所擁有的信息?！皵U(kuò)展式”表述模型必須說明：（1）參與者集合；（2）該輪到誰采取行動(dòng)；（3）在他（她）的每個(gè)信息集中，可以選擇什么；（4）在他（她）做出決策時(shí)，知道什么；（5）每個(gè)參與者采取某一可行的行動(dòng)組合時(shí)，所獲得的支付。思考：同時(shí)行動(dòng)博弈是否可采用擴(kuò)展式表述模型？擴(kuò)展式博弈用博弈樹（gametree）表示：結(jié)點(diǎn)：包括初始結(jié)點(diǎn)、決策結(jié)點(diǎn)(作出決策)、終結(jié)點(diǎn)(對(duì)應(yīng)參與者報(bào)酬)；若結(jié)點(diǎn)是有限的，則稱有限次博弈。枝：從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與者的一個(gè)行動(dòng)選擇；信息集：一個(gè)參與者無法作出區(qū)分的最大決策點(diǎn)集合（如圖，囚徒B無法判斷A的行動(dòng)，因此其信息集為虛線連接）。例：擴(kuò)展式囚徒困境B(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵賴坦白抵賴坦白抵賴“擴(kuò)展式”模型的幾點(diǎn)說明：當(dāng)事件中有偶然因素介入時(shí)，在初始結(jié)點(diǎn)引入“自然”參與者，因?yàn)榕既灰蛩氐葍r(jià)于“自然”在參與人之前行動(dòng)但參與人不能觀測到。完美回憶（perfectrecall）——通俗描述：當(dāng)輪到某個(gè)參與者行動(dòng)時(shí)，從不會(huì)忘記過去知道什么，做了些什么?！獦?biāo)準(zhǔn)描述：在博弈樹的每個(gè)信息集處，每個(gè)參與者知道以前的所有信息集，和在那些信息集所做的決策完美信息：如果博弈樹的所有信息都是單結(jié)的，該博弈稱為完美信息博弈。121UDRLLR練習(xí)1：“擴(kuò)展式”表述模型的一個(gè)例子雙人博弈中，每人都有兩種行動(dòng)，參與者1先行。a參與者2知道1的行動(dòng)；b參與者2不知道1的行動(dòng)；c有偶然行動(dòng)，且2不知道1的行動(dòng)1212N12練習(xí)2：剪刀-石頭-布：雙人博弈中，同時(shí)行動(dòng)，每人有三個(gè)策略（石頭Rock、剪刀Scissors、布Cloths）思考：如何用擴(kuò)展式表述模型？0，01，-1-1，1-1，10，01，-11，-1-1，10，0CRCRSS12C12RCSRRRCCSSS(0,0)(-1,1)(1,-1)(1,-1)(0,0)(-1,1)(-1,1)(1,-1)(0,0)RCSRRRCCSSS21(0,0)(-1,1)(1,-1)(1,-1)(0,0)(-1,1)(-1,1)(1,-1)(0,0)對(duì)于非合作博弈的表述形式；

——“擴(kuò)展式”模型（extensive-form）

——“策略式（標(biāo)準(zhǔn)式）”模型（strategic-form）“策略式”僅適用靜態(tài)博弈例2：擴(kuò)展式囚徒困境B(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵賴坦白抵賴坦白抵賴囚徒A坦白抵賴坦白抵賴囚徒B例1：策略式囚徒困境-8，-80，-10-10，0-1，-1（一）經(jīng)驗(yàn)主義博弈論與經(jīng)驗(yàn)主義：博弈論并不是僅用于示意性說明的智力游戲，而是來源于社會(huì)現(xiàn)實(shí)中的矛盾沖突與合作。

——博弈模型需要經(jīng)驗(yàn)證明：或者實(shí)驗(yàn)室進(jìn)行；或者實(shí)地檢驗(yàn)。(1)實(shí)驗(yàn)博弈：在可控的實(shí)驗(yàn)條件下進(jìn)行有關(guān)策略相互作用的經(jīng)驗(yàn)性研究。(2)通過分析經(jīng)濟(jì)社會(huì)的歷史數(shù)據(jù)分析，可以對(duì)博弈模型的“理性”行為加以檢驗(yàn)——即計(jì)量革命。三、其它重要概念（二）均衡均衡的存在性：納什定理（1950，利用不動(dòng)點(diǎn)定理證明）均衡的唯一性：非常不幸，經(jīng)常面臨的一個(gè)苦惱就是多個(gè)均衡同時(shí)存在（世界的多樣性）非合作博弈理論的主要研究問題：多重均衡的選擇與精練問題選擇（selection）與精練（perfection）選擇問題：在非合作博弈中，一些威脅和承諾是不可信的，如何選擇那些能夠?qū)崿F(xiàn)一致預(yù)期的均衡結(jié)果；精練問題：對(duì)于博弈存在多重均衡的情況，如何判斷哪些均衡更有可能實(shí)現(xiàn)。三、其它重要概念博弈均衡是如何形成的？？

Nas論文“Non-cooperativegames”（1950年）給出Nash均衡的兩種解釋，一種是“理性主義”某省市的、演繹的傳統(tǒng)解說——均衡是通過理性的參與者進(jìn)行嚴(yán)密的邏輯演繹推理得到的，對(duì)參與者的理性能力有較高要求（傳統(tǒng)博弈分析，頓悟）。一種是學(xué)習(xí)的、歸納的、演化的解說——當(dāng)時(shí)沒有很好的方法構(gòu)建數(shù)學(xué)模型（國際上90年代興起演化博弈理論，漸悟）。佛教禪宗六祖慧能“頓悟”

六祖慧能原在一家小旅館里打雜，有一天在給客人收拾東西的時(shí)候聽客人在念《金剛經(jīng)》。六祖慧能聽罷便覺其某著名企業(yè)義博大，于是決心出家為僧。他投在五祖弘忍門下，每日做些雜務(wù)。有一日，五祖要門下眾人將自己領(lǐng)悟的佛法寫做一偈，大弟子神秀在門前徘徊，又返回居所。后來在墻上寫的是：身若菩提樹，心如明鏡臺(tái)。時(shí)時(shí)勤拂拭，莫使惹塵埃（漸悟）。弟子們看見了十分欽佩。五祖看了，卻說他還沒有領(lǐng)悟佛法的真諦。眾弟子自然不明白其中的道理。又一日，有游客入寺。慧能請(qǐng)求游客幫忙，游客問他你為什么不自己寫呢？慧能說我不識(shí)得字。游客笑他說：你連字都不識(shí)還能領(lǐng)悟佛法？慧能說我能否領(lǐng)悟，你看偈語便知道了。游客笑道：那好，你若能領(lǐng)悟，別忘記引我入法門啊！于是，慧能說，那游客寫道：菩提本無樹，明鏡亦非臺(tái)。本來無一物，何處惹塵埃？（頓悟）眾人看后大驚，才知慧能果然領(lǐng)悟了佛法真諦！就這樣，五祖將衣缽傳與六祖慧能。而神秀則是北派佛教一代宗師！理性主義的均衡實(shí)現(xiàn)：均衡形成的“理性主義”的傳統(tǒng)博弈觀點(diǎn)，認(rèn)為均衡形成純粹是一個(gè)高度理性的智力游戲，并在瞬間實(shí)現(xiàn)了均衡。局限性舉例：分：兩個(gè)參與者對(duì)100美圓協(xié)商進(jìn)行分配，如果無法達(dá)成一致意見，則都得不到。理論分析結(jié)果：在［0，100］之間的連續(xù)集合上有無限多均衡。實(shí)際結(jié)果將是50：50——因?yàn)檫@一均衡具有符合公平的社會(huì)原則特點(diǎn)，成為吸引注意力的焦點(diǎn)。Schelling（1960）提出焦點(diǎn)理論（focal-point）——多重均衡中考慮公平、效率、對(duì)等原則等社會(huì)和文化習(xí)俗因素。該觀點(diǎn)是在個(gè)體“冰冷的”理性選擇中（經(jīng)濟(jì)學(xué)規(guī)范），引入了社會(huì)準(zhǔn)則的倫理道德（社會(huì)學(xué)規(guī)范）。演化主義的均衡實(shí)現(xiàn)：真實(shí)世界中，有限理性的人們，行為具有模仿、經(jīng)驗(yàn)主義的、慣例特征，從錯(cuò)誤和嘗試中進(jìn)行學(xué)習(xí)。（

“摸石頭過河”）由于實(shí)際中會(huì)發(fā)生重復(fù)，時(shí)間彌補(bǔ)了較弱的理性。在學(xué)習(xí)過程中，有限理性的參與者在觀察對(duì)手的行動(dòng)后，根據(jù)一些實(shí)用主義的修正原則（各種動(dòng)態(tài)調(diào)整過程），修改關(guān)于對(duì)手未來采取行動(dòng)的預(yù)期。一個(gè)有意思的結(jié)果：如果動(dòng)態(tài)的過程是收斂的，則將趨向于傳統(tǒng)博弈的均衡點(diǎn)。即使參與者行為是有限理性的，群體行為的演化最終也學(xué)會(huì)達(dá)到理性均衡。根據(jù)進(jìn)化論的均衡觀點(diǎn)，傳統(tǒng)博弈對(duì)多重均衡進(jìn)行精練沒有太大意義，因?yàn)檎鎸?shí)世界中的均衡來自于歷史演化的初始條件和演化過程中引起突變的一些隨機(jī)事件。（三）合作

非合作博弈：除了規(guī)則允議以外，參與者之間無法達(dá)成有約束力的協(xié)議，作出的威脅、無法強(qiáng)制實(shí)施的，因此參與者只能根據(jù)“可察覺到的自我利益（perceivedself-interest）”決策.

例子：一次性囚徒困境博弈中攻守同盟的瓦解在非合作博弈中，仍可以出現(xiàn)內(nèi)生的合作行為：

1無名氏定理揭示出，無限次重復(fù)博弈可擺脫“囚徒困境”；

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第2章博弈的基本知識(shí)

文檔簡介

溫馨提示

最新文檔

評(píng)論

第2章博弈的基本知識(shí)

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔