運(yùn)籌學(xué)-博弈論_第1頁(yè)
運(yùn)籌學(xué)-博弈論_第2頁(yè)
運(yùn)籌學(xué)-博弈論_第3頁(yè)
運(yùn)籌學(xué)-博弈論_第4頁(yè)
運(yùn)籌學(xué)-博弈論_第5頁(yè)
已閱讀5頁(yè),還剩99頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《管理運(yùn)籌學(xué)》教材

教學(xué)課件第10章博弈論10.1博弈論概述10.2完全信息靜態(tài)博弈10.3完全信息動(dòng)態(tài)博弈10.4博弈論在經(jīng)濟(jì)管理中的應(yīng)用10.5課后習(xí)題10.6閱讀材料10.1博弈論概述10.1.1引例10.1.2博弈及博弈論10.1.1引例本章主要介紹博弈論的基本概念、種類以及各種博弈均衡的含義、求法和應(yīng)用。通過本章學(xué)習(xí),要求:了解博弈論的基本概念;掌握非合作博弈的種類以及均衡解之間的關(guān)系,特別是完全信息靜態(tài)博弈和完全信息動(dòng)態(tài)博弈。會(huì)求博弈的一些基本類型的均衡解并了解它們?cè)诮?jīng)濟(jì)管理中的部分應(yīng)用例子。田忌賽馬博弈華容道博弈

10.1.2博弈及博弈論博弈就是策略對(duì)抗,或策略有關(guān)鍵作用的游戲博弈Game,博弈論GameTheory,Game即游戲、競(jìng)技游戲和經(jīng)濟(jì)等決策競(jìng)爭(zhēng)較量的共同特征:規(guī)則、結(jié)果、策略選擇,策略和利益相互依存,策略的關(guān)鍵作用游戲——下棋、猜大小經(jīng)濟(jì)——寡頭產(chǎn)量決策、市場(chǎng)阻入、投標(biāo)拍賣政治、軍事——美國(guó)和伊拉克、以色列和巴勒斯坦定義:博弈就是參與人(可能是個(gè)人,也可能是團(tuán)體,如國(guó)家、企業(yè)、國(guó)際組織等)在一定得規(guī)則下,同時(shí)或先或后,一次或多次,從各自允許選擇的行動(dòng)或戰(zhàn)略中進(jìn)行選擇并加以實(shí)施,而取得相應(yīng)結(jié)果(支付函數(shù))的過程。

都有一定的規(guī)則

都有一個(gè)結(jié)果

策略至關(guān)重要,游戲者不同的策略選擇常會(huì)帶來(lái)不同的游戲結(jié)果

策略和利益有相互依存性

博弈論:博弈論就是系統(tǒng)研究具有上述特征的博弈問題,尋求各博弈方合理選擇戰(zhàn)略情況下博弈的解,并對(duì)這些解進(jìn)行討論分析的理論。博弈的分類首先,分為非合作博弈和合作博弈兩大類。本書主要介紹非合作博弈;其次,在非合作博弈的范圍內(nèi),可分為完全理性博弈和有限理性博弈。本書介紹大多數(shù)基本博弈概念、原理和分析方法時(shí)都以完全理性假設(shè)為基礎(chǔ);第三個(gè)層次分為靜態(tài)博弈和動(dòng)態(tài)博弈,外加重復(fù)博弈這種特殊的動(dòng)態(tài)博弈;第四個(gè)層次是根據(jù)信息是否完全和完美分類,共分為完全信息靜態(tài)博弈和不完全信息靜態(tài)博弈、完全且完美信息動(dòng)態(tài)博弈、完全但不完美信息動(dòng)態(tài)博弈、不完全信息動(dòng)態(tài)博弈。非合作博弈合作博弈完全理性博弈有限理性博弈靜態(tài)博弈動(dòng)態(tài)博弈重復(fù)博弈完全信息靜態(tài)博弈不完全信息靜態(tài)博弈完全且完美信息動(dòng)態(tài)博弈完全且不完美信息動(dòng)態(tài)博弈不完全信息動(dòng)態(tài)博弈有約束力的協(xié)議進(jìn)化博弈論博弈的分類及對(duì)應(yīng)的均衡概念

10.2完全信息靜態(tài)博弈10.2.1策略型博弈模型及占優(yōu)戰(zhàn)略博弈10.2.2重復(fù)剔除的占優(yōu)戰(zhàn)略博弈10.2.3納什均衡10.2.1策略型博弈模型及占優(yōu)戰(zhàn)略博弈非合作博弈模型從模型自身形式上可分為擴(kuò)展型和策略型兩種,一般用策略型模型描述完全信息靜態(tài)博弈模型。構(gòu)成策略型博弈模型的三個(gè)要素參與人或局中人(Players):獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)果的個(gè)人或組織博弈規(guī)則面前博弈方之間平等,不因博弈方之間權(quán)利、地位的差異而改變博弈方數(shù)量對(duì)博弈結(jié)果和分析有影響根據(jù)博弈方數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈,單人博弈是退化的博弈策略或戰(zhàn)略(strategies):博弈中各博弈方的選擇內(nèi)容策略有定性定量、簡(jiǎn)單復(fù)雜之分不同博弈方之間不僅可選策略不同,而且可選策略數(shù)量也可不同有限博弈:每個(gè)博弈方的策略數(shù)都是有限的無(wú)限博弈:至少有某些博弈方的策略有無(wú)限多個(gè)支付函數(shù)(Payoffsfunction)

:各博弈方從博弈中所獲得的利益得益對(duì)應(yīng)博弈的結(jié)果,也就是各博弈方策略的組合得益是各博弈方追求的根本目標(biāo)及行為和判斷的主要依據(jù)根據(jù)得益的博弈分類:零和博弈、常和博弈、變和博弈例10.1囚徒困境博弈囚徒的困境是圖克(Tucker)1950年提出的該博弈是博弈論最經(jīng)典、著名的博弈該博弈本身講的是一個(gè)法律刑偵或犯罪學(xué)方面的問題,但可以擴(kuò)展到許多經(jīng)濟(jì)問題,以及各種社會(huì)問題,可以揭示市場(chǎng)經(jīng)濟(jì)的根本缺陷基本模型1950年,由就職于蘭德公司的梅里爾·弗拉德(MerrillFlood)和梅爾文·德雷希爾(MelvinDresher)擬定出相關(guān)困境的理論,后來(lái)由顧問阿爾伯特·塔克(AlbertTucker)以囚徒方式闡述,并命名為“囚徒困境”。經(jīng)典的囚徒困境如下:警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:若一人認(rèn)罪并作證檢舉對(duì)方(相關(guān)術(shù)語(yǔ)稱“背叛”對(duì)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)8年。若二人都保持沉默(相關(guān)術(shù)語(yǔ)稱互相“合作”),則二人同樣判監(jiān)1年。若二人都互相檢舉(互相“背叛”),則二人同樣判監(jiān)5年。囚徒困境-5,-50,-8-8,0-1,-1坦白坦白不坦白不坦白囚徒2囚徒1囚徒1的選擇:

一定先考慮2的選擇。若2選坦白,則1選坦白;若2選不坦白,則1還選坦白。囚徒1有一個(gè)占優(yōu)策略“坦白”。囚徒2的選擇:

同理,囚徒2也有一個(gè)占優(yōu)策略“坦白”。(坦白,坦白)是囚徒困境模型的必然占優(yōu)策略均衡。但并不是最優(yōu)的策略選擇。最優(yōu)應(yīng)為(不坦白,不坦白)。占優(yōu)策略(上策)均衡占優(yōu)策略(上策)通俗來(lái)說(shuō)是:

“我所做的是不管你做什么我所能做的最好的”

“你所做的是不管我做什么你所能做的最好的”占優(yōu)策略均衡指博弈中的所有參與者的占優(yōu)策略組合所構(gòu)成的均衡。囚徒困境(Prisoners’Dilemma

)只達(dá)到效率很差的個(gè)體理性解,沒有實(shí)現(xiàn)團(tuán)體理性解。前者是穩(wěn)定的,是自動(dòng)實(shí)施的;盡管團(tuán)體理性解對(duì)大家都好,但它是不能自動(dòng)實(shí)施的,需要改變條件。提示:該博弈揭示了個(gè)體理性與團(tuán)體理性之間的矛盾?!獜膫€(gè)體利益出發(fā)的行為往往不能實(shí)現(xiàn)團(tuán)體的最大利益,同時(shí)也揭示了個(gè)體理性本身的內(nèi)在矛盾——從個(gè)體利益出發(fā)的行為最終也不一定能真正實(shí)現(xiàn)個(gè)體的最大利益,甚至得到相當(dāng)差的結(jié)果。

10.2.2重復(fù)剔除的占優(yōu)戰(zhàn)略均衡

首先找出某一博弈參與人的嚴(yán)格劣戰(zhàn)略,將它剔除掉,重新構(gòu)造一個(gè)不包括已剔除戰(zhàn)略的新的博弈;然后繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣戰(zhàn)略;重復(fù)進(jìn)行這一過程,直到剩下唯一的參與人戰(zhàn)略組合為止。這個(gè)唯一剩下的參與人戰(zhàn)略組合,就是這個(gè)博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”(iterateddominanceequilibrium).智豬博弈:假設(shè)豬圈里有兩頭豬,一頭大豬,一頭小豬,豬圈的一端有一個(gè)豬食槽,另一端安裝了一個(gè)按鈕,控制豬食的供應(yīng)。按一下按鈕。將有10個(gè)單位的豬食進(jìn)入豬食槽,供兩頭豬食用。兩頭豬面臨選擇的策略有兩個(gè):自己去按按鈕或等待另一頭豬去按按鈕。如果某一頭豬作出自己去按按鈕的選擇,它必須付出如下代價(jià):第一,它需要收益相當(dāng)于2個(gè)單位的成本;第二,由于豬食槽遠(yuǎn)離豬食,它將比另一頭豬后到豬食槽,從而減少吃食的數(shù)量。大豬先到:大豬吃到9個(gè)單位,小豬吃到1個(gè)單位;小豬先到:小豬吃到4個(gè)單位,大豬吃到6個(gè)單位;同時(shí)到達(dá):大豬吃到7個(gè)單位,小豬吃到3個(gè)單位。智豬博弈(大小豬博弈)23大豬不按按不按按小豬(4,4)(5,1)(9,-1)(0,0)局中人:大豬和小豬行動(dòng):按按鈕吃東西小豬大豬按等待按5,14,4等待9,-10,0小豬的上策25雙方力量不對(duì)等時(shí)的正確策略力量強(qiáng):主動(dòng)出擊力量弱:等待,搭強(qiáng)者的便車。26智豬博弈的應(yīng)用政治博弈大國(guó)是大豬,小國(guó)是小豬資本市場(chǎng)大股東是大豬,小股東是小豬企業(yè)創(chuàng)新策略大企業(yè)是大豬,小企業(yè)是小豬10.2.3納什(Nash)均衡1.純戰(zhàn)略Nash均衡策略空間:每個(gè)博弈方的全部可選策略的集合博弈方的第個(gè)策略:博弈方的得益:博弈:定義1:在博弈中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合中,任一博弈方的策略,都是對(duì)其余博弈方策略的組合的最佳對(duì)策,也即

對(duì)任意都成立,則稱為的一個(gè)納什均衡(NashEquilibrium)。定義2:一個(gè)Nash均衡是強(qiáng)的(Strict或Strong),如果給定其他局中人的戰(zhàn)略,每一個(gè)局中人的最優(yōu)選擇是唯一的。即是說(shuō)是一個(gè)強(qiáng)Nash均衡,當(dāng)且僅當(dāng)對(duì)于所有的,,有2.求解Nash均衡的方法(1)劃線法思路:先找出自己針對(duì)其他博弈方每種策略或策略組合(對(duì)多人博弈)的最佳對(duì)策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來(lái)最大得益的策略(這種相對(duì)最佳對(duì)策總是存在的,不過不一定惟一),然后再此基礎(chǔ)上,通過對(duì)其他博弈方策略選擇的判斷,包括對(duì)其他博弈方對(duì)自己策略判斷的判斷等,預(yù)測(cè)博弈的可能結(jié)果和確定自己的最優(yōu)策略。劃線法求解納什均衡例10.2BLMRU3,24,75,1AH6,12,81,1D3,78,910,4(2)反應(yīng)函數(shù)法例10.3

古諾(Cournot)寡頭競(jìng)爭(zhēng)模型

古諾寡頭競(jìng)爭(zhēng)模型(1838)企業(yè)1企業(yè)2參與人:企業(yè)1、企業(yè)2戰(zhàn)略:選擇產(chǎn)量得益:利潤(rùn),利潤(rùn)是兩個(gè)企業(yè)產(chǎn)量的函數(shù)單位產(chǎn)品生產(chǎn)成本:2寡頭產(chǎn)量競(jìng)爭(zhēng)——以兩廠商產(chǎn)量競(jìng)爭(zhēng)為例假設(shè)策略組合(q1*,q2*)是本博弈的納什均衡,那么

max()

q1

max(

q2q1*,q2*只要能使兩式各自對(duì)q1,q2的導(dǎo)數(shù)為0,就能實(shí)現(xiàn)兩式的最大值,令:

a-

c-q2*-2q1*=0

a-

c-q1*-2q2*=0解之,q1*=q2*=1/3(a-c)。因此,策略組合(1/3(a-c),1/3(a-c))是本博弈唯一的納什均衡。此時(shí)每個(gè)企業(yè)的利潤(rùn)為

產(chǎn)量博弈的古諾模型是一種囚徒困境,無(wú)法實(shí)現(xiàn)博弈方總體和各個(gè)博弈方各自最大利益的結(jié)論,對(duì)于市場(chǎng)經(jīng)濟(jì)組織、管理,對(duì)于產(chǎn)業(yè)組織和社會(huì)經(jīng)濟(jì)制度的效率判斷,都具有非常重要的意義。說(shuō)明對(duì)市場(chǎng)的管理,政府對(duì)市場(chǎng)的調(diào)控和監(jiān)管都是必須的。(3)混合戰(zhàn)略Nash均衡例10.4

社會(huì)福利博弈

23,

3-1,

1-1,

00,流浪流浪漢政府救濟(jì)不救濟(jì)尋找工作沒有一個(gè)策略組合構(gòu)成納什均衡例10.5猜硬幣游戲

1-1,

-11,

-11,

1-1,反面正面反面正面猜謎游戲兩個(gè)兒童各拿一枚硬幣,若同時(shí)正面朝上或朝下,A給B1分錢,若只有一面朝上,B給A1分錢。零和博弈博弈參與者有輸有贏,但結(jié)果永遠(yuǎn)是0。沒有一個(gè)策略組合構(gòu)成納什均衡定義3n人戰(zhàn)略式表述博弈中,,概率密度被稱為局中人i的一個(gè)混合戰(zhàn)略,是i選擇的概率,,,,為中純戰(zhàn)略個(gè)數(shù)(可為無(wú)窮大)。定義4n人戰(zhàn)略式表述博弈中,混合戰(zhàn)略組合是一個(gè)Nash均衡,如果對(duì)于所有的,有:社會(huì)福利博弈

23,

3-1,

1-1,

00,流浪流浪漢政府救濟(jì)不救濟(jì)尋找工作設(shè):政府救濟(jì)的概率:1/2;不救濟(jì)的概率:1/2。流浪漢:尋找工作的期望效用:1/2×2+1/2×1=1.5

流浪的期望效用:1/2×3+1/2×0=1.5因此,流浪漢的任何一種策略都是都是對(duì)政府混合戰(zhàn)略的最優(yōu)反應(yīng)例10.7社會(huì)福利博弈的混合策略Nash均衡

社會(huì)福利博弈

23,

3-1,

1-1,

00,流浪流浪漢政府救濟(jì)不救濟(jì)尋找工作設(shè):政府救濟(jì)的概率:1/2;不救濟(jì)的概率:1/2。流浪漢:尋找工作的概率:0.2;流浪的概率:0.8每個(gè)參與人的策略都是給定對(duì)方混合策略時(shí)的最優(yōu)策略例10.7社會(huì)福利博弈的混合策略Nash均衡10.3完全信息動(dòng)態(tài)博弈10.3.1博弈的擴(kuò)展式表述10.3.2子博弈精煉納什均衡10.3.3子博弈精煉納什均衡的缺陷10.3.4對(duì)子博弈精煉納什均衡預(yù)測(cè)偏差的解釋10.3.5動(dòng)態(tài)博弈戰(zhàn)略行動(dòng)10.3.6重復(fù)博弈10.3.1博弈的擴(kuò)展式表述

靜態(tài)博弈一般用戰(zhàn)略式表述,而動(dòng)態(tài)博弈一般用擴(kuò)展式表述。博弈的擴(kuò)展式表述與戰(zhàn)略式表述的主要區(qū)別如下:(1)戰(zhàn)略式簡(jiǎn)單地給出了參與人有些什么戰(zhàn)略可以選擇,而擴(kuò)展式表述要給出每個(gè)戰(zhàn)略的動(dòng)態(tài)描述。誰(shuí)在什么時(shí)候行動(dòng),每次行動(dòng)時(shí)有些什么具體行動(dòng)可供選擇,以及知道些什么;(2)擴(kuò)展式所擴(kuò)展的主要是參與人的戰(zhàn)略空間;(3)在擴(kuò)展式表述中,戰(zhàn)略對(duì)應(yīng)于參與人的相機(jī)行動(dòng)規(guī)則,即什么情況下選擇什么行動(dòng),而不是簡(jiǎn)單的與行動(dòng)無(wú)關(guān)的選擇。

博弈的擴(kuò)展式表述包括以下要素:(1)參與人集合;(2)參與人的行動(dòng)順序:誰(shuí)在什么時(shí)候行動(dòng);(3)參與人的行動(dòng)空間:每次行動(dòng)時(shí),參與人有些什么選擇;(4)參與人的信息集:每次行動(dòng)時(shí),參與人知道什么;(5)參與人的支付函數(shù),在行動(dòng)結(jié)束后,參與人得到些什么;(6)外生事件(即自然的選擇)的概率分布。對(duì)于人有限戰(zhàn)略博弈,其擴(kuò)展式表述可以用博弈樹來(lái)表示。例10.8

紙牌博弈

博弈樹主要分為一下幾個(gè)部分:(1)結(jié):包括決策結(jié)合終點(diǎn)結(jié)。決策結(jié)是參與人采取行動(dòng)的時(shí)點(diǎn),終點(diǎn)結(jié)是博弈行動(dòng)路徑的結(jié)束。(2)枝:在博弈樹上,樹是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。博弈樹的枝不僅完整地描述了每一個(gè)決策結(jié)參與人的行動(dòng)空間,而且給出了從一個(gè)決策結(jié)到下一個(gè)決策結(jié)的路徑。(3)信息集:每一個(gè)信息集是決策結(jié)集合的一個(gè)子集。該子集包括所有滿足下列條件的決策結(jié):①每一個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);②該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)。在博弈樹中,一般將屬于同一個(gè)信息集的結(jié)點(diǎn)圈起來(lái),或用線連起來(lái)。完美信息博弈:一個(gè)信息集可能包含多個(gè)決策結(jié),也可能只包含一個(gè)決策結(jié)。只包含一個(gè)決策結(jié)的信息集稱為單結(jié)信息集(single-tons)。如果博弈樹上所有信息集都是單結(jié)的,該博弈稱為完美信息博弈(gameofperfectinformation)。定理10.1如果一個(gè)擴(kuò)展式博弈有有限個(gè)信息集,每個(gè)信息集上參與人有有限個(gè)行動(dòng)選擇,我們說(shuō)這個(gè)博弈是有限博弈,這個(gè)而博弈存在一個(gè)混合戰(zhàn)略納什均衡(Nash

Equilibrium)。如果這個(gè)信息是完美信息博弈(即每一個(gè)信息集都是單結(jié)的),那么它有一個(gè)純戰(zhàn)略納什均衡。10.3.2子博弈精煉納什均衡

子博弈:一個(gè)擴(kuò)展式博弈的子博弈由一個(gè)決策結(jié)和所有該決策結(jié)的后續(xù)結(jié)(包括終點(diǎn)結(jié))組成。它滿足:

①一個(gè)子博弈必須從一個(gè)單結(jié)信息集開始,如果一個(gè)信息集包含兩個(gè)以上的決策結(jié),沒有任何一個(gè)可以作為子博弈的初始結(jié);

②子博弈的信息集和支付向量都直接繼承自原博弈,這意味著子博弈不能切割原博弈的信息集,子博弈的支付函數(shù)只是原博弈留存在子博弈上的部分。定義5

擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精煉納什均衡,如果:①它是原博弈的納什均衡;②它在每一個(gè)子博弈上構(gòu)成一個(gè)納什均衡。逆向歸納法是求解子博弈精煉納什均衡的最簡(jiǎn)單的方法。我們從最后一個(gè)子博弈往上逆推,找出每個(gè)決策結(jié)上參與人的最優(yōu)行動(dòng)。如此不間斷地直到初始結(jié),每一步都得到對(duì)應(yīng)子博弈的一個(gè)納什均衡,并且,根據(jù)定義,該納什均衡一定是該博弈的所有子博弈的納什均衡,在這個(gè)過程的最后一步得到的整個(gè)博弈的納什均衡就是這個(gè)博弈的子博弈精煉納什均衡。例10.9

私奔博弈例10.10

房地產(chǎn)開發(fā)博弈qi

:第i個(gè)企業(yè)的產(chǎn)量C:代表單位不變成本假定逆需求函數(shù)為:第i個(gè)企業(yè)的利潤(rùn)函數(shù)為:企業(yè)1企業(yè)2

例10.11斯塔克博格(Stackelberg)模型把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時(shí)選擇即可。222126qqqq--=用逆推歸納法先分析第二個(gè)階段廠商2的決策。這樣q2必須滿足:

6-q1-2q2

=0即這樣廠商1的得益函數(shù)實(shí)際上變?yōu)椋毫顚?duì)q1的導(dǎo)數(shù)等于0,得

即廠商1的最佳產(chǎn)量是生產(chǎn)3單位。此時(shí)廠商2的最佳產(chǎn)量是1.5單位,市場(chǎng)價(jià)格為3.5,雙方的利潤(rùn)分別為4.5和2.25單位。廠商1在第一階段選擇3單位產(chǎn)量,廠商2在第二階段選擇1.5單位產(chǎn)量,是這個(gè)動(dòng)態(tài)博弈的唯一的子博弈完美納什均衡。廠商2在決策之前知道廠商1的選擇,然而擁有較多的信息不一定有較多的利益。

產(chǎn)量得益廠商13單位4.5廠商21.5單位2.25先行優(yōu)勢(shì)古諾型與斯氏模型比較庫(kù)諾特模型均衡結(jié)果:q1*=q2*=2q1*+q2*=4u1*=u2*=4斯氏模型均衡結(jié)果:q1*=3q2*=1.5q1*+q2*=4.5u1*=4.5u2*=2.25斯氏均衡的總產(chǎn)量>古諾均衡的總產(chǎn)量,但是企業(yè)1利潤(rùn)更大,而總產(chǎn)量的上升使總利潤(rùn)下降了,從而企業(yè)2的利潤(rùn)一定下降。這就是所謂的“先動(dòng)優(yōu)勢(shì)”(first-mover-advantage)。當(dāng)然,如果企業(yè)選擇的是價(jià)格不是產(chǎn)量,那么得到的就是“后動(dòng)優(yōu)勢(shì)”(second-moveradvantage)。結(jié)論:本博弈也揭示了這樣一個(gè)事實(shí),即在信息不對(duì)稱的博弈中,信息較多的參與人(如本博弈中的廠商2,他在決策之前可先知道廠商1的實(shí)際選擇,因此他擁有較多的信息)不一定能得到較多的得益。這一點(diǎn)也正是多人博弈與單人博弈的不同之處。10.3.3子博弈精煉納什均衡的缺陷

通過逆向歸納法所得到的完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡實(shí)質(zhì)上是在每一個(gè)信息集上進(jìn)行了重復(fù)剔除劣戰(zhàn)略的過程。因而子博弈精煉均衡實(shí)際上也存在如重復(fù)剔除劣戰(zhàn)略的占優(yōu)戰(zhàn)略均衡那樣的一些缺陷或局限,如對(duì)局中人的理性程度要求過高。例10.12對(duì)參與人理性程度要求過高的完全信息動(dòng)態(tài)博弈

例10.13n人n階段完全信息動(dòng)態(tài)博弈10.3.4對(duì)子博弈精煉納什均衡預(yù)測(cè)偏差的解釋

例10.14Rosenthsal(1981)博弈模型

①FKL理論②顫抖手理論10.3.5動(dòng)態(tài)博弈戰(zhàn)略行動(dòng)

1.先行優(yōu)勢(shì)(first-moveadvantage)先行優(yōu)勢(shì)是指在博弈中首先作出戰(zhàn)略選擇并采取行動(dòng)的參與人可以獲得更多的利益。2.可置信的威脅可置信的威脅是指博弈的某一參與人通過承諾某種行動(dòng)改變自己的收益函數(shù),使得其他參與人認(rèn)為自己的威脅確實(shí)可信,從而迫使其他參與人在充分考慮自己的承諾情況下作出相應(yīng)的選擇。就是我們前面所說(shuō)的承諾行動(dòng)。10.3.6重復(fù)博弈參與人在前一個(gè)階段的行動(dòng)選擇決定了隨后的子博弈的結(jié)構(gòu),這樣的動(dòng)態(tài)博弈稱為“序貫博弈”(sequentialgames)。重復(fù)博弈(repeatedgames)是指同樣結(jié)構(gòu)的博弈重復(fù)許多次,其中的每次博弈稱為“階段博弈”(stagegames)。1、有限次重復(fù)博弈有限次重復(fù)博弈:令G是階段博弈,G(T)是G重復(fù)T次的重復(fù)博弈(T<無(wú)窮大)。那么,如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次(即每個(gè)階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果)。例10.12連鎖店悖論定理10.2

令G是階段博弈,G(T)是G重復(fù)T次的有限次重復(fù)博弈,則當(dāng)G有唯一的子博弈精煉納什均衡時(shí),重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次的結(jié)果。2、無(wú)限次重復(fù)博弈

無(wú)名氏定理:在無(wú)限次重復(fù)博弈中,如果參與人有足夠的耐心,那么,任何滿足個(gè)人理性可行的支付向量都可以通過一個(gè)特定的子博弈精煉均衡得到。例10.13無(wú)限次囚徒博弈:走出囚境10.4博弈論在經(jīng)濟(jì)管理中的應(yīng)用

10.4.1完全信息靜態(tài)博弈:應(yīng)用與例子10.4.2完全信息動(dòng)態(tài)博弈:應(yīng)用與例子10.4.3對(duì)“滯脹”的解釋:宏觀經(jīng)濟(jì)政策的動(dòng)態(tài)一致性10.4.1完全信息靜態(tài)博弈:應(yīng)用與例子

例10.14公共地的悲劇“公共地悲劇”最早可追溯到古希臘哲人亞里士多德(前384-前322)的斷言:“凡是屬于最多數(shù)人的公共事物常常是最少受人照顧的事物,人們關(guān)懷著自己的所有,而忽視公共的事物;對(duì)于公共的一切,他至多只留心到其中對(duì)他個(gè)人多少有些相關(guān)的事物?!笔惯@一斷言模式化并成為公共選擇分析模型的是英國(guó)學(xué)者加雷特·哈丁,他為了要說(shuō)明帶有普遍性的人口過渡膨脹問題,于1968年提出了著名的“公地悲劇”理論。有n個(gè)農(nóng)民的村莊共同擁有一片草地,每個(gè)農(nóng)民都有在草地上放牧的自由。每年春天,農(nóng)民要決定自己養(yǎng)多少只羊。gi:第i個(gè)農(nóng)民飼養(yǎng)的數(shù)量,i=1,2,…,n.

n個(gè)農(nóng)民飼養(yǎng)的總量V:

代表每只羊的平均價(jià)值,v是G的函數(shù),V=V(Q),

因?yàn)槊恐谎蛑辽僖欢〝?shù)量的草才不至于餓死,有一個(gè)最大的可存活量Qmax,:

當(dāng)Q<Qmax時(shí),V(Q)>0;當(dāng)Q>=Q(x)時(shí),V(Q)=0。當(dāng)草地上羊很少時(shí),增加一只羊也許不會(huì)對(duì)其他羊的價(jià)值有太大影響,但隨著羊的不斷增加,每只羊的價(jià)值將急劇下降。QQmaxv參與人:農(nóng)民戰(zhàn)略:養(yǎng)羊的數(shù)量得益:利潤(rùn)競(jìng)爭(zhēng):個(gè)體利益最大化以三農(nóng)戶為例

n=3,c=4

公共資源效率評(píng)價(jià),討論總體利益最大的最佳羊只數(shù)量。設(shè)在該草地上羊只的總數(shù)為Q,則總得益為使總得益u最大的養(yǎng)羊數(shù)Q*必使總得益函數(shù)的導(dǎo)數(shù)為0,求得

說(shuō)明:非合作博弈的結(jié)果有可能是低效率的。每個(gè)可以利用公共資源的人都相當(dāng)于面臨著一種囚徒的困境:在總體上有加大利用資源可能時(shí),自己加大利用而他人不加大利用則自己得利,自己加大利用但其他人也加大利用則自己不至于吃虧,最終是所有人都加大利用資源直至再加大只會(huì)減少利益的納什均衡水平。例10.15Bertrand寡頭模型

標(biāo)準(zhǔn)式表述兩廠商決策的相互影響在于需求函數(shù)Di(pi,pj)=a-pi+bpj兩廠商的產(chǎn)品具有一定的差異性;b是廠商i的產(chǎn)品對(duì)廠商j的產(chǎn)品的替代系數(shù)。1、參與人:廠商1與廠商2;他們生產(chǎn)同類但存在一定差異的產(chǎn)品。2、他們選擇價(jià)格,Si={pi:pi≥0};3、他們的支付函數(shù)就是他們的利潤(rùn)函數(shù):

ui=ui(pi,pj)=Di(pi,pj)pi-Di(pi,pj)c=(a-pi+bpj)(pi-c)廠商i的反應(yīng)函數(shù):假定兩廠商均無(wú)固定成本,只有常數(shù)邊際成本c。Ri(pj)=a+c+bpj2將是:P1*=p2*=c2P1=a+c+bp22P2=a+c+bp1P1*=p2*=(a+c)/(2-b)b﹤2思考:在Bertrand的模型中,如果兩廠商的產(chǎn)品是同質(zhì)的,那么NE會(huì)是什么?例10.16Hotelling價(jià)格競(jìng)爭(zhēng)模型●標(biāo)準(zhǔn)式表述在該模型中,產(chǎn)品在物質(zhì)形態(tài)上無(wú)差異,但在空間上處于不同的位置。1、參與人:商店1與商店2。他們分別位于一線性城市的兩端,出售同質(zhì)的商品;2、他們要決定的是各自商品的售價(jià)pi,

Si={pi:pi≥0};3、他們的支付函數(shù)就是利潤(rùn)函數(shù):u1=D1p1-D1cu2=D2p2-D2c注:設(shè)兩家商店商品的單位成本相同為c。設(shè)消費(fèi)者購(gòu)買商品的旅行成本為t,并且每個(gè)消費(fèi)者都具有單位需求,即每個(gè)消費(fèi)者只要認(rèn)為價(jià)格“足夠低”就會(huì)(也僅僅)購(gòu)買一個(gè)單位的商品,這意味著如果商店i的價(jià)格“不太高”,對(duì)商店i的需求等于發(fā)現(xiàn)從商店i購(gòu)買更為便宜的顧客的數(shù)量。

令該線性城市的長(zhǎng)度為1,消費(fèi)者均勻地分布

在[0,1]的區(qū)間里,分布密度為1;商店1位于0處,商店2位于1處。x為[0,1]上的任意一點(diǎn)。01商店1商店2x住在x的消費(fèi)者到商店1購(gòu)買的旅行成本是tx,到商店2購(gòu)買的成本是t(1-x);如果住在x的消費(fèi)者在兩個(gè)商店之間購(gòu)買的成本是無(wú)差異的,那么所有住在x左邊的消費(fèi)者在商店1購(gòu)買,所有住在x右邊的消費(fèi)者在商店2購(gòu)買,即有:D1=x,D2=1-x。這里x滿足:P1+tx=P2+t(1-x)x=(P2-P1+t)/2t所以有需求函數(shù):

D1=x=(P2-P1+t)/2t;D2=1-x=(P1-P2+t)/2tu1=D1p1-D1c=(p1-c)[((P2-P1+t)/2t]u2=D2p2-D2c=(p2-c)[((P1-P2+t)/2t]反應(yīng)函數(shù):R1(p2)=(c+t+p2)R2(p1)=(c+t+p1)解兩個(gè)反應(yīng)函數(shù)組成的方程組,得:p1*=p2*=c+tu1*=u2*=t/2商店的利潤(rùn)與消費(fèi)者的旅行

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論