第四章 進化博弈論.ppt_第1頁
第四章 進化博弈論.ppt_第2頁
第四章 進化博弈論.ppt_第3頁
第四章 進化博弈論.ppt_第4頁
第四章 進化博弈論.ppt_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、4.1有限理性和進化博弈論,然而,完全理性在現(xiàn)實中難以滿足。當(dāng)社會經(jīng)濟環(huán)境和決策問題復(fù)雜時,人們必然有很大的理性局限性。有限理性對人們的決策和行為選擇有很大的影響,基于有限理性的博弈分析與基于完全理性的博弈分析有很大的不同。進化博弈分析是有限理性博弈分析的基本框架。4.1.1進化博弈的基本假設(shè)是有限理性。傳統(tǒng)的博弈均衡,如納什均衡及其改進,是建立在完全理性是常識的前提之上的。第四章是進化博弈理論,4.1.2有限理性及其對博弈的影響,有限理性玩家:不滿足完全理性假設(shè)的玩家的有限理性意味著至少一些玩家不會采取完全理性博弈的均衡策略。有限理性意味著均衡是不斷調(diào)整和改進的結(jié)果,而不是一次性選擇的結(jié)果,

2、即使達到均衡,也可能再次偏離有限理性。玩家將在游戲過程中學(xué)習(xí)游戲,并通過反復(fù)試驗找到更好的策略。4.1.3合作行為在競爭中,動物最終選擇進化穩(wěn)定策略(ESS),該策略被大多數(shù)種群成員所采用,不會被其他對策所侵蝕。一旦生態(tài)系統(tǒng)服務(wù)體系建立,社會穩(wěn)定,這種偏離將受到自然的懲罰。他律和合作行為在動物界很普遍。這種行為也可能發(fā)生在不相關(guān)的情況下,例如共生現(xiàn)象。在有限理性博弈中,具有真正穩(wěn)定性和強預(yù)測能力的均衡必須通過參與者模仿和學(xué)習(xí)的調(diào)節(jié)過程來實現(xiàn),有誤差偏差干擾的均衡和在少量干擾后仍能“恢復(fù)”的均衡。4.1.4限制性博弈的分析框架,4.1.4限制性博弈的分析框架,最優(yōu)反應(yīng)動力學(xué):具有快速學(xué)習(xí)能力的小

3、群體成員的重復(fù)博弈復(fù)制動力學(xué):具有學(xué)習(xí)速度慢的大群體成員隨機配對的重復(fù)博弈進化穩(wěn)定策略,4.2最優(yōu)反應(yīng)動力學(xué),4.2.1協(xié)調(diào)博弈的有限玩家快速學(xué)習(xí)模型,4.2.2古諾調(diào)整過程,4.2.1協(xié)調(diào)博弈的有限玩家快速學(xué)習(xí)模型,兩個納什均衡,但考慮了對方的理性信任,風(fēng)險考慮五個有限理性的玩家,相鄰的玩家互相玩游戲,快速學(xué)習(xí),動態(tài)調(diào)整。反應(yīng),策略調(diào)整規(guī)則的演繹,最優(yōu)反應(yīng)的動態(tài)模擬:第一場游戲中的1 A,第一場游戲中的2 A相鄰,第一場游戲中的3 A相連,5.2.2古諾調(diào)整過程,古諾模型反應(yīng)函數(shù),1 2 3 3 4游戲方1 2.5 1.5 2.125 1.875游戲方2 3 1.75 2.25 1.9375

4、,問題:兩個寡頭總是假設(shè)對方的輸出是恒定的。最佳響應(yīng)的動態(tài)模擬,收斂條件,4。3復(fù)制動力學(xué)和進化穩(wěn)定性:兩個人之間的對稱博弈,其中某個群體隨機配對并重復(fù),博弈是對稱的,即群體中的個體沒有角色分化,所有個體都有相同的戰(zhàn)略空間。此時,博弈分析的核心不是玩家最佳策略的選擇,而是有限理性玩家組成的群體成員的策略調(diào)整過程、趨勢和穩(wěn)定性。這里的穩(wěn)定性意味著采用特定策略的成員比例不變,而不是某個玩家的策略。例如:簽訂協(xié)議博弈的復(fù)制動力學(xué)和進化穩(wěn)定性策略,簽訂協(xié)議博弈:在有限理性的前提下,并不是所有的參與者都能首先找到最佳策略(y,y)。以下分析(y,y)是ESS。假設(shè)小組中“同意”的比例為X,不同策略的預(yù)期

5、收益和總平均收益分別為:因此,除了x=0外,還有:在重復(fù)游戲的過程中,只要玩家有基本的判斷能力,差異遲早會被發(fā)現(xiàn)。因此,受益較少的玩家遲早會模仿對方。這意味著這兩類玩家的x和1-x的比例不是固定的,而是時間的函數(shù):x(t)和1-x (t)。玩家策略類型比例的動態(tài)變化是進化博弈分析的核心。上述比例的動態(tài)變化速度取決于模仿的速度。速度取決于兩個因素:(1)模擬物體的數(shù)量(可以用x表示);(2)被模仿對象的成功程度(用被模仿對象的預(yù)期收益超過平均收益的程度來表示,即)。因此,上述比例的動態(tài)變化速度可以用下面的微分方程來表示:以采用“同意”策略的當(dāng)?shù)厝吮壤秊槔?,其動態(tài)變化速度可以用下面的微分方程來反映

6、:動態(tài)微分方程的相圖,穩(wěn)態(tài),定點:x*=0,x *=1,結(jié)論:(1)當(dāng)x=0,dx/dt=時,其意義在于一開始沒有人采用“同意”策略,所以沒有模仿的例子可以學(xué)習(xí),所以所有的玩家不會有意識地改變他們的策略。(2)當(dāng)x0,dx/dt為0時,x將增加,直到x=1達到穩(wěn)定狀態(tài)。其意義在于,只要有些人一開始采用“同意”策略,游戲中的所有玩家最終都會傾向于采用“同意”策略。進化穩(wěn)定性策略的檢驗,雖然x*=0,x *=1是穩(wěn)定的,但不一定是ess。驗證結(jié)果如下:結(jié)論:(1)穩(wěn)定狀態(tài)必須對小擾動具有魯棒性,才能稱為進化穩(wěn)定策略。也就是說,作為一個穩(wěn)定的策略,x*不僅必須處于穩(wěn)定的狀態(tài),而且還必須具有這樣一個性

7、質(zhì),即如果一些玩家由于偶然的錯誤而偏離了它們,復(fù)制動力學(xué)仍然會使X回到x*。(2)從數(shù)學(xué)上講,ESS相當(dāng)于:或:因此,從復(fù)制動力學(xué)方程的相圖來看,ESS是一個與水平軸相交的點,該交點的切線斜率為負(fù)。例如,在簽名游戲中,只有x=1,即(同意,同意)是ESS。一般來說,兩人對稱博弈復(fù)制動態(tài)和進化穩(wěn)定策略,而在一般模型中,進化博弈是一個大群體成員隨機配對的重復(fù)博弈?;灸P褪莾蓚€玩家之間的對稱游戲。意思是兩個游戲位置之間沒有區(qū)別。其中,abcd可以是任何好處,根據(jù)問題設(shè)置。復(fù)制動態(tài)分析、復(fù)制動態(tài)的進化規(guī)律是生物學(xué)中的生物學(xué)特征進化規(guī)律。設(shè)x為采用策略1的比例,復(fù)制動態(tài)相圖,穩(wěn)態(tài)為:x*=0,x *=

8、1,x *=(d-b)/(a-b-c d),例如:鷹鴿博弈的復(fù)制動態(tài)和。復(fù)制動力學(xué)方程和相圖,讓v=2,c=12,那么方程是:因為F(0)0,F(xiàn)(1)0,F(xiàn)(1/6)0,只有x*=1/6是ESS。也就是說,采用攻擊性策略的玩家數(shù)量通常穩(wěn)定在1/6左右。獵鹿游戲?qū)<以诠爬系拇迩f里有兩個獵人。當(dāng)?shù)刂饕袃煞N獵物:鹿和兔子。如果一個獵人獨自戰(zhàn)斗,他一天最多只能打三只兔子。只有兩個人能一起獵鹿。從填飽肚子的角度來看,三只兔子可以讓一個人三天不挨餓,而一只鹿可以讓兩個人吃五天。4.4有機體之間的合作機制:親緣效應(yīng)和互惠合作行為,問題:如何獲得帕累托改進?漢密爾頓法則:通過親屬選擇促進利他行為的條件是:c是利他者付出的代價,b是受益者獲得的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論