版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
2025年演化博弈論考試題及答案一、選擇題(每題3分,共30分)1.演化穩(wěn)定策略(ESS)的核心特征是:A.對任何突變策略具有嚴(yán)格支付優(yōu)勢B.當(dāng)群體中幾乎全為該策略時,突變策略無法入侵C.與納什均衡完全等價D.僅適用于對稱博弈2.在雙策略對稱演化博弈中,復(fù)制動態(tài)方程的一般形式為:A.$\dot{x}=x(1-x)[u(x)-u(1-x)]$B.$\dot{x}=x[u(x)-\bar{u}]$C.$\dot{x}=(1-x)[u(1-x)-\bar{u}]$D.$\dot{x}=x(1-x)[u(x)-\bar{u}]$3.隨機演化博弈中,“固定概率”(FixationProbability)指的是:A.某策略在群體中永遠(yuǎn)保持的概率B.單個突變策略最終占據(jù)整個群體的概率C.群體策略分布不變的概率D.自然選擇強度為0時的均衡概率4.以下哪項不是有限理性假設(shè)對演化博弈的影響?A.策略更新規(guī)則更依賴經(jīng)驗而非完全理性計算B.均衡可能偏離納什均衡C.演化過程可能出現(xiàn)循環(huán)或多態(tài)穩(wěn)定D.群體規(guī)模必須為無限大5.在鷹鴿博弈中,若爭斗收益$V=6$,爭斗成本$C=8$,則演化穩(wěn)定策略為:A.全選鷹策略B.全選鴿策略C.混合策略(鷹的比例為$V/(2C)$)D.混合策略(鷹的比例為$V/C$)6.非對稱演化博弈與對稱博弈的關(guān)鍵區(qū)別在于:A.參與者的策略集不同B.支付矩陣不對稱C.群體分為不同角色(如捕食者與獵物)D.演化穩(wěn)定策略的定義不需要考慮對稱條件7.復(fù)制動態(tài)方程的穩(wěn)定點滿足$\dot{x}=0$,其中漸近穩(wěn)定的條件是:A.該點處支付函數(shù)的導(dǎo)數(shù)大于0B.該點處支付函數(shù)的導(dǎo)數(shù)小于0C.該點處復(fù)制動態(tài)的雅可比矩陣特征值為正D.該點處復(fù)制動態(tài)的雅可比矩陣特征值為負(fù)8.演化博弈中“慣例形成”(ConventionFormation)通常用以下哪種模型解釋?A.協(xié)調(diào)博弈的演化B.囚徒困境的演化C.鷹鴿博弈的演化D.最后通牒博弈的演化9.在莫蘭過程(MoranProcess)中,策略替換的概率與:A.策略的適應(yīng)度成反比B.策略的適應(yīng)度成正比C.群體規(guī)模無關(guān)D.突變率無關(guān)10.以下哪項是演化博弈區(qū)別于傳統(tǒng)博弈論的核心特征?A.強調(diào)完全理性假設(shè)B.關(guān)注策略隨時間的動態(tài)演化C.僅分析靜態(tài)均衡D.參與者具有完美信息二、簡答題(每題8分,共40分)1.簡述演化穩(wěn)定策略(ESS)的嚴(yán)格定義,并說明其與納什均衡的聯(lián)系與區(qū)別。2.復(fù)制動態(tài)方程的構(gòu)建邏輯是什么?為什么說它反映了“策略傳播速度與策略優(yōu)勢正相關(guān)”的演化機制?3.隨機演化博弈與確定性演化博弈的主要差異是什么?在群體規(guī)模較小的場景中,為何隨機因素不可忽略?4.有限理性假設(shè)下,演化博弈中的策略更新規(guī)則通常有哪些形式?舉例說明其中一種規(guī)則的具體機制。5.以“公共資源困境”為例,說明如何通過演化博弈模型分析合作行為的涌現(xiàn)條件。三、計算題(每題15分,共30分)1.考慮一個雙策略對稱演化博弈,參與者可選擇策略A或策略B。當(dāng)群體中選擇A的比例為$x$時,A的支付為$u_A(x)=3x+1$,B的支付為$u_B(x)=-2x+5$。(1)寫出復(fù)制動態(tài)方程$\dot{x}$的表達(dá)式;(2)計算所有穩(wěn)定點,并判斷其穩(wěn)定性;(3)若初始群體中$x_0=0.3$,描述演化路徑的最終趨勢。2.考慮一個兩群體非對稱演化博弈:群體1(企業(yè))選擇策略“創(chuàng)新”(I)或“模仿”(M),群體2(消費者)選擇“購買創(chuàng)新產(chǎn)品”(B)或“購買模仿產(chǎn)品”(C)。支付矩陣如下:-企業(yè)與消費者的交互支付:企業(yè)選I時,若消費者選B,企業(yè)收益4,消費者收益3;若消費者選C,企業(yè)收益-1,消費者收益2。企業(yè)選M時,若消費者選B,企業(yè)收益2,消費者收益1;若消費者選C,企業(yè)收益3,消費者收益4。(1)設(shè)群體1中選擇I的比例為$x$,群體2中選擇B的比例為$y$,寫出兩群體的復(fù)制動態(tài)方程$\dot{x}$和$\dot{y}$;(2)找出所有可能的演化穩(wěn)定均衡點(ESS),并分析其穩(wěn)定性。四、論述題(20分)結(jié)合生物演化或社會經(jīng)濟中的具體案例,論述演化博弈論如何解釋“合作行為在自私個體中穩(wěn)定存在”這一現(xiàn)象。要求:(1)明確案例背景;(2)構(gòu)建簡化的演化博弈模型;(3)分析模型的演化穩(wěn)定策略;(4)得出結(jié)論。一、選擇題答案1.B(ESS要求當(dāng)群體幾乎全為該策略時,突變策略無法入侵,即滿足$u(s,s)\gequ(t,s)$,且若$u(s,s)=u(t,s)$,則$u(s,t)>u(t,t)$)2.B(復(fù)制動態(tài)的核心是策略增長率等于其支付與平均支付的差,即$\dot{x}=x[u(x)-\bar{u}]$,其中$\bar{u}=xu(x)+(1-x)u(1-x)$)3.B(固定概率指單個突變策略通過隨機漂移或選擇最終占據(jù)整個群體的概率,常見于有限群體隨機演化模型)4.D(有限理性允許群體規(guī)模有限,且策略更新基于經(jīng)驗而非完全理性,因此D錯誤)5.C(鷹鴿博弈的混合ESS比例為$p=V/(2C)$,此處$V=6,C=8$,故$p=6/(2×8)=3/8$)6.C(非對稱博弈的關(guān)鍵是參與者屬于不同角色,如“進入者-在位者”,策略集可能相同但支付矩陣因角色而異)7.D(漸近穩(wěn)定要求該點處復(fù)制動態(tài)的導(dǎo)數(shù)為負(fù),即雅可比矩陣特征值為負(fù),系統(tǒng)受擾動后會回到該點)8.A(協(xié)調(diào)博弈中,參與者需選擇相同策略以最大化收益,演化過程會收斂到某種慣例,如交通靠左或靠右)9.B(莫蘭過程中,個體被復(fù)制的概率與其適應(yīng)度成正比,死亡個體隨機選擇,因此策略替換概率與適應(yīng)度正相關(guān))10.B(演化博弈關(guān)注策略隨時間的動態(tài)調(diào)整,而非靜態(tài)均衡,有限理性是其核心假設(shè)之一)二、簡答題答案1.ESS定義:策略$s$是演化穩(wěn)定的,當(dāng)且僅當(dāng)對任意突變策略$t\neqs$,滿足:(1)$u(s,s)>u(t,s)$;或(2)$u(s,s)=u(t,s)$且$u(s,t)>u(t,t)$。聯(lián)系:ESS一定是納什均衡(NE),因為若$s$是ESS,則對任意$t$,$u(s,s)\gequ(t,s)$,符合NE的定義。區(qū)別:ESS是NE的精煉,要求更強的穩(wěn)定性——不僅自身是均衡,還能抵御突變策略的入侵;而NE可能是不穩(wěn)定的(如混合NE可能被突變破壞)。2.構(gòu)建邏輯:復(fù)制動態(tài)假設(shè)策略傳播速度與該策略的支付優(yōu)勢正相關(guān)。設(shè)群體中選擇策略$i$的比例為$x_i$,其支付為$u_i$,平均支付為$\bar{u}=\sumx_ju_j$,則復(fù)制動態(tài)方程為$\dot{x}_i=x_i(u_i-\bar{u})$。機制解釋:若$u_i>\bar{u}$,則$x_i$增長(正優(yōu)勢導(dǎo)致策略傳播);若$u_i<\bar{u}$,則$x_i$下降(劣勢策略被淘汰)。因此,方程直接反映了“優(yōu)勢策略擴散,劣勢策略收縮”的演化邏輯。3.主要差異:確定性演化(如復(fù)制動態(tài))假設(shè)群體無限大,忽略隨機波動,演化路徑由支付差唯一決定;隨機演化(如莫蘭過程)考慮有限群體中的隨機漂移(如個體隨機死亡/復(fù)制),演化結(jié)果具有概率性。小群體不可忽略隨機因素:小群體中,偶然的策略頻率波動(如某策略個體因隨機死亡減少)可能顯著改變演化路徑,甚至導(dǎo)致劣勢策略固定(fixation),而大群體中隨機波動會被平均化,確定性趨勢占主導(dǎo)。4.策略更新規(guī)則形式:常見規(guī)則包括(1)模仿最優(yōu):個體復(fù)制當(dāng)前群體中支付最高的策略;(2)模仿鄰居:個體以概率與鄰居支付成比例模仿其策略;(3)強化學(xué)習(xí):個體根據(jù)歷史收益調(diào)整策略選擇概率。舉例:模仿鄰居規(guī)則中,個體$i$選擇策略$s$的概率為$\frac{\exp(\betau_i(s))}{\sum_t\exp(\betau_i(t))}$,其中$\beta$為選擇強度($\beta$越大,越傾向于高支付策略)。該規(guī)則反映了有限理性下,個體通過局部觀察(鄰居)而非全局信息更新策略。5.公共資源困境模型:假設(shè)群體中個體可選擇“合作”(限制資源使用,收益$R$)或“背叛”(過度使用,收益$T$,但導(dǎo)致公共資源減少,全體收益下降)。設(shè)合作比例為$x$,則合作者支付$u_C=R-c(1-x)$($c$為背叛者對合作者的負(fù)外部性),背叛者支付$u_D=T-cx$($x$越大,資源剩余越多,背叛者成本越低)。合作涌現(xiàn)條件:當(dāng)$u_C>u_D$時,$x$增長。演化穩(wěn)定時,若存在$x^$使得$u_C(x^)=u_D(x^)$,則需滿足復(fù)制動態(tài)在$x^$處穩(wěn)定(導(dǎo)數(shù)為負(fù))。例如,若$R-c(1-x)>T-cx$,即$R-c>T$,則全合作($x=1$)是ESS;否則可能出現(xiàn)混合均衡。三、計算題答案1.(1)平均支付$\bar{u}=xu_A(x)+(1-x)u_B(x)=x(3x+1)+(1-x)(-2x+5)=3x^2+x-2x+2x^2+5-5x=5x^2-6x+5$。復(fù)制動態(tài)方程:$\dot{x}=x(u_A-\bar{u})=x[(3x+1)-(5x^2-6x+5)]=x(-5x^2+9x-4)=-5x^3+9x^2-4x$。(2)穩(wěn)定點滿足$\dot{x}=0$,解得$x=0$,$x=1$,或$-5x^2+9x-4=0$(即$x=(9\pm\sqrt{81-80})/10=(9\pm1)/10$,故$x=1$或$x=0.8$)。但$x=1$是重根,實際穩(wěn)定點為$x=0$,$x=0.8$,$x=1$。計算導(dǎo)數(shù)判斷穩(wěn)定性:$\frac{d\dot{x}}{dx}=-15x^2+18x-4$。-當(dāng)$x=0$時,導(dǎo)數(shù)為$-4<0$,故$x=0$是漸近穩(wěn)定點;-當(dāng)$x=0.8$時,導(dǎo)數(shù)為$-15×0.64+18×0.8-4=-9.6+14.4-4=0.8>0$,故$x=0.8$是不穩(wěn)定點;-當(dāng)$x=1$時,導(dǎo)數(shù)為$-15×1+18×1-4=-1<0$,故$x=1$是漸近穩(wěn)定點。(3)初始$x_0=0.3$,位于$x=0$和$x=0.8$之間。由于$x=0.8$是不穩(wěn)定點,當(dāng)$x<0.8$時,$\dot{x}=x(-5x^2+9x-4)$。代入$x=0.3$,計算$-5×0.027+9×0.09-4=-0.135+0.81-4=-3.325<0$,故$\dot{x}<0$,$x$向$x=0$演化,最終收斂到全選B策略。2.(1)群體1(企業(yè))的平均支付$\bar{u}_1=x[4y+(-1)(1-y)]+(1-x)[2y+3(1-y)]=x(5y-1)+(1-x)(-y+3)$。企業(yè)選擇I的支付$u_I=4y-1(1-y)=5y-1$,故復(fù)制動態(tài)$\dot{x}=x(u_I-\bar{u}_1)=x[(5y-1)-(x(5y-1)+(1-x)(-y+3))]=x(1-x)[(5y-1)-(-y+3)]=x(1-x)(6y-4)$。群體2(消費者)的平均支付$\bar{u}_2=y[3x+1(1-x)]+(1-y)[2x+4(1-x)]=y(2x+1)+(1-y)(-2x+4)$。消費者選擇B的支付$u_B=3x+1(1-x)=2x+1$,故復(fù)制動態(tài)$\dot{y}=y(u_B-\bar{u}_2)=y[(2x+1)-(y(2x+1)+(1-y)(-2x+4))]=y(1-y)[(2x+1)-(-2x+4)]=y(1-y)(4x-3)$。(2)演化穩(wěn)定均衡點需滿足$\dot{x}=0$且$\dot{y}=0$,即:-$x=0$或$x=1$或$6y-4=0$($y=2/3$);-$y=0$或$y=1$或$4x-3=0$($x=3/4$)??赡艿木恻c:$(0,0)$,$(0,1)$,$(1,0)$,$(1,1)$,$(3/4,2/3)$。穩(wěn)定性分析:-$(0,0)$:$\dot{x}=0(1-0)(6×0-4)=0$,$\dot{y}=0(1-0)(4×0-3)=0$。計算雅可比矩陣:$J=\begin{bmatrix}(1-2x)(6y-4)&6x(1-x)\\4y(1-y)&(1-2y)(4x-3)\end{bmatrix}$,代入$(0,0)$得$J=\begin{bmatrix}(-1)(-4)&0\\0&(1)(-3)\end{bmatrix}=\begin{bmatrix}4&0\\0&-3\end{bmatrix}$,特征值為4(正)和-3(負(fù)),鞍點,不穩(wěn)定。-$(0,1)$:$J=\begin{bmatrix}(1-0)(6×1-4)&0\\4×1×0&(1-2×1)(4×0-3)\end{bmatrix}=\begin{bmatrix}2&0\\0&3\end{bmatrix}$,特征值均為正,不穩(wěn)定。-$(1,0)$:$J=\begin{bmatrix}(1-2×1)(6×0-4)&0\\0&(1-0)(4×1-3)\end{bmatrix}=\begin{bmatrix}(-1)(-4)&0\\0&1\end{bmatrix}=\begin{bmatrix}4&0\\0&1\end{bmatrix}$,特征值均為正,不穩(wěn)定。-$(1,1)$:$J=\begin{bmatrix}(1-2×1)(6×1-4)&0\\0&(1-2×1)(4×1-3)\end{bmatrix}=\begin{bmatrix}(-1)(2)&0\\0&(-1)(1)\end{bmatrix}=\begin{bmatrix}-2&0\\0&-1\end{bmatrix}$,特征值均為負(fù),漸近穩(wěn)定(ESS)。-$(3/4,2/3)$:此時$\dot{x}=0$且$\dot{y}=0$,但雅可比矩陣在該點的特征值需計算:$J=\begin{bmatrix}(1-2×3/4)(6×2/3-4)&6×3/4×1/4\\4×2/3×1/3&(1-2×2/3)(4×3/4-3)\end{bmatrix}=\begin{bmatrix}(-1/2)(0)&9/8\\8/9&(-1/3)(0)\end{bmatrix}=\begin{bmatrix}0&9/8\\8/9&0\end{bmatrix}$,特征值為$\pm\sqrt{(9/8)(8/9)}=\pm1$,一正一負(fù),鞍點,不穩(wěn)定。綜上,唯一的演化穩(wěn)定均衡點是$(1,1)$,即企業(yè)全選創(chuàng)新、消費者全選購買創(chuàng)新產(chǎn)品。四、論述題答案案例背景:生物界中,吸血蝙蝠的“血液共享”行為——饑餓的蝙蝠會接受其他蝙蝠反芻的血液,而共享者未來可能獲得回報。這種合作行為在自私個體中穩(wěn)定存在,傳統(tǒng)自利模型難以解釋,需用演化博弈分析。模型構(gòu)建:假設(shè)蝙蝠群體中存在兩種策略:“合作”(C,共享血液)和“背叛”(D,拒絕共享)。設(shè)群體中選擇C的比例為$x$。-當(dāng)兩個C相遇時,雙方因共享獲得收益$b$(避免饑餓死亡),但需支付成本$c$(失去部分血液),故支付$u(C,C)=b-c$;-當(dāng)C與D相遇時,C支付成本$c$但無回報,D不支付成本但獲得收益$b$,故$u(C,D)=-c$,$u(D,C)=b$;-當(dāng)兩個D相遇時,雙方無收益無成本,支付$u(D,D)=0$。演化穩(wěn)定策略分析:復(fù)制動態(tài)方程為$\dot{x}=x(u_C-\bar{u})$,其中$u_C=x(b-c)+(1-x)(-c)=xb-c$,$\bar{u}=xu_C+(1-x)u_D=x(xb-c)+(1-x)(xb)=x^2b-xc+xb-x^2b=xb-xc$。因此,$\dot{x}=x[(xb-c)-(xb-xc)]=x(-c+xc)=xc(x-1)$。穩(wěn)定點滿足$\dot{x}=0$,即$x=0$或$x=1$。-當(dāng)$x=0$(全背叛)時,$\frac{d\dot{x}}{dx}=c(0-1)+c×0=-c<0$($c>0$),故$x=0$是漸近穩(wěn)定點?但這與現(xiàn)實矛盾,說明模型需修正。修正模型:引入“聲譽機制”——個體記住曾背叛者,未來拒絕與其合作。設(shè)合作策略C僅與C合作,D與所有人合作(或被C排斥)。此時,C的支付為$u_C=x(b-c)+(1-x)(0)$(被D排斥,無收益),D的支付為$u_D=xb+(1-x)0=xb$(從C處獲取收
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 核心素養(yǎng)導(dǎo)向教學(xué)
- 《GB-T 28200-2011鋼制儲物柜(架)技術(shù)要求及試驗方法》專題研究報告
- GBT 19290.7-2021發(fā)展中的電子設(shè)備構(gòu)體機械結(jié)構(gòu)模數(shù)序列 第2-5部分:分規(guī)范 25 mm設(shè)備構(gòu)體的接口協(xié)調(diào)尺寸 各種設(shè)備用機柜接口尺寸專題研究報告
- 《寵物鑒賞》課件-寵物鳥的簡介
- 2026年安徽省馬鞍山市單招職業(yè)傾向性測試題庫及參考答案詳解一套
- 心血管留圖資料
- 云數(shù)據(jù)庫運維服務(wù)合同
- 智能電表調(diào)試技師(初級)考試試卷及答案
- 種子包裝設(shè)計行業(yè)種子包裝設(shè)計師(蔬菜)崗位招聘考試試卷及答案
- (2025)全國勞動保障知識競賽題庫與參考答案
- 2025年煙花爆竹經(jīng)營單位安全管理人員考試試題及答案
- 2025天津大學(xué)管理崗位集中招聘15人參考筆試試題及答案解析
- 2025廣東廣州黃埔區(qū)第二次招聘社區(qū)專職工作人員50人考試筆試備考題庫及答案解析
- 2025年云南省人民檢察院聘用制書記員招聘(22人)考試筆試參考題庫及答案解析
- 旋挖鉆機地基承載力驗算2017.7
- xx鄉(xiāng)鎮(zhèn)衛(wèi)生院重癥精神病管理流程圖
- 2023年印江縣人民醫(yī)院緊缺醫(yī)學(xué)專業(yè)人才招聘考試歷年高頻考點試題含答案解析
- 安徽綠沃循環(huán)能源科技有限公司12000t-a鋰離子電池高值資源化回收利用項目(重新報批)環(huán)境影響報告書
- 《汽車電器故障問題研究4600字(論文)》
- 公路工程標(biāo)準(zhǔn)施工招標(biāo)文件第八章-工程量清單計量規(guī)則(2018年版最終稿)
- DB44-T 2197-2019配電房運維服務(wù)規(guī)范-(高清現(xiàn)行)
評論
0/150
提交評論