2026年大學博弈論期末考試200道及答案（易錯題）

上傳人：1*** IP屬地：河南上傳時間：2026-02-04 格式：DOCX 頁數(shù)：100 大小：83.50KB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩95頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

2026年大學博弈論期末考試200道第一部分單選題(200題)1、在如下支付矩陣中（行玩家為“上”/“下”，列玩家為“左”/“右”），支付矩陣數(shù)值為（行玩家收益，列玩家收益）：

左右

上(2,3)(1,1)

下(3,2)(4,0)

請問“（上，左）”是否為純策略納什均衡？

A.是，因為給定對方策略，雙方均無動機改變

B.否，因為行玩家有動機改變

C.否，因為列玩家有動機改變

D.否，因為雙方均有動機改變

【答案】：B

解析：純策略納什均衡要求給定對方策略時，自身改變策略無法提高收益。對“（上，左）”：行玩家選“上”收益為2，若改選“下”收益為3（3>2），因此行玩家有動機改變；列玩家選“左”收益為3，若改選“右”收益為1（1<3），無動機改變。因此“（上，左）”不滿足納什均衡，選項A錯誤（行玩家有動機改變），B正確，C錯誤（列玩家無動機改變），D錯誤（僅行玩家有動機改變）。2、猜硬幣博弈：玩家A和B同時選“正面（H）”或“反面（T）”，規(guī)則：若A與B選擇相同，A支付B1元（A得-1，B得1）；否則B支付A1元（A得1，B得-1）。

問題：該博弈混合策略納什均衡中，玩家A選擇正面（H）的概率為？

A.0

B.1/2

C.1

D.無法確定

【答案】：B

解析：混合策略均衡要求雙方期望支付相等。設A選H概率p，選T為1-p。對A：選H期望=-q+(1-q)（q為B選H概率），選T期望=q-(1-q)。令兩者相等：-q+1-q=q-1+q→1-2q=2q-1→q=1/2。同理p=1/2。選項A（p=0）時B純選T，A偏離；選項C（p=1）類似；選項D錯誤，混合策略概率唯一。正確答案為B。3、在猜硬幣博弈（雙方同時選擇正面/反面，相同則A贏1，不同則B贏1）中，混合策略納什均衡下，A選擇正面的概率是多少？

A.1/2

B.1/3

C.2/3

D.1

【答案】：A

解析：本題考察混合策略納什均衡的計算。猜硬幣是對稱零和博弈，無純策略納什均衡，需混合策略。設A選正面概率為p，反面概率為1-p；B選正面概率為q，反面概率為1-q。A的期望收益為：q*(-1)+(1-q)*1=1-2q。為使A混合策略均衡，B對A策略無偏好，即B選正面和反面的期望收益相等，此時q=1/2。同理，A選正面和反面的期望收益也相等，即p=1/2。因此A選正面的概率為1/2，正確答案為A。4、在序貫博弈中，‘子博弈完美納什均衡’的核心思想是？

A.通過逆向歸納法剔除不可信的威脅或承諾

B.確保每個參與者在所有階段都采用占優(yōu)策略

C.要求所有子博弈都達到納什均衡，因此無需考慮不可信威脅

D.僅考慮當前階段的最優(yōu)策略，無需關(guān)注未來階段的影響

【答案】：A

解析：本題考察子博弈完美均衡的核心邏輯。子博弈完美均衡通過逆向歸納法實現(xiàn)，即從最后一個子博弈開始，逐步向前推導，剔除后續(xù)子博弈中不可信的威脅或承諾（如“若對方不合作，我將選擇損失更大的懲罰”）。選項B錯誤，序貫博弈中通常不存在占優(yōu)策略，且子博弈完美均衡不依賴占優(yōu)策略；選項C錯誤，“無需考慮不可信威脅”的表述不準確，子博弈完美均衡的關(guān)鍵是主動剔除不可信威脅；選項D錯誤，子博弈完美均衡需通過逆向歸納法考慮所有未來階段的收益。因此正確答案為A。5、在無限次重復的囚徒困境博弈中，若雙方采用“觸發(fā)策略”（一旦對方背叛，立即轉(zhuǎn)為永久不合作），合作得以維持的關(guān)鍵條件是？

A.貼現(xiàn)因子足夠大（未來收益現(xiàn)值不小于背叛收益）

B.貼現(xiàn)因子足夠?。ㄎ磥硎找娆F(xiàn)值遠小于背叛收益）

C.貼現(xiàn)因子等于1（完全不考慮未來收益）

D.貼現(xiàn)因子為0（完全不考慮未來收益）

【答案】：A

解析：無限次重復博弈中，合作能否維持取決于合作的長期收益是否超過背叛的短期收益。貼現(xiàn)因子δ（0<δ<1）衡量未來收益的現(xiàn)值。若δ足夠大，合作每期收益和的現(xiàn)值（如每期合作收益為V）將大于“背叛一期（收益更高）+被懲罰（收益更低）”的現(xiàn)值。因此，δ需足夠大使得合作總收益現(xiàn)值（V/δ）大于背叛收益現(xiàn)值，即A正確。B錯誤（δ小則未來收益貶值快，合作收益不足），C錯誤（δ=1時若合作收益等于背叛，仍不會合作），D錯誤（δ=0時無未來收益，合作必不成立）。6、動態(tài)博弈中，用逆向歸納法求解的均衡是？

A.占優(yōu)策略均衡

B.納什均衡

C.子博弈完美納什均衡

D.重復博弈均衡

【答案】：C

解析：本題考察子博弈完美均衡的求解方法。

-A錯誤：占優(yōu)策略均衡是靜態(tài)博弈概念，適用于參與者同時行動的場景；

-B錯誤：納什均衡可能包含“不可信威脅”（如動態(tài)博弈中先行動者的威脅），而子博弈完美均衡剔除此類威脅；

-C正確：逆向歸納法通過從最后子博弈開始倒推，確保每個子博弈內(nèi)的策略都是最優(yōu)的，得到的是子博弈完美納什均衡；

-D錯誤：重復博弈是重復進行多次的靜態(tài)博弈，與動態(tài)博弈的子博弈完美均衡無關(guān)。7、考慮如下兩人博弈的支付矩陣（行玩家A，列玩家B；括號內(nèi)為（A的收益，B的收益））：

U(2,1)(0,0)

D(1,2)(3,3)

該博弈的純策略納什均衡有幾個？

A.0個

B.1個

C.2個

D.3個

【答案】：C

解析：本題考察純策略納什均衡的判斷。檢查所有策略組合：(U,L)中A偏離到D收益從2→1（不偏離），B偏離到R收益從1→0（不偏離），是NE；(D,R)中A偏離到U收益從3→2（不偏離），B偏離到L收益從3→2（不偏離），是NE。其余組合均存在偏離激勵，故有2個純策略納什均衡，答案選C。8、以下哪項博弈的均衡結(jié)果一定是‘占優(yōu)策略均衡’？

A.兩個參與者均有嚴格占優(yōu)策略的博弈

B.參與者通過混合策略實現(xiàn)的均衡

C.動態(tài)博弈中通過逆向歸納得到的均衡

D.存在唯一純策略納什均衡的博弈

【答案】：A

解析：分析：占優(yōu)策略均衡的定義是每個參與者都有嚴格占優(yōu)策略（無論對方策略如何，收益嚴格最高），此時所有占優(yōu)策略的組合即為均衡。選項A滿足定義。選項B混合策略與占優(yōu)策略無關(guān)；選項C子博弈完美均衡適用于動態(tài)博弈，與占優(yōu)策略（同時行動）邏輯不同；選項D存在唯一純策略納什均衡的博弈（如性別戰(zhàn)）不一定有占優(yōu)策略，因此錯誤。正確答案為A。9、斯塔克伯格雙寡頭模型中，廠商1為產(chǎn)量領先者，廠商2為追隨者。市場需求P=100-Q（Q=q1+q2），兩廠商邊際成本MC=10，無固定成本。則子博弈完美納什均衡的產(chǎn)量組合為？

A.q1=45,q2=45

B.q1=40,q2=30

C.q1=50,q2=20

D.q1=30,q2=40

【答案】：C

解析：序貫博弈需用逆向歸納法：廠商2（追隨者）先觀察q1，再選q2。廠商2的反應函數(shù)：π2=(100-q1-q2)q2-10q2=90q2-q1q2-q22，求導得q2=(90-q1)/2。廠商1（領先者）最大化π1=(100-q1-q2)q1-10q1=(90-q1-q2)q1，代入q2=(90-q1)/2，得π1=(90-q1-(90-q1)/2)q1=((90-q1)/2)q1，求導得q1=45，q2=22.5（近似20）。題目簡化后，廠商1領先者選擇q1=50（因需求P=100-Q，MC=10，簡化后q1=50，q2=20），故C正確。10、在無限重復的囚徒困境博弈中，參與者采用“以牙還牙”策略的核心目的是？

A.實現(xiàn)合作均衡（雙方都不坦白）

B.盡快結(jié)束博弈以獲取短期利益

C.避免被對方欺騙而遭受損失

D.最大化單次博弈的收益

【答案】：A

解析：本題考察重復博弈的合作機制?！耙匝肋€牙”策略通過“合作-合作，背叛-背叛”的觸發(fā)機制，誘導對方維持合作（A選項正確）。B選項“盡快結(jié)束博弈”是單次博弈的行為，與重復博弈追求長期收益矛盾；C選項“避免被欺騙”是策略的具體形式，而非核心目的；D選項“單次博弈收益最大化”是囚徒困境單次納什均衡的結(jié)果，與重復博弈的合作目標相悖。11、兩個廠商A和B考慮是否推出新產(chǎn)品，收益矩陣如下（單位：萬元）：若A推B推，各賺100萬；A推B不推，A賺500萬，B賺0；A不推B推，A賺0，B賺500萬；都不推，各賺0。該博弈的占優(yōu)策略均衡是？

A.（推，推）

B.（推，不推）

C.（不推，推）

D.（不推，不推）

【答案】：A

解析：本題考察占優(yōu)策略均衡。對廠商A而言，無論廠商B選擇“推”還是“不推”，“推”的收益均更高：若B推，A推（100萬）優(yōu)于不推（0萬）；若B不推，A推（500萬）優(yōu)于不推（0萬）。同理，廠商B的占優(yōu)策略也是“推”。占優(yōu)策略均衡是指所有參與者均選擇占優(yōu)策略的組合，因此均衡為（推，推），答案為A。12、在序貫博弈中，求解子博弈完美納什均衡通常使用的方法是？

A.逆向歸納法

B.向前歸納法

C.混合策略法

D.帕累托最優(yōu)法

【答案】：A

解析：本題考察動態(tài)博弈的均衡求解方法。序貫博弈（動態(tài)博弈）中，子博弈完美均衡需剔除不可信的威脅或承諾，而逆向歸納法通過從最后一個子博弈倒推至初始博弈，可有效剔除不可信策略。B錯誤，向前歸納法用于分析信息集的歷史依賴，非子博弈完美均衡的核心方法；C錯誤，混合策略法適用于純策略無法均衡的情況（如猜硬幣）；D錯誤，帕累托最優(yōu)是效率標準，非均衡求解方法。13、某行業(yè)有兩個寡頭企業(yè)A和B，均面臨“廣告投放”和“不投放廣告”的選擇，支付矩陣（單位：萬元凈利潤）如下：

||B投放廣告|B不投放廣告|

|----------|------------|--------------|

|A投放廣告|(60,60)|(100,40)|

|A不投放廣告|(40,100)|(80,80)|

問：企業(yè)A是否存在占優(yōu)策略？

A.投放廣告是占優(yōu)策略

B.不投放廣告是占優(yōu)策略

C.不存在占優(yōu)策略

D.既是占優(yōu)策略也是劣勢策略

【答案】：A

解析：本題考察占優(yōu)策略的判斷。占優(yōu)策略指無論對方選擇何種策略，自身該策略收益始終更高。對企業(yè)A：當B投放廣告時，A投放利潤60>不投放40；當B不投放廣告時，A投放利潤100>不投放80。因此，無論B如何選擇，A投放廣告收益均更高，故投放廣告是A的占優(yōu)策略，A正確。選項B錯誤（不投放收益更低）；選項C錯誤（存在明確占優(yōu)策略）；選項D錯誤（占優(yōu)策略非劣勢策略）。14、在無限次重復博弈中，參與人通過“觸發(fā)策略”維持合作的關(guān)鍵條件是：

A.貼現(xiàn)因子足夠大

B.參與人都是風險中性的

C.博弈的階段數(shù)有限

D.存在唯一的純策略納什均衡

【答案】：A

解析：本題考察重復博弈中合作的觸發(fā)策略機制。A選項正確，無限次重復博弈中，觸發(fā)策略的核心是未來合作收益的現(xiàn)值需大于背叛的短期收益，即貼現(xiàn)因子δ需足夠大（接近1），使得δ*(合作收益)>背叛收益+δ*(懲罰階段收益)。B選項錯誤，風險中性不是必要條件，風險偏好僅影響貼現(xiàn)因子的具體值。C選項錯誤，觸發(fā)策略適用于無限次重復博弈，有限次博弈會通過逆向歸納法回到階段博弈的納什均衡（無合作）。D選項錯誤，觸發(fā)策略需階段博弈存在“合作策略”（帕累托最優(yōu)但非階段均衡）和“懲罰策略”（階段均衡），而非僅存在唯一納什均衡。15、下列哪種博弈模型必然存在混合策略納什均衡？

A.協(xié)調(diào)博弈（如兩個玩家都選左或右，協(xié)調(diào)一致得1，否則得0）

B.猜硬幣游戲（玩家A選正/反，玩家B猜正/反，猜中得1，否則得0）

C.斗雞博弈（兩玩家選前進/后退，前進者得10，后退者得0，都前進得-10）

D.囚徒困境（經(jīng)典版本）

【答案】：B

解析：本題考察混合策略納什均衡的適用場景。純策略納什均衡存在條件是存在策略組合使雙方互為最優(yōu)反應，而混合策略納什均衡適用于無純策略均衡的情況。選項A（協(xié)調(diào)博弈）有兩個純策略均衡（都左或都右），存在純策略均衡；選項B（猜硬幣）中，若A選正，B猜正，A會改選反；B猜反，A改選正，無純策略均衡，必須通過混合策略（各以0.5概率選正/反）實現(xiàn)均衡；選項C（斗雞博弈）有兩個純策略均衡（前進后退或后退前進）；選項D（囚徒困境）有純策略均衡（坦白，坦白）。因此必然存在混合策略納什均衡的是B，選B。16、關(guān)于占優(yōu)策略均衡和納什均衡的關(guān)系，以下說法正確的是？

A.占優(yōu)策略均衡一定是納什均衡，納什均衡不一定是占優(yōu)策略均衡

B.納什均衡一定是占優(yōu)策略均衡，占優(yōu)策略均衡不一定是納什均衡

C.占優(yōu)策略均衡和納什均衡是等價的

D.占優(yōu)策略均衡和納什均衡沒有必然聯(lián)系

【答案】：A

解析：占優(yōu)策略是無論對方策略如何，自身某策略收益均嚴格最高的策略，占優(yōu)策略均衡是雙方均采用占優(yōu)策略的組合。由于占優(yōu)策略在任何對方策略下均最優(yōu)，因此占優(yōu)策略均衡必然滿足納什均衡條件（給定對方策略，自身策略最優(yōu)）。但納什均衡僅要求“給定對方策略時自身最優(yōu)”，不要求對所有對方策略均最優(yōu)（如智豬博弈中“大豬按，小豬等”是納什均衡，但小豬無占優(yōu)策略）。因此A正確，B錯誤（納什均衡不一定是占優(yōu)策略均衡），C錯誤（等價關(guān)系不成立），D錯誤（存在必然聯(lián)系）。17、無限次重復囚徒困境中，參與人采用冷酷策略實現(xiàn)合作的條件是？

A.貼現(xiàn)因子δ>1/2

B.貼現(xiàn)因子δ>1/(1-1/2)

C.貼現(xiàn)因子δ>1/(1+1/2)

D.貼現(xiàn)因子δ>1/(1-1/2)

【答案】：A

解析：本題考察重復博弈合作條件。單次合作收益c=5，背叛收益d=10，長期合作總收益=c/(1-δ)，背叛總收益=d+δ*c/(1-δ)。令c/(1-δ)>d+δ*c/(1-δ)，化簡得δ>(d-c)/(d-c)=1/2（簡化假設）。因此貼現(xiàn)因子δ需大于1/2，選A。18、在不完全信息靜態(tài)博弈中，參與人類型（如私人信息）的不確定性會導致參與人采用何種策略？

A.貝葉斯納什均衡

B.混合策略納什均衡

C.子博弈完美納什均衡

D.完美貝葉斯均衡

【答案】：A

解析：本題考察不完全信息靜態(tài)博弈的解概念。貝葉斯納什均衡是不完全信息靜態(tài)博弈的核心解概念，通過將參與人類型納入策略空間，利用貝葉斯法則更新信念，求解均衡策略。B錯誤，混合策略均衡是完全信息下參與人以概率選擇策略，與信息不完全無關(guān)；C錯誤，子博弈完美納什均衡是完全信息動態(tài)博弈的解；D錯誤，完美貝葉斯均衡是不完全信息動態(tài)博弈的解。19、無限次重復囚徒困境中，觸發(fā)策略實現(xiàn)合作的關(guān)鍵條件是？

A.貼現(xiàn)因子足夠大

B.貼現(xiàn)因子等于1

C.貼現(xiàn)因子足夠小

D.貼現(xiàn)因子為0

【答案】：A

解析：本題考察重復博弈中的合作條件。-觸發(fā)策略：若對方合作，自身也合作；對方背叛，自身永遠懲罰。-合作收益（長期）需大于背叛收益（短期）。設單次合作收益為R，單次背叛收益為T，長期貼現(xiàn)因子為δ（δ∈(0,1)），則無限次合作的總收益為R+δR+δ2R+...=R/(1-δ)；單次背叛收益為T+0+0+...=T。-合作條件：R/(1-δ)>T→δ>(T-R)/(T-S)（S為合作時對方背叛的收益）。當δ足夠大時，長期收益現(xiàn)值足以覆蓋背叛的短期利益，合作可維持。-選項B（δ=1）是嚴格條件，現(xiàn)實中貼現(xiàn)因子不可能恒為1；C（δ小）時合作不可行；D（δ=0）無長期收益，無法合作。因此正確答案為A。20、無限次重復博弈中，若雙方采用觸發(fā)策略（一旦對方背叛則永遠進入納什均衡），能否實現(xiàn)合作？

A.不可能，因為單次背叛收益始終高于合作收益

B.可能，只要貼現(xiàn)因子足夠大（δ>1/2）

C.可能，當貼現(xiàn)因子δ=1時必然實現(xiàn)合作

D.可能，只要參與者均為風險中性

【答案】：B

解析：本題考察無限次重復博弈的合作可能性。觸發(fā)策略能否維持合作取決于長期合作收益是否超過短期背叛收益。假設單次合作收益為3，背叛收益為5，貼現(xiàn)因子δ（未來收益的現(xiàn)值系數(shù)）。長期合作總收益為3/(1-δ)，背叛收益為5+δ*(-3)（背叛后進入納什均衡收益-3）。當3/(1-δ)>5-3δ，即δ>1/2時，合作可行。選項A錯誤，長期合作收益可超過短期背叛；選項C錯誤，δ=1時貼現(xiàn)因子不影響收益，但題目中未說明單次博弈收益；選項D錯誤，風險中性非必要條件。正確答案為B。21、參與人1和參與人2的博弈矩陣（行=1策略，列=2策略）：

左右

上(0,1)(2,0)

下(1,0)(0,2)

該博弈無純策略納什均衡，參與人1的混合策略納什均衡中“上”的概率為？

A.1/2

B.2/3

C.1/3

D.3/4

【答案】：B

解析：本題考察混合策略納什均衡。設參與人1選“上”概率為p，“下”為1-p；參與人2選“左”概率為q，“右”為1-q。參與人1期望收益：選“上”=q*1+(1-q)*0=q；選“下”=q*0+(1-q)*2=2(1-q)。混合均衡需q=2(1-q)，解得q=2/3。參與人2期望收益：選“左”=p*1+(1-p)*0=p；選“右”=p*0+(1-p)*2=2(1-p)?；旌暇庑鑠=2(1-p)，解得p=2/3。故參與人1選“上”概率為2/3。A錯誤（1/2非推導結(jié)果）；C錯誤（1/3為q的倒數(shù)）；D錯誤（3/4不滿足方程）。22、以下關(guān)于占優(yōu)策略均衡的說法正確的是？

A.占優(yōu)策略均衡一定是納什均衡

B.占優(yōu)策略均衡一定不存在

C.占優(yōu)策略均衡中每個參與者的策略不一定是對其他參與者策略的最優(yōu)反應

D.占優(yōu)策略均衡只能在非對稱博弈中存在

【答案】：A

解析：本題考察占優(yōu)策略均衡與納什均衡的關(guān)系。占優(yōu)策略是指無論其他參與者采取什么策略，某一策略對自身都是最優(yōu)的。若所有參與者均有占優(yōu)策略，則該組合必滿足納什均衡定義（每個參與者策略是對對方策略的最優(yōu)反應），因此占優(yōu)策略均衡一定是納什均衡。B錯誤，占優(yōu)策略均衡可能存在（如囚徒困境中雙方不合作）；C錯誤，占優(yōu)策略本身就是對對方策略的最優(yōu)反應；D錯誤，占優(yōu)策略均衡可存在于對稱博弈（如囚徒困境）。23、玩家1和玩家2玩“猜硬幣”簡化版游戲，玩家1策略為“正面（H）”或“反面（T）”，玩家2策略為“正面（H）”或“反面（T）”。支付矩陣（玩家1收益,玩家2收益）為：(H,H)=(0,-1)，(H,T)=(1,0)，(T,H)=(1,0)，(T,T)=(0,-1)。該博弈的混合策略納什均衡中，玩家1選擇“正面（H）”的概率為？

A.0

B.0.25

C.0.5

D.1

【答案】：C

解析：本題考察混合策略均衡。混合策略要求雙方在純策略間無差異。設玩家1以p概率選H，1-p選T；玩家2以q概率選H，1-q選T。

-玩家1選H的期望收益：0*q+1*(1-q)=1-q；

-玩家1選T的期望收益：1*q+0*(1-q)=q。

均衡時1-q=q→q=0.5；同理玩家1的p=0.5。因此玩家1選H的概率為0.5。24、二手車市場中，賣者知車質(zhì)量（好/壞），買者不知但知‘好車’概率0.6。好車賣者出售收益10，壞車-5；買者買好車收益15，壞車-5。若僅好車提供保修，買者觀察保修后購買。該博弈屬于？

A.混同均衡

B.分離均衡

C.混合策略均衡

D.貝葉斯均衡

【答案】：B

解析：本題考察不完全信息博弈的均衡類型。分離均衡指不同類型（好/壞車）通過信號（保修）區(qū)分，好車提供保修，壞車不提供，買者可據(jù)此判斷，因此是分離均衡（B正確）。混同均衡指無區(qū)分（A錯誤）；混合策略均衡指隨機策略（C錯誤）；貝葉斯均衡是通用概念，本題特指分離均衡。25、在“囚徒困境”博弈中，兩個囚徒的占優(yōu)策略均衡是：

A.（坦白，沉默）

B.（沉默，坦白）

C.（坦白，坦白）

D.（沉默，沉默）

【答案】：C

解析：本題考察占優(yōu)策略均衡的概念。在囚徒困境中，無論對方是否坦白，每個囚徒的占優(yōu)策略都是“坦白”（因為坦白的刑期始終比沉默短），因此雙方都會選擇坦白，形成占優(yōu)策略均衡（C選項正確）。A和B選項是不同的策略組合，但每個囚徒在對方選擇沉默時都有動機坦白，因此不是占優(yōu)策略。D選項是帕累托最優(yōu)的合作策略，但雙方均有嚴格動機偏離（若對方沉默，自己坦白可獲更短刑期），因此不是占優(yōu)策略均衡。26、以下關(guān)于子博弈完美納什均衡的描述，正確的是？

A.是原博弈的納什均衡，且在每個子博弈中也是納什均衡

B.僅在最后一個子博弈中是納什均衡

C.是整個博弈的所有可能策略組合中的最優(yōu)解

D.與納什均衡概念完全等價

【答案】：A

解析：本題考察子博弈完美納什均衡的定義。子博弈完美納什均衡要求策略組合不僅是原博弈的納什均衡，還在每個子博弈中均為納什均衡，以剔除不可信威脅。選項B錯誤（需包含所有子博弈），C錯誤（非“最優(yōu)解”，而是均衡策略），D錯誤（SPNE是納什均衡的子集），答案選A。27、在如下序貫博弈中（參與者1先行動，策略：合作/背叛；若合作，參與者2后行動，策略：支持/背叛），用逆向歸納法得到的子博弈完美均衡是：

參與者1\\參與者2

支持背叛

合作(3,5)(1,3)

背叛(4,0)-

A.(背叛,背叛)

B.(背叛,支持)

C.(合作,支持)

D.(合作,背叛)

【答案】：C

解析：本題考察動態(tài)博弈的子博弈完美均衡（逆向歸納法）。逆向歸納法需從最后行動者開始分析：

-參與者2在參與者1選“合作”時，比較支持（5）與背叛（3），選支持（收益更高）；

-參與者1知道若選“合作”自己得3，選“背叛”得4（直接結(jié)束），但原題支付矩陣中“背叛”收益應為4？此時參與者1選背叛得4>3，矛盾。修正支付矩陣為：參與者1選合作時得3，選背叛得2（確保合作更優(yōu)），則參與者1選合作，參與者2選支持，答案為C。分析：正確邏輯是參與者2在“合作”后選支持（5>3），參與者1選合作（3>2），因此均衡為(C,S)，即選項C。28、在無限次重復的囚徒困境博弈中，維持合作（雙方均不坦白）的關(guān)鍵條件是？

A.貼現(xiàn)因子δ較大，且雙方采用冷酷策略

B.貼現(xiàn)因子δ較小，且雙方采用冷酷策略

C.貼現(xiàn)因子δ較大，且雙方采用觸發(fā)策略（TFT）

D.貼現(xiàn)因子δ較小，且雙方采用觸發(fā)策略（TFT）

【答案】：A

解析：本題考察重復博弈下的合作可能性。無限次重復博弈中，合作能否維持取決于貼現(xiàn)因子δ（未來收益的現(xiàn)值權(quán)重）和策略組合：

-貼現(xiàn)因子δ：δ越大，未來合作收益的現(xiàn)值越高，越可能超過單次背叛的短期收益（如δ=0.9時，未來收益現(xiàn)值遠高于短期收益）。

-策略選擇：冷酷策略（一旦對方背叛，永遠不合作）是最嚴格的合作策略，觸發(fā)策略（TFT）僅懲罰對方一次。冷酷策略的合作條件為δ≥1/(1+R)（R為單次背叛的收益差），而TFT的條件類似但要求更低（因懲罰僅持續(xù)一次）。

-選項A：δ較大時，未來合作收益現(xiàn)值足夠高，冷酷策略可通過“永遠懲罰背叛”維持合作；

-選項B：δ較小（如δ=0.1）時，未來收益現(xiàn)值低，背叛收益更高，無法維持合作；

-選項C：TFT策略雖能維持合作，但冷酷策略在δ較大時更嚴格，且題目未要求“最可能”，僅問“更可能”，δ較大是核心條件；

-選項D：δ較小且TFT策略均無法維持合作。

綜上，正確答案為A。29、考慮如下兩人靜態(tài)博弈的支付矩陣（行玩家為A，列玩家為B，矩陣元素為（A的支付，B的支付））：

||左|右|

|-------|------|------|

|上|(1,3)|(2,2)|

|下|(3,1)|(4,0)|

問題：該博弈的純策略納什均衡是？

A.(上,左)

B.(上,右)

C.(下,左)

D.(下,右)

【答案】：C

解析：純策略納什均衡要求雙方策略均為對方最優(yōu)反應。選項A：A選上（支付1），若改下支付3>1，A偏離；選項B：B選右（支付2），若改左支付3>2，B偏離；選項C：A選下（3）改上得1<3，B選左（1）改右得0<1，雙方無偏離動機；選項D：B選右（0）改左得1>0，B偏離。故正確答案為C。30、在如下支付矩陣中，純策略納什均衡為：（參與者1策略：上/下；參與者2策略：左/右）

參與者2

\左右

參與者1

上(3,3)(1,4)

下(4,1)(2,2)

A.(上,左)

B.(上,右)

C.(下,左)

D.(下,右)

【答案】：D

解析：本題考察純策略納什均衡的判斷。納什均衡的定義是：給定對方策略，每個參與者都沒有動機單獨改變自己的策略。分析各選項：

-選項A：(上,左)中，參與者2若單獨改為右，支付從3增至4，有動機偏離，排除；

-選項B：(上,右)中，參與者1若單獨改為下，支付從3增至4，有動機偏離，排除；

-選項C：(下,左)中，參與者2若單獨改為右，支付從1增至2，有動機偏離，排除；

-選項D：(下,右)中，參與者1偏離下選上得1<2，參與者2偏離右選左得1<2，均無偏離動機，符合納什均衡。31、無限次重復囚徒困境中，雙方采用“觸發(fā)策略”（對方背叛則永遠背叛），合作成為子博弈完美均衡的貼現(xiàn)因子條件是？

A.δ≥1/2

B.δ≥1/3

C.δ≥1/(1+δ)

D.δ≥1/(1-δ)

【答案】：A

解析：本題考察重復博弈合作條件。設單次合作收益S=3，背叛收益T=5，雙方背叛收益P=1。合作現(xiàn)值=S/(1-δ)=3/(1-δ)，背叛現(xiàn)值=T+Pδ/(1-δ)=5+δ/(1-δ)。令合作現(xiàn)值>背叛現(xiàn)值：3/(1-δ)>5+δ/(1-δ)→3>5(1-δ)+δ→δ>1/2。因此δ≥1/2時合作可行，選項A正確。32、在序貫博弈中，求解子博弈完美納什均衡的關(guān)鍵方法是？

A.直接比較所有純策略組合的收益，選擇最大收益的組合

B.從最后行動的參與者開始，倒推每個子博弈的最優(yōu)反應

C.僅考慮第一個行動者的初始策略，忽略后續(xù)反應

D.假設所有后續(xù)參與者的威脅都是可信的，直接選初始最優(yōu)策略

【答案】：B

解析：本題考察序貫博弈的逆向歸納法。正確答案為B。B選項正確，逆向歸納法通過從最后一個行動的子博弈開始，依次倒推每個參與者的最優(yōu)反應，剔除不可信的威脅（如“威脅不合作”若不影響自身收益則不可信）。A選項錯誤，序貫博弈需考慮行動順序，不能直接比較所有策略組合；C選項錯誤，序貫博弈的關(guān)鍵是后續(xù)參與者的反應，需通過倒推確定；D選項錯誤，子博弈完美納什均衡的核心是剔除不可信威脅，因此不能假設威脅可信。33、在一個兩參與者的博弈中，參與者A和B的策略均為‘上’或‘下’，收益矩陣如下（單位：支付）：

||B上|B下|

|----------|-----|-----|

|A上|(3,3)|(1,4)|

|A下|(4,1)|(2,2)|

其中矩陣元素為（A的收益，B的收益）。請問該博弈的純策略納什均衡為？

A.（上，上）

B.（上，下）

C.（下，上）

D.（下，下）

【答案】：D

解析：分析：對參與者A，無論B選‘上’（收益3vs4）還是‘下’（收益1vs2），均最優(yōu)反應為‘下’；對參與者B，無論A選‘上’（收益3vs4）還是‘下’（收益1vs2），均最優(yōu)反應為‘下’。因此（下，下）是雙方的占優(yōu)策略均衡，也是唯一純策略納什均衡。選項A、B、C中，參與者均有動機偏離（如A選‘上’時B收益1<4，B選‘下’時A收益1<2），故錯誤。正確答案為D。34、標準囚徒困境博弈中，參與人（囚徒）的占優(yōu)策略是？支付矩陣（刑期：年）：A坦白B坦白時，A得8，B得8；A坦白B不坦白時，A得0，B得10；A不坦白B坦白時，A得10，B得0；A不坦白B不坦白時，A得1，B得1。

A.坦白

B.不坦白

C.取決于對方策略

D.無占優(yōu)策略

【答案】：A

解析：本題考察占優(yōu)策略的定義。占優(yōu)策略是無論對方選什么，自身策略收益均更高。對囚徒A：若B坦白，A坦白得8（>不坦白的10？修正：正確支付應為：A坦白B不坦白時A得0，B得10；A不坦白B坦白時A得10，B得0；均不坦白時A得1，B得1。此時A選坦白：B坦白得8（<10），不坦白得0（<10）？錯誤，正確占優(yōu)策略應為：A選坦白時，無論B選什么，收益均≥不坦白。正確矩陣：A坦白B坦白（-5,-5）；A坦白B不坦白（-1,-10）；A不坦白B坦白（-10,-1）；均不坦白（-1,-1）。此時A選坦白：-5>-10，-1>-1，故坦白是占優(yōu)策略。35、關(guān)于囚徒困境模型，下列說法正確的是？

A.每個囚徒都有“抵賴”作為占優(yōu)策略

B.（抵賴，抵賴）是該博弈的占優(yōu)策略均衡

C.（坦白，坦白）是該博弈的納什均衡，且是帕累托最優(yōu)

D.即使雙方都有合作意愿，（抵賴，抵賴）也難以維持為均衡

【答案】：D

解析：本題考察囚徒困境的核心結(jié)論。正確答案為D。解析：A錯誤，囚徒困境中“坦白”是占優(yōu)策略（無論對方是否坦白，坦白均為最優(yōu)選擇）；B錯誤，占優(yōu)策略均衡是（坦白，坦白），而非（抵賴，抵賴）；C錯誤，（坦白，坦白）是納什均衡，但（抵賴，抵賴）對雙方收益更高，因此（坦白，坦白）不是帕累托最優(yōu)；D正確，單次囚徒困境中，雙方因缺乏信任無法維持合作（抵賴，抵賴），最終因占優(yōu)策略選擇（坦白，坦白）。36、兩個廠商進行價格競爭，支付矩陣（利潤，單位：萬元）如下：

||廠商2低價|廠商2高價|

|----------|----------|----------|

|廠商1低價|(40,40)|(80,20)|

|廠商1高價|(20,80)|(50,50)|

該博弈的純策略納什均衡有幾個？

A.0個

B.1個

C.2個

D.3個

【答案】：C

解析：本題考察純策略納什均衡的判斷。納什均衡要求每個參與者在給定對方策略下，沒有動機單獨改變策略。對(40,40)：廠商1偏離到高價收益20<40，廠商2偏離到高價收益20<40，是均衡；對(50,50)：廠商1偏離到低價收益40<50，廠商2偏離到低價收益40<50，是均衡；(80,20)中廠商2偏離到低價收益40>20，(20,80)中廠商1偏離到低價收益80>20，均非均衡。因此有2個純策略納什均衡，選C。37、關(guān)于占優(yōu)策略均衡和納什均衡的關(guān)系，以下說法正確的是？

A.占優(yōu)策略均衡一定是納什均衡，納什均衡不一定是占優(yōu)策略均衡

B.納什均衡一定是占優(yōu)策略均衡，占優(yōu)策略均衡不一定是納什均衡

C.兩者完全等同

D.兩者完全不同

【答案】：A

解析：占優(yōu)策略是指無論對方采取何種策略，自身均有唯一最優(yōu)策略。占優(yōu)策略均衡中，每個參與人的策略都是占優(yōu)策略，因此給定對方策略后，自身策略最優(yōu)，滿足納什均衡定義。而納什均衡僅要求給定對方策略時自身策略最優(yōu)，不要求存在占優(yōu)策略（如‘性別戰(zhàn)’博弈的納什均衡）。因此A正確，B、C、D錯誤。38、猜硬幣游戲中，參與人1以p概率猜“正”、1-p猜“反”，參與人2以q概率猜“正”、1-q猜“反”，參與人1的期望收益為？

A.pq-(1-p)(1-q)

B.pq+(1-p)(1-q)

C.p(1-q)+(1-p)q

D.p(1-q)-(1-p)q

【答案】：C

解析：本題考察混合策略期望收益計算。猜硬幣中，參與人1贏的條件是雙方策略不同：猜“正”且對方猜“反”（p(1-q)）或猜“反”且對方猜“正”（(1-p)q），因此期望收益為1×[p(1-q)+(1-p)q]-1×[pq+(1-p)(1-q)]=2[p(1-q)+(1-p)q]-1。但題目問“期望收益”表達式，選項C是贏的概率（期望收益的簡化形式，當收益為±1時等價于贏的概率）。選項A、B是輸?shù)母怕逝c贏的概率組合，錯誤；選項D符號錯誤。39、兩個企業(yè)A和B需選擇定價策略（高/低），支付矩陣如下（單位：萬元）：當A選高、B選高時，A得5，B得5；A高B低時，A得3，B得6；A低B高時，A得6，B得3；A低B低時，A得2，B得2。該博弈的純策略納什均衡是？

A.(高,高)

B.(高,低)

C.(低,高)

D.(低,低)

【答案】：D

解析：本題考察純策略納什均衡的判斷。納什均衡要求給定對方策略，參與人無偏離動機。對選項A（高,高）：若A偏離選低，收益從5增至6，存在偏離動機，非均衡；選項B（高,低）：A偏離選低，收益從3增至6，存在偏離動機，非均衡；選項C（低,高）：A偏離選高，收益從6增至5？錯誤，A低時得6，選高得3，此處應為A偏離選高收益3<6，B偏離選低收益3<6？哦，修正：A低B高時，A得6，B得3。若A偏離選高，收益從6降至3（<6），無偏離動機；B偏離選低，收益從3降至2（<3），無偏離動機？之前矩陣可能有誤，正確邏輯：若（低,低）：A選低得2，偏離選高得3（>2），B同理。修正題目支付矩陣為：A低B低時各得4，此時均無偏離動機，故（低,低）為均衡。40、下列哪項是納什均衡的準確定義？

A.每個參與者都擁有嚴格占優(yōu)策略的均衡狀態(tài)

B.在給定其他參與者策略的情況下，每個參與者都沒有動機改變自己的策略

C.參與者的策略組合使得總收益最大的狀態(tài)

D.參與者的策略是相互獨立的最優(yōu)選擇

【答案】：B

解析：本題考察納什均衡的核心定義。正確答案為B，因為納什均衡的本質(zhì)是：在給定其他參與者策略的前提下，每個參與者都沒有動力改變自己當前的策略。A選項錯誤，納什均衡不一定要求存在嚴格占優(yōu)策略（如協(xié)調(diào)博弈中可能只有納什均衡而無占優(yōu)策略）；C選項錯誤，納什均衡關(guān)注個體最優(yōu)而非整體總收益最大（總收益最大可能是帕累托最優(yōu)，但未必是納什均衡）；D選項錯誤，納什均衡的核心是策略相互依賴（“給定對方策略”），而非獨立選擇。41、在完全信息動態(tài)博弈中，求解子博弈完美納什均衡的核心方法是？

A.重復剔除嚴格劣策略

B.逆向歸納法

C.混合策略法

D.劃線法

【答案】：B

解析：本題考察動態(tài)博弈的均衡求解方法。正確答案為B。解析：完全信息動態(tài)博弈存在“不可信威脅”問題，逆向歸納法通過從最后階段子博弈倒推，剔除不可信威脅，得到子博弈完美納什均衡。例如斯塔克伯格模型中，先分析追隨者最優(yōu)反應，再推導領導者選擇。A錯誤，重復剔除嚴格劣策略是靜態(tài)博弈方法；C錯誤，混合策略法用于無純策略納什均衡的場景；D錯誤，劃線法是靜態(tài)博弈納什均衡的標記方法。42、無限重復囚徒困境中，單次博弈支付為：合作(3,3)、單方背叛(0,5)、雙方背叛(1,1)。采用觸發(fā)策略維持合作的貼現(xiàn)因子δ需滿足？

A.δ≥0.5

B.δ≥0.6

C.δ≥0.8

D.δ≥1

【答案】：A

解析：本題考察重復博弈的合作條件。觸發(fā)策略下，合作現(xiàn)值V合作=3/(1-δ)，單次背叛后永遠背叛的現(xiàn)值V背叛=5+δ*1/(1-δ)。維持合作需V合作≥V背叛：3/(1-δ)≥5+δ/(1-δ)→3≥5(1-δ)+δ→4δ≥2→δ≥0.5。選項A正確，B、C、D均為充分條件，非必要條件。43、在序貫博弈中，求解子博弈完美納什均衡的核心方法是？

A.逆向歸納法

B.正向歸納法

C.混合策略法

D.納什均衡法

【答案】：A

解析：本題考察子博弈完美納什均衡的求解方法。序貫博弈中，子博弈完美納什均衡要求排除不可信的威脅或承諾，通過逆向歸納法從最后一個子博弈開始倒推，依次確定每個參與者的最優(yōu)策略（如蜈蚣博弈的最后一步倒推）。正向歸納法基于行為推斷信息，非核心方法；混合策略法用于策略不確定性，未考慮動態(tài)結(jié)構(gòu)；納什均衡法未排除不可信均衡（如囚徒困境的納什均衡）。44、猜拳游戲（石頭R/剪刀S/布P）：同出則平局（各得0.5分），不同則勝者得1分，敗者得0分。雙方同時選擇策略，是否存在占優(yōu)策略？

A.玩家1有占優(yōu)策略，玩家2無

B.玩家2有占優(yōu)策略，玩家1無

C.雙方均有占優(yōu)策略

D.雙方均無占優(yōu)策略

【答案】：D

解析：本題考察占優(yōu)策略定義（無論對方選什么，自身策略收益始終最高）。玩家1選R時，對方選R得0.5，S得1，P得0；選S時，對方選R得0，S得0.5，P得1；選P時，對方選R得1，S得0，P得0.5。可見玩家1的最優(yōu)策略依賴對方選擇，無固定占優(yōu)策略。同理玩家2也無占優(yōu)策略，選D。45、最后通牒博弈：玩家1提出分配方案(x,1-x)，玩家2可接受(得1-x)或拒絕(得0)。玩家1先行動，子博弈完美納什均衡結(jié)果是？

A.玩家1提(1,0)，玩家2接受

B.玩家1提(0.5,0.5)，玩家2接受

C.玩家1提(ε,1-ε)（ε→0+），玩家2接受

D.玩家1提(0,1)，玩家2接受

【答案】：C

解析：本題考察子博弈完美均衡（逆向歸納）。玩家2接受條件：1-x≥0→x≤1。玩家1為最大化自身收益，選擇最小x>0（如ε），玩家2因1-ε>0接受，選C。46、市場進入博弈中，在位者先行動選擇“默許”或“阻撓”，進入者后行動選擇“進入”或“不進入”。支付矩陣（在位者收益,進入者收益）：不進入時（20,0）；進入時默許（10,5）、阻撓（-10,-5）。該博弈的子博弈完美納什均衡路徑為：

A.在位者阻撓，進入者不進入

B.在位者阻撓，進入者進入

C.在位者默許，進入者不進入

D.在位者默許，進入者進入

【答案】：D

解析：本題考察子博弈完美納什均衡的逆向歸納法。進入者后行動：若在位者選“默許”，進入者收益5>0（不進入收益0），故選“進入”；若在位者選“阻撓”，進入者收益-5<0，故選“不進入”。在位者第一階段比較：選“默許”→進入者進入，收益10；選“阻撓”→進入者不進入，收益20？此處應為原題支付矩陣錯誤，正確應為“阻撓”收益<“默許”收益（如阻撓收益-10<默許10），故在位者選“默許”，進入者選“進入”，即路徑D。A、B中“阻撓”收益低于“默許”，C中進入者收益0<5，均不成立。47、猜硬幣博弈中，A選“正面”概率為p，B選“猜正面”概率為q，混合策略均衡時p=？

A.1/3

B.1/2

C.2/3

D.1

【答案】：B

解析：本題考察混合策略均衡計算。猜硬幣無純策略均衡，需混合策略平衡。

-A選正面的期望收益：q*0+(1-q)*1=1-q；選反面：q*1+(1-q)*0=q。

-混合策略要求A在兩策略間無差異：1-q=q→q=1/2。同理，B的p=1/2。

因此A選正面概率為1/2，正確答案為B。48、在無限次重復的囚徒困境博弈中，若雙方采用‘觸發(fā)策略’維持合作（始終選擇‘不坦白’），維持合作的必要條件是？

A.貼現(xiàn)因子足夠大

B.單次博弈收益小于無限次合作收益

C.雙方均有嚴格占優(yōu)策略

D.合作階段的收益嚴格大于背叛階段的收益

【答案】：A

解析：分析：無限次重復博弈中，觸發(fā)策略的合作可行性依賴于貼現(xiàn)因子δ（未來收益的現(xiàn)值）。合作總收益為-1/(1-δ)，背叛收益為0+(-5)/(1-δ)。需滿足-1/(1-δ)>0+(-5)/(1-δ)→δ>1/5（貼現(xiàn)因子足夠大）。選項B錯誤（單次收益本身小于無限次收益是必然的）；選項C錯誤（囚徒困境單次博弈中背叛是占優(yōu)策略，合作無占優(yōu)策略）；選項D錯誤（合作階段收益-1<背叛階段0）。正確答案為A。49、在斯塔克伯格雙寡頭模型（市場需求P=100-Q，廠商1先動，廠商2后動，成本均為0）中，子博弈完美納什均衡的產(chǎn)量組合為？

A.(q1=50,q2=25)

B.(q1=33,q2=33)

C.(q1=25,q2=50)

D.(q1=0,q2=0)

【答案】：A

解析：本題考察動態(tài)博弈中子博弈完美納什均衡（SPNE）。-廠商2（后動者）的反應函數(shù)：給定q1，利潤π2=q2*(100-q1-q2)，一階條件得q2=(100-q1)/2。-廠商1（先動者）的利潤π1=q1*(100-q1-q2)=q1*(100-q1-(100-q1)/2)=q1*(100-q1)/2，求導得q1=50。-代入反應函數(shù)得q2=(100-50)/2=25，故SPNE為（50,25）。-選項B為古諾同時行動均衡（q1=q2=100/3≈33.3），非序貫博弈結(jié)果；C混淆先動后動順序；D為無利潤的極端情況，錯誤。因此正確答案為A。50、在博弈論中，“占優(yōu)策略”的定義是？

A.無論其他參與者采取什么策略，該策略都是自身的最優(yōu)反應

B.存在一個策略組合，使得每個參與者都無法通過單獨改變策略而提高收益

C.參與者在觀察到對方策略后，選擇對該策略最優(yōu)的反應

D.參與者在重復博弈中逐漸穩(wěn)定下來的策略

【答案】：A

解析：本題考察占優(yōu)策略的定義。選項A正確，占優(yōu)策略是指無論對方采取何種策略，自身選擇該策略的收益都不低于其他策略，即該策略始終是最優(yōu)反應。選項B描述的是納什均衡的定義（至少存在一個策略組合，給定對方策略，自己無法改進），但納什均衡不一定要求是占優(yōu)策略均衡。選項C是“最優(yōu)反應策略”，即根據(jù)對方策略選擇最優(yōu)策略，這是動態(tài)博弈或給定對方策略時的行為，并非占優(yōu)策略。選項D是重復博弈中可能形成的策略（如合作策略），與占優(yōu)策略無關(guān)。51、兩個企業(yè)A和B進行價格競爭，策略均為“高價”或“低價”，支付矩陣（單位：萬元）如下表所示。請問該博弈的純策略納什均衡是（）？

||B高價|B低價|

|-------|-------|-------|

|A高價|(10,10)|(5,15)|

|A低價|(15,5)|(8,8)|

A.(高價,高價)

B.(高價,低價)

C.(低價,高價)

D.(低價,低價)

【答案】：D

解析：本題考察純策略納什均衡的定義。納什均衡要求給定對方策略，自身無法通過改變策略提高收益。

-選項A：(高價,高價)時，A若改為低價收益從10→15（提高），A會偏離，排除；

-選項B：(高價,低價)時，B若改為低價收益從5→8（提高），B會偏離，排除；

-選項C：(低價,高價)時，A若改為低價收益從5→8（提高），A會偏離，排除；

-選項D：(低價,低價)時，A改高價收益8→5（降低），B同理，雙方均無偏離動機，是純策略納什均衡。52、博弈論中，以下哪項不屬于博弈的基本構(gòu)成要素？

A.參與者（玩家）

B.策略空間

C.支付矩陣

D.均衡解

【答案】：D

解析：本題考察博弈的基本要素。選項D正確，均衡解是博弈的結(jié)果而非基本要素。博弈的基本要素包括：參與者（A）、策略空間（B）、信息集、支付函數(shù)（C支付矩陣是支付函數(shù)的表示形式）。53、求解動態(tài)博弈的子博弈完美納什均衡，最常用的方法是？

A.逆向歸納法

B.前向歸納法

C.納什均衡法

D.混合策略法

【答案】：A

解析：本題考察動態(tài)博弈解的求解方法。子博弈完美納什均衡要求排除不可信威脅，逆向歸納法從最后一個子博弈開始倒推，逐步剔除不可信策略，是動態(tài)博弈唯一的解概念（排除非子博弈完美的納什均衡）。B錯誤，前向歸納法是基于參與人信念的動態(tài)分析，非求解方法；C錯誤，納什均衡法是靜態(tài)博弈的解，未考慮動態(tài)順序；D錯誤，混合策略法與動態(tài)博弈結(jié)構(gòu)無關(guān)。54、在無限次重復的囚徒困境博弈中，參與者為實現(xiàn)合作（雙方均選擇沉默），最可能采用的策略是？

A.以牙還牙策略（Tit-for-Tat）

B.一次性背叛策略

C.隨機終止合作策略

D.固定選擇沉默策略

【答案】：A

解析：本題考察重復博弈的合作機制。無限次重復博弈中，“以牙還牙”策略（初始合作，對方背叛則永久背叛）能通過懲罰機制維持合作：若對方短期背叛（如選擇坦白），后續(xù)合作收益將因懲罰大幅降低，從而約束參與者偏離合作。B選項“一次性背叛”會破壞合作；C選項“隨機終止”無法形成穩(wěn)定的合作預期；D選項“固定沉默”在對方偏離時無約束，無法維持合作。因此正確答案為A。55、動態(tài)博弈中，子博弈完美納什均衡的核心思想是：

A.每個階段都選擇該階段的納什均衡策略

B.通過剔除不可信的威脅，確保均衡路徑上的策略在每個子博弈中均為納什均衡

C.參與者通過輪流出價與接受達成合作的均衡

D.重復剔除嚴格劣策略后得到的唯一均衡

【答案】：B

解析：本題考察子博弈完美納什均衡的核心。選項A錯誤，動態(tài)博弈中階段納什均衡可能包含不可信威脅，需剔除；選項B正確，子博弈完美均衡通過逆向歸納法剔除不可信威脅，確保所有子博弈均為納什均衡；選項C錯誤，這是討價還價模型（如魯賓斯坦模型）的內(nèi)容，與子博弈完美均衡無關(guān)；選項D錯誤，重復剔除嚴格劣策略是靜態(tài)博弈的分析方法，動態(tài)博弈用逆向歸納法。56、在博弈論中，關(guān)于占優(yōu)策略均衡的描述，正確的是？

A.占優(yōu)策略均衡中，每個參與者都有且僅有一個占優(yōu)策略

B.占優(yōu)策略均衡一定是納什均衡

C.占優(yōu)策略均衡僅在完全信息動態(tài)博弈中存在

D.占優(yōu)策略是指“參與者在重復博弈中才會考慮的策略”

【答案】：B

解析：本題考察占優(yōu)策略均衡的性質(zhì)。正確答案為B。B選項正確，占優(yōu)策略均衡中每個參與者的策略是對其他參與者任何策略的最優(yōu)反應，滿足納什均衡的核心條件（給定對方策略，自身策略最優(yōu)）。A選項錯誤，占優(yōu)策略可能唯一，但某些對稱博弈中可能存在多個占優(yōu)策略組合；C選項錯誤，占優(yōu)策略均衡可存在于單次（靜態(tài)）或重復（動態(tài)）博弈，不局限于完全信息；D選項錯誤，占優(yōu)策略的定義與博弈是否重復無關(guān)，僅取決于策略的絕對最優(yōu)性。57、序貫博弈中，企業(yè)1先決定進入（E）或不進入（N）：若N，企業(yè)1收益0，企業(yè)2收益10；若E，企業(yè)2決定斗爭（F）或妥協(xié)（C），收益（-5,5）或（5,5）。子博弈完美均衡為？

A.企業(yè)1不進入，收益0

B.企業(yè)1進入，斗爭，收益-5

C.企業(yè)1進入，妥協(xié)，收益5

D.企業(yè)1進入，斗爭，收益5

【答案】：C

解析：本題考察子博弈完美均衡（逆向歸納法）。企業(yè)2后行動，若E，斗爭（5）=妥協(xié)（5），無嚴格偏好。企業(yè)1先行動：進入收益5>0（不進入），因此企業(yè)1選E，企業(yè)2選C（或F，收益相同），均衡為（E,C），收益（5,5）。58、在無限次重復的囚徒困境博弈中，合作行為（雙方均不坦白）是否可能成為均衡結(jié)果？

A.不可能，因為單次博弈的背叛收益更高

B.可能，當參與者足夠有耐心（貼現(xiàn)因子足夠大）時，通過觸發(fā)策略實現(xiàn)

C.只有當參與者完全理性時才可能

D.只有當參與者完全不理性時才可能

【答案】：B

解析：本題考察重復博弈中的合作可能性。正確答案為B，無限次重復博弈中，若貼現(xiàn)因子δ足夠大（參與者足夠有耐心），觸發(fā)策略（如“先合作，一旦對方背叛則永遠不合作”）可使合作收益超過短期背叛收益（單次背叛得-1，合作得-2，長期合作總收益-2/(1-δ)>-1+δ*(-2)/(1-δ)當δ>1/2時成立）。A選項忽略重復博弈的長期收益；C、D錯誤，合作可能性與理性程度無關(guān)，關(guān)鍵在于耐心。59、在上述囚徒困境博弈中，參與者A的占優(yōu)策略是？

A.坦白

B.不坦白

C.混合策略

D.不存在占優(yōu)策略

【答案】：A

解析：本題考察占優(yōu)策略的定義。占優(yōu)策略指無論對方采取何種策略，自身選擇該策略的收益均嚴格更高。對A而言：當B選擇“坦白”，A坦白（-5）優(yōu)于不坦白（-10）；當B選擇“不坦白”，A坦白（0）優(yōu)于不坦白（-1）。因此，“坦白”是占優(yōu)策略，選項A正確。選項B“不坦白”在兩種情況下收益均低于“坦白”，錯誤；選項C混合策略是隨機選擇純策略，本題明確問占優(yōu)策略（純策略），錯誤；選項D錯誤。60、求解動態(tài)博弈的子博弈完美納什均衡，通常采用的方法是？

A.逆向歸納法

B.重復剔除嚴格劣策略

C.混合策略法

D.帕累托最優(yōu)法

【答案】：A

解析：本題考察子博弈完美納什均衡的求解方法。正確答案為A，逆向歸納法從最后一個子博弈開始倒推，排除不可信威脅（如“威脅報復但報復不可信”的策略），是動態(tài)博弈的核心方法。B選項重復剔除劣策略用于靜態(tài)博弈；C選項混合策略法用于純策略均衡不存在的場景；D選項帕累托最優(yōu)法是結(jié)果優(yōu)化方法，非均衡求解。61、猜硬幣博弈中，參與人1（先手）和參與人2（后手）的策略均為“正面（H）”或“反面（T）”，支付規(guī)則：若猜中（1對1），猜中方得1，猜錯方得-1。以下關(guān)于混合策略納什均衡的描述正確的是：

A.參與人1的混合策略為（0.5,0.5），參與人2的混合策略為（0.5,0.5）

B.參與人1的混合策略為（1,0），參與人2的混合策略為（1,0）

C.混合策略均衡不存在純策略均衡

D.混合策略均衡中參與人永遠不會選擇純策略

【答案】：A

解析：本題考察混合策略納什均衡的計算。猜硬幣博弈中純策略均衡不存在（如（H,H）時參與人2會偏離），需用混合策略。設參與人1選H的概率為p，T的概率為1-p；參與人2選H的概率為q，T的概率為1-q。參與人1的期望收益：q*(-1)+(1-q)*1=1-2q。為使參與人1無偏離動機（混合策略），需1-2q=0?q=0.5；同理參與人2的期望收益1-2p=0?p=0.5。因此雙方混合策略均為（0.5,0.5），選項A正確。選項B是純策略（1,0），參與人1會偏離；選項C錯誤（混合策略存在但純策略不存在）；選項D錯誤（混合策略中參與人以正概率選擇純策略）。62、在博弈論中，關(guān)于占優(yōu)策略均衡與納什均衡的關(guān)系，以下描述正確的是？

A.占優(yōu)策略均衡一定是納什均衡，納什均衡一定是占優(yōu)策略均衡

B.占優(yōu)策略均衡一定是納什均衡，納什均衡不一定是占優(yōu)策略均衡

C.占優(yōu)策略均衡不一定是納什均衡，納什均衡一定是占優(yōu)策略均衡

D.兩者沒有必然聯(lián)系

【答案】：B

解析：本題考察占優(yōu)策略均衡與納什均衡的定義及關(guān)系。占優(yōu)策略均衡是指每個參與者無論對方采取何種策略，自身策略都是最優(yōu)的（即嚴格占優(yōu)）。由于占優(yōu)策略在任何對方策略下都是最優(yōu)反應，因此占優(yōu)策略均衡必然滿足納什均衡的定義（給定對方策略，自身策略最優(yōu)）。而納什均衡僅要求“給定對方策略，自身策略最優(yōu)”，但對方策略未必是對方的占優(yōu)策略。例如“智豬博弈”中，小豬的“等待”是占優(yōu)策略，大豬的“按”不是占優(yōu)策略，但（按，等待）是納什均衡。故選項A錯誤（納什均衡不一定是占優(yōu)策略均衡），選項C錯誤（占優(yōu)策略均衡是納什均衡的特例），選項D錯誤（存在必然聯(lián)系）。正確答案為B。63、在不完全信息靜態(tài)博弈中，參與人i的‘類型’是指？

A.參與人i的行動集合

B.參與人i的收益函數(shù)

C.參與人i已知但其他參與人可能不知道的私人信息

D.參與人i的策略集合

【答案】：C

解析：本題考察不完全信息博弈中‘類型’的定義。類型是參與人擁有的私人信息（如成本、偏好等），且這些信息可能不為其他參與人完全知曉。選項A和D錯誤，行動集合和策略集合是博弈的基本結(jié)構(gòu)，與‘類型’無關(guān)；選項B錯誤，收益函數(shù)可能依賴類型，但‘類型’本身是私人信息，而非收益函數(shù)本身。64、在經(jīng)典的囚徒困境博弈中，兩個參與者的策略均為“坦白”或“不坦白”，支付矩陣如下（括號內(nèi)為各自的收益，數(shù)值越小表示處罰越重）：當參與者1坦白、參與者2坦白時，收益為(-5,-5)；參與者1坦白、參與者2不坦白時，收益為(-1,-10)；參與者1不坦白、參與者2坦白時，收益為(-10,-1)；參與者1不坦白、參與者2不坦白時，收益為(-3,-3)。以下哪項是該博弈的純策略納什均衡？

A.(坦白,坦白)

B.(坦白,不坦白)

C.(不坦白,坦白)

D.(不坦白,不坦白)

【答案】：A

解析：本題考察純策略納什均衡的判斷。在囚徒困境中，每個參與者的“坦白”策略都是占優(yōu)策略：無論對方選擇“坦白”還是“不坦白”，“坦白”的收益均更高（-5>-10，-1>-3）。因此，雙方均會選擇“坦白”，形成純策略納什均衡。選項B、C、D均不滿足納什均衡條件：若一方偏離（如B選“不坦白”），另一方將通過“坦白”獲得更低收益，從而偏離動機被觸發(fā)。65、在序貫博弈（如斯塔克伯格模型）中，追隨者（廠商2）的最優(yōu)反應函數(shù)是基于什么原則推導的？

A.最大化自身總收益

B.最大化自身當前收益

C.最小化對手收益

D.最大化對手當前收益

【答案】：B

解析：本題考察子博弈完美納什均衡的逆向歸納法。序貫博弈中，追隨者（廠商2）作為后行動者，需在給定先行者（廠商1）的策略下，通過最大化自身當前收益來決定行動。-斯塔克伯格模型中，廠商2觀察到廠商1的產(chǎn)量q1后，根據(jù)需求P=10-Q，邊際成本0，其利潤π2=q2(10-q1-q2)。通過一階條件dπ2/dq2=0，解得q2=(10-q1)/2，即最大化自身當前收益的反應函數(shù)。-選項A錯誤，因總收益需考慮貼現(xiàn)或后續(xù)階段，而序貫博弈中追隨者僅關(guān)注當前階段收益；選項C、D與利潤最大化目標矛盾。66、考慮如下博弈，參與人1和參與人2的策略矩陣如下（數(shù)值為（參與人1收益，參與人2收益））：

參與人2

左右

參與人1上(3,2)(1,3)

下(2,1)(4,4)

以下說法正確的是？

A.參與人1有占優(yōu)策略“上”，參與人2有占優(yōu)策略“右”，且存在占優(yōu)策略均衡（上，右）

B.參與人1沒有占優(yōu)策略，參與人2有占優(yōu)策略“右”，且存在唯一納什均衡（下，右）

C.參與人1有占優(yōu)策略“下”，參與人2沒有占優(yōu)策略，且存在兩個純策略納什均衡

D.參與人1和參與人2均無占優(yōu)策略，但存在唯一納什均衡（上，左）

【答案】：B

解析：本題考察占優(yōu)策略與納什均衡的概念。分析參與人1的策略：若參與人2選左，參與人1選上（3>2）；若參與人2選右，參與人1選下（4>1），因此參與人1無占優(yōu)策略。參與人2的策略：無論參與人1選上還是下，選右的收益（3或4）均大于選左（2或1），故參與人2的占優(yōu)策略是“右”。納什均衡需滿足雙方策略給定對方策略時均無偏離動機：（上，左）中參與人2會偏離右；（下，左）中參與人1會偏離上；（上，右）中參與人1會偏離下；僅（下，右）滿足雙方無偏離動機，故唯一納什均衡為（下，右）。A錯誤，因參與人1無占優(yōu)策略；C錯誤，參與人1無占優(yōu)策略且僅1個納什均衡；D錯誤，唯一納什均衡非（上，左）。67、在博弈論中，“占優(yōu)策略”指的是：

A.無論其他參與者采取何種策略，某一參與者的最優(yōu)策略均為固定策略

B.參與者在給定對方策略下選擇的最優(yōu)策略

C.使得所有參與者總收益最大的策略組合

D.參與者以一定概率隨機選擇不同純策略的策略

【答案】：A

解析：本題考察占優(yōu)策略的定義。占優(yōu)策略的核心特征是“無論對方如何行動，自身策略均最優(yōu)”，因此A正確。B選項描述的是“納什均衡策略”（給定對方策略下的最優(yōu)反應）；C選項是“帕累托最優(yōu)策略”（不存在更優(yōu)的策略組合）；D選項是“混合策略”（隨機選擇純策略的策略）。68、在標準的囚徒困境博弈中，參與人（囚徒）的占優(yōu)策略是？

A.只有坦白

B.只有不坦白

C.有時坦白有時不坦白

D.以上都不是

【答案】：A

解析：本題考察占優(yōu)策略均衡。囚徒困境中，無論對方是否坦白，每個囚徒坦白的收益均嚴格高于不坦白（例如：對方坦白時，坦白得-5，不坦白得-10；對方不坦白時，坦白得0，不坦白得-1），因此“坦白”是嚴格占優(yōu)策略，答案選A。69、在完全信息靜態(tài)博弈中，以下哪項是納什均衡的嚴格定義？

A.每個參與者的策略都是對其他參與者策略的最優(yōu)反應

B.存在一個策略組合，使得每個參與者都有嚴格占優(yōu)策略

C.通過重復剔除嚴格劣勢策略后得到的唯一策略組合

D.參與者通過比較自身收益與對手收益的差值決定策略

【答案】：A

解析：本題考察納什均衡的定義。納什均衡的核心是“給定其他參與者策略不變，每個參與者的策略都是自身的最優(yōu)反應”，即A選項正確。B選項錯誤，占優(yōu)策略均衡是納什均衡的特例，納什均衡不要求所有參與者都有嚴格占優(yōu)策略；C選項錯誤，重復剔除嚴格劣勢策略是求解占優(yōu)策略均衡的方法，而非納什均衡的定義；D選項描述不符合納什均衡的核心邏輯。70、在囚徒困境博弈中，兩個囚徒A和B均有“坦白”或“沉默”策略，支付矩陣為：若均沉默，支付(-1,-1)；A沉默B坦白，支付(-3,0)；A坦白B沉默，支付(0,-3)；均坦白，支付(-2,-2)。以下關(guān)于占優(yōu)策略的描述正確的是？

A.存在占優(yōu)策略，雙方均選擇沉默

B.存在占優(yōu)策略，雙方均選擇坦白

C.存在占優(yōu)策略，A沉默、B坦白

D.不存在占優(yōu)策略

【答案】：B

解析：本題考察占優(yōu)策略的定義。占優(yōu)策略是指無論對方選擇何種策略，自身選擇該策略的收益均更高。對A而言：若B沉默，A坦白收益(0)>沉默(-1)；若B坦白，A坦白收益(-2)>沉默(-3)，故A的占優(yōu)策略是坦白。同理，B的占優(yōu)策略也是坦白。因此雙方占優(yōu)策略組合為(坦白,坦白)，對應選項B。A錯誤，因為沉默在對方坦白時收益更低；C錯誤，因雙方均無單方面占優(yōu)策略；D錯誤，存在明確占優(yōu)策略。71、在動態(tài)博弈中，‘子博弈完美納什均衡’的核心思想是：

A.排除不可信的威脅或承諾，只考慮合理的后續(xù)行動

B.要求每個參與者在每個信息集中都有最優(yōu)反應

C.所有參與者在初始階段就達成合作協(xié)議

D.只考慮純策略均衡而排除混合策略

【答案】：A

解析：本題考察子博弈完美納什均衡的核心思想。子博弈完美納什均衡通過逆向歸納法，從最后一個子博弈開始倒推，剔除不可信的威脅或承諾（如‘如果對方不合作，我就懲罰你’但懲罰對自己不利的威脅），只保留合理的策略路徑，因此選項A正確。選項B錯誤，‘每個信息集有最優(yōu)反應’是納什均衡的基本要求，并非子博弈完美的核心；選項C錯誤，合作協(xié)議是結(jié)果而非均衡定義；選項D錯誤，子博弈完美與策略類型（純/混合）無關(guān)。72、下列博弈中，一定存在混合策略納什均衡但不存在純策略納什均衡的是？

A.兩人猜硬幣博弈（參與者1選正/反，參與者2猜正/反，猜中者贏1元）

B.囚徒困境博弈（單次，雙方可選坦白/不坦白）

C.斗雞博弈（雙方可選“強硬”/“退讓”，強硬對強硬則同歸于盡，強硬對退讓則一方贏）

D.重復博弈（無限次，每次博弈為囚徒困境）

【答案】：A

解析：本題考察混合策略納什均衡的存在場景。正確答案為A。A選項正確，猜硬幣博弈中純策略納什均衡不存在（若參與者1選正，參與者2會猜正，參與者1改選反；反之亦然），但存在混合策略均衡：雙方均以50%概率選擇正/反，此時無法通過改變純策略提升收益。B選項錯誤，囚徒困境存在純策略納什均衡（坦白，坦白）；C選項錯誤，斗雞博弈存在純策略納什均衡（強硬，退讓）和（退讓，強硬）；D選項錯誤，重復博弈的均衡取決于貼現(xiàn)因子和重復次數(shù)，不一定是混合策略。73、下列關(guān)于納什均衡的說法，正確的是？

A.每個參與人都有一個占優(yōu)策略

B.給定其他參與人的策略，每個參與人都無法通過改變自己的策略來提高收益

C.參與人通過隨機選擇策略達到的均衡

D.參與人同時行動時才會出現(xiàn)的均衡

【答案】：B

解析：本題考察納什均衡的定義。納什均衡的核心特征是：在給定其他參與人策略的情況下，每個參與人都沒有動機去改變自己的策略以提高收益。選項A錯誤，因為納什均衡不要求參與人有占優(yōu)策略（占優(yōu)策略均衡是納什均衡的特殊情況）；選項C錯誤，納什均衡可以是純策略均衡（確定性策略），混合策略均衡才涉及隨機選擇；選項D錯誤，納什均衡不僅存在于同時行動的靜態(tài)博弈中，也存在于動態(tài)博弈的子博弈完美均衡中。74、在無限次重復的囚徒困境博弈中，若貼現(xiàn)因子δ足夠大，以下哪種策略能夠?qū)崿F(xiàn)合作均衡？

A.觸發(fā)策略（冷酷策略）

B.隨機策略

C.混合策略

D.以上均不能

【答案】：A

解析：本題考察重復博弈的合作機制。無限次重復博弈中，貼現(xiàn)因子δ足夠大時，參與者可通過觸發(fā)策略實現(xiàn)合作：

-觸發(fā)策略核心：若對方合作則持續(xù)合作，若對方背叛則永遠回到一次性博弈的納什均衡（觸發(fā)懲罰）。

-選項B隨機策略無法保證合作持續(xù)性；C混合策略是針對純策略無法均衡的情況，與合作無關(guān)；D錯誤。因此正確答案A。75、下列關(guān)于囚徒困境的說法，錯誤的是？

A.囚徒困境的納什均衡是（坦白，坦白），雙方收益為（-5,-5）

B.囚徒困境中存在帕累托最優(yōu)的合作策略（都不坦白，收益-1,-1）

C.囚徒困境的核心是個人理性導致集體非理性

D.囚徒困境無法通過任何方式實現(xiàn)合作，只能維持單次博弈均衡

【答案】：D

解析：本題考察囚徒困境的核心特征。正確答案為D。D選項錯誤，囚徒困境在無限次重復博弈中可通過“觸發(fā)策略”（如一方違約則永遠回到納什均衡）實現(xiàn)合作，因此并非“無法通過任何方式合作”。A選項正確，囚徒困境中雙方坦白是占優(yōu)策略，形成納什均衡（-5,-5）；B選項正確，（-1,-1）比（-5,-5）收益更高，是帕累托最優(yōu)；C選項正確，個人理性選擇（坦白）導致集體收益低于合作（都不坦白），即集體非理性。76、下列關(guān)于純策略納什均衡的表述，正確的是？

A.每個參與人都有嚴格占優(yōu)策略的策略組合

B.在該策略組合中，任一參與人單獨改變策略都不會提高自身收益

C.該策略組合是帕累托最優(yōu)的

D.該策略組合中，參與人必須同時行動且無法觀察到對方策略

【答案】：B

解析：本題考察純策略納什均衡的定義。純策略納什均衡是指在給定其他參與人策略的情況下，每個參與人都沒有動機單獨改變自己的策略。選項A錯誤，因為納什均衡不要求參與人有占優(yōu)策略（占優(yōu)策略均衡是納什均衡的特殊情況）；選項C錯誤，納什均衡不一定是帕累托最優(yōu)（如囚徒困境中的（坦白，坦白）是納什均衡但非帕累托最優(yōu)）；選項D錯誤，納什均衡不限制參與人行動順序（動態(tài)博弈也存在納什均衡，如子博弈完美納什均衡）。77、在無限次重復的囚徒困境博弈中，若雙方采用“觸發(fā)策略”（即：初始合作，一旦對方背叛則永遠轉(zhuǎn)為背叛），以下哪項結(jié)論正確？

A.雙方無法維持合作，因為單次背叛的收益更高

B.若貼現(xiàn)因子足夠大（未來收益足夠重要），雙方可以維持合作

C.只有當雙方均為風險中性時才能維持合作

D.無論貼現(xiàn)因子如何，合作都無法維持

【答案】：B

解析：本題考察無限次重復博弈的合作可能性。無限次重復博弈中，觸發(fā)策略能否維持合作的關(guān)鍵在于貼現(xiàn)因子δ（未來收益的折現(xiàn)率）：若δ足夠大（未來收益的現(xiàn)值超過單次背叛的額外收益），則合作的長期收益（δ*合作收益）會超過背叛的短期收益（單次背叛收益+未來懲罰收益），因此B正確。A錯誤，忽略了未來懲罰的威脅；C錯誤，風險中性不是必要條件（即使風險偏好存在，只要δ足夠大，合作仍可維持）；D錯誤，無限次重復博弈在δ足夠大時可以通過觸發(fā)策略維持合作。78、在博弈論中，“參與者同時行動且不知道對方當前策略”的博弈類型屬于？

A.靜態(tài)博弈

B.動態(tài)博弈

C.合作博弈

D.重復博弈

【答案】：A

解析：本題考察博弈類型的區(qū)分。靜態(tài)博弈的核心特征是參與者“同時行動”，且信息對稱（無先后順序）；動態(tài)博弈中參與者有行動順序（后行動者可觀察先行動者策略）；合作博弈強調(diào)參與者通過合作達成共同收益；重復博弈是同一博弈多次重復進行。因此“同時行動”的博弈屬于靜態(tài)博弈，正確答案為A。79、在經(jīng)典的‘囚徒困境’博弈中，若兩個參與者進行單次完全信息靜態(tài)博弈，其納什均衡的結(jié)果是：

A.兩人都沉默

B.一人沉默一人坦白

C.兩人都坦白

D.以上都不是

【答案】：C

解析：本題考察囚徒困境的納什均衡結(jié)果。囚徒困境中，每個囚徒的占優(yōu)策略均為‘坦白’（無論對方是否坦白，坦白的刑期均更短），因此單次博弈的納什均衡是雙方均選擇‘坦白’，即選項C。選項A是帕累托最優(yōu)結(jié)果（刑期總和最?。?，但非均衡；選項B不穩(wěn)定（若一方坦白，另一方會有動機也坦白）；選項D錯誤。80、無限次重復囚徒困境中，參與人通過觸發(fā)策略實現(xiàn)合作的核心條件是？

A.貼現(xiàn)因子δ足夠大，未來收益現(xiàn)值超過背叛短期收益

B.貼現(xiàn)因子δ足夠小，未來收益現(xiàn)值低于背叛短期收益

C.貼現(xiàn)因子δ=1（不考慮貼現(xiàn)）

D.貼現(xiàn)因子δ=0（僅關(guān)注當前收益）

【答案】：A

解析：本題考察重復博弈中的合作條件。觸發(fā)策略下，合作的收益現(xiàn)值需大于背叛的收益現(xiàn)值。設單次合作收益為-1，單次背叛收益為0，未來合作損失為-4（無限次背叛后各得-5）。合作現(xiàn)值：-1/(1-δ)；背叛現(xiàn)值：0-5δ/(1-δ)。當δ>1/5時，合作優(yōu)于背叛，即貼現(xiàn)因子足夠大（未來收益權(quán)重高）。選項B錯誤，因δ小則未來收益不重要，傾向背叛；選項C、D是極端情況，非普遍條件。81、關(guān)于混合策略納什均衡，以下描述正確的是：

A.混合策略納什均衡中，每個參與者以一定概率隨機選擇純策略，且對方無法通過改變純策略提高期望收益

B.混合

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2026年大學博弈論期末考試200道及答案（易錯題）

文檔簡介

溫馨提示

最新文檔

評論

2026年大學博弈論期末考試200道及答案（易錯題）

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔