版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2026年大學(xué)博弈論期末考試200道第一部分單選題(200題)1、以下哪項(xiàng)是純策略納什均衡的正確定義?
A.每個(gè)參與者在給定對(duì)方策略下,都無法通過改變自身策略提高收益
B.參與者同時(shí)行動(dòng)且沒有占優(yōu)策略時(shí)的均衡狀態(tài)
C.所有參與者都存在嚴(yán)格占優(yōu)策略的均衡組合
D.參與者通過混合策略選擇達(dá)到的穩(wěn)定狀態(tài)
【答案】:A
解析:本題考察純策略納什均衡的核心定義。純策略納什均衡的關(guān)鍵特征是:在給定其他參與者策略的情況下,每個(gè)參與者的當(dāng)前策略都是自身最優(yōu)選擇,即單方面改變策略無法提高收益。選項(xiàng)B錯(cuò)誤,因?yàn)椤办o態(tài)博弈”與“是否存在占優(yōu)策略”無關(guān),且靜態(tài)博弈也可能存在占優(yōu)策略;選項(xiàng)C錯(cuò)誤,純策略納什均衡可存在于無占優(yōu)策略的博弈(如協(xié)調(diào)博弈);選項(xiàng)D錯(cuò)誤,混合策略納什均衡是通過概率分布選擇,與純策略定義無關(guān)。2、以下關(guān)于貝葉斯納什均衡的描述,正確的是?
A.參與者在完全信息下進(jìn)行博弈
B.均衡中參與者必須知道對(duì)方的所有信息
C.參與者存在私人信息時(shí)的不完全信息均衡
D.均衡結(jié)果必然是帕累托最優(yōu)
【答案】:C
解析:本題考察貝葉斯納什均衡的定義。貝葉斯納什均衡是不完全信息博弈的均衡概念:
-A錯(cuò)誤:完全信息博弈無需貝葉斯均衡;
-B錯(cuò)誤:參與者信息不對(duì)稱(存在私人信息);
-C正確:參與者擁有私人信息(如自身類型),通過信念更新形成均衡;
-D錯(cuò)誤:均衡可能是納什均衡而非帕累托最優(yōu)(如囚徒困境)。因此選C。3、在無限重復(fù)的囚徒困境博弈中,參與者采用“以牙還牙”策略的核心目的是?
A.實(shí)現(xiàn)合作均衡(雙方都不坦白)
B.盡快結(jié)束博弈以獲取短期利益
C.避免被對(duì)方欺騙而遭受損失
D.最大化單次博弈的收益
【答案】:A
解析:本題考察重復(fù)博弈的合作機(jī)制?!耙匝肋€牙”策略通過“合作-合作,背叛-背叛”的觸發(fā)機(jī)制,誘導(dǎo)對(duì)方維持合作(A選項(xiàng)正確)。B選項(xiàng)“盡快結(jié)束博弈”是單次博弈的行為,與重復(fù)博弈追求長期收益矛盾;C選項(xiàng)“避免被欺騙”是策略的具體形式,而非核心目的;D選項(xiàng)“單次博弈收益最大化”是囚徒困境單次納什均衡的結(jié)果,與重復(fù)博弈的合作目標(biāo)相悖。4、無限次重復(fù)的囚徒困境博弈中,單次博弈支付(不坦白,不坦白)=(3,3),(坦白,不坦白)=(5,1),(不坦白,坦白)=(1,5),(坦白,坦白)=(0,0)。維持合作(雙方均不坦白)的貼現(xiàn)因子δ需滿足?若δ=0.6,是否可以維持合作?
A.可以,因δ>1/2
B.可以,因δ<1/2
C.不可以,因δ>1/2
D.不可以,因δ<1/2
【答案】:A
解析:本題考察重復(fù)博弈合作條件。無限次重復(fù)合作條件為δ≥(T-R)/(T-S),其中T=5(單次背叛收益),R=3(合作收益),S=1(被背叛收益),代入得δ≥(5-3)/(5-1)=0.5。當(dāng)前δ=0.6>0.5,滿足條件,合作可維持。5、在經(jīng)典囚徒困境博弈中,關(guān)于占優(yōu)策略的描述正確的是?(支付矩陣:抵賴-1,1,坦白0,-10;抵賴-10,0,坦白-5,-5)
A.參與人有唯一占優(yōu)策略(坦白)
B.參與人有多個(gè)占優(yōu)策略(抵賴或坦白)
C.參與人無占優(yōu)策略
D.參與人無占優(yōu)策略但存在占優(yōu)策略均衡
【答案】:A
解析:本題考察占優(yōu)策略的定義。占優(yōu)策略是無論對(duì)方選擇何種策略,自身最優(yōu)策略不變。對(duì)于囚徒困境:若參與人B選擇抵賴,A坦白收益0>抵賴-1;若B選擇坦白,A坦白收益-5>抵賴-10。因此A的占優(yōu)策略是坦白,同理B的占優(yōu)策略也是坦白,且占優(yōu)策略唯一。選項(xiàng)B錯(cuò)誤,因僅存在一個(gè)占優(yōu)策略;選項(xiàng)C錯(cuò)誤,因存在占優(yōu)策略;選項(xiàng)D錯(cuò)誤,因占優(yōu)策略本身構(gòu)成占優(yōu)策略均衡。6、在猜硬幣游戲中,參與者A和B的策略均為“正面”或“反面”,規(guī)則為:A猜正面,B猜反面時(shí)A勝;A猜反面,B猜正面時(shí)B勝;其他情況平局。該博弈的混合策略納什均衡中,A的最優(yōu)混合概率是?
A.0.25
B.0.5
C.0.75
D.1.0
【答案】:B
解析:本題考察混合策略納什均衡。猜硬幣游戲是典型零和博弈,無純策略納什均衡,需混合策略。設(shè)A以p概率猜正面,1-p猜反面;B以q概率猜正面,1-q猜反面。A的期望收益為:p(1-q)-(1-p)q=p-q。為使B對(duì)猜正面/反面無差異,A需讓B的期望收益相等:B猜正面的收益為-p+(1-q)(1)=1-p-q;B猜反面的收益為p(1)+(1-p)(0)=p。令兩者相等:1-p-q=p→q=1-2p。同理,B的最優(yōu)混合概率q=1-2p,A的期望收益需最大化對(duì)p的導(dǎo)數(shù),解得p=0.5(因零和博弈對(duì)稱,雙方最優(yōu)混合概率均為0.5),正確答案為B。7、在無限次重復(fù)博弈中,關(guān)于合作維持的說法,正確的是?
A.只要貼現(xiàn)因子δ足夠大(δ接近1),合作策略就能維持
B.貼現(xiàn)因子越大,越難維持合作
C.無限次重復(fù)博弈中,合作只能通過觸發(fā)策略實(shí)現(xiàn)
D.有限次重復(fù)博弈與無限次重復(fù)博弈的合作維持條件相同
【答案】:A
解析:本題考察無限次重復(fù)博弈的合作機(jī)制。A選項(xiàng)正確,無限次重復(fù)博弈中,合作能否維持取決于未來收益的現(xiàn)值。當(dāng)貼現(xiàn)因子δ足夠大時(shí),未來背叛的短期收益與長期合作收益的現(xiàn)值之比小于1,參與者會(huì)選擇合作。B錯(cuò)誤,貼現(xiàn)因子越大,未來收益的現(xiàn)值越高,越容易維持合作。C錯(cuò)誤,觸發(fā)策略是實(shí)現(xiàn)合作的方法之一,但非唯一(如“針鋒相對(duì)”“冷酷策略”等)。D錯(cuò)誤,有限次重復(fù)博弈通過逆向歸納法會(huì)導(dǎo)致“最后一期背叛”,而無限次博弈無“最后一期”,因此合作條件不同。8、在以下兩人博弈的支付矩陣中(括號(hào)內(nèi)為參與者A、B的收益),哪一策略組合是納什均衡?參與者A的策略:左(L)、右(R);參與者B的策略:上(U)、下(D)。支付矩陣為:
當(dāng)A選L,B選U:(1,1);B選D:(3,0)
當(dāng)A選R,B選U:(0,3);B選D:(2,2)
A.(L,U)
B.(L,D)
C.(R,U)
D.(R,D)
【答案】:B
解析:本題考察納什均衡的基本判斷。納什均衡的定義是:給定對(duì)方策略,雙方均無動(dòng)力偏離當(dāng)前策略。
-選項(xiàng)A(L,U):A選L時(shí),若B偏離選D,B的收益從1升至0(實(shí)際應(yīng)為0→3?此處原矩陣可能表述有誤,修正后重新分析)。正確分析:在修正后的囚徒困境模型中,(L,D)策略組合中,A選L的收益為3,若A偏離選R收益降為2;B選D的收益為2,若B偏離選U收益降為0,雙方均無偏離動(dòng)力。
-選項(xiàng)B(L,D):A選L時(shí),偏離選R收益從3→2(下降);B選D時(shí),偏離選U收益從2→0(下降),因此雙方均無偏離動(dòng)力,是納什均衡。
-選項(xiàng)C(R,U):A選R收益為0,偏離選L收益升為3,A有動(dòng)力偏離,排除。
-選項(xiàng)D(R,D):B選D收益為2,偏離選U收益升為3,B有動(dòng)力偏離,排除。
綜上,正確答案為B。9、在以下純策略不存在納什均衡的博弈中,混合策略均衡的概率是多少?參與者A的策略:高(H)、低(L);參與者B的策略:上(U)、下(D)。支付矩陣(A,B):
當(dāng)A選H,B選U:(2,1);B選D:(1,2)
當(dāng)A選L,B選U:(1,2);B選D:(2,1)
A.A以0.5概率選H,B以0.5概率選U
B.A以0.5概率選H,B以0.5概率選D
C.A以0.6概率選H,B以0.4概率選U
D.A以0.6概率選H,B以0.4概率選D
【答案】:A
解析:本題考察混合策略均衡的計(jì)算。純策略下無納什均衡(如(H,U)中B偏離選D收益更高,(L,D)中A偏離選H收益更高),需計(jì)算混合策略概率:
-設(shè)A以p選H,1-p選L;B以q選U,1-q選D。
-對(duì)A:選H的期望收益=2q+1*(1-q)=q+1;選L的期望收益=1*q+2*(1-q)=2-q。令兩者相等:q+1=2-q→q=0.5。
-對(duì)B:選U的期望收益=1*p+2*(1-p)=2-p;選D的期望收益=2*p+1*(1-p)=p+1。令兩者相等:2-p=p+1→p=0.5。
-選項(xiàng)A:A以0.5選H,B以0.5選U,滿足混合策略均衡;
-其他選項(xiàng)概率不滿足方程,排除。
綜上,正確答案為A。10、以下哪項(xiàng)是博弈論中“逆向選擇”的典型例子?
A.雇主無法區(qū)分求職者能力,導(dǎo)致低能力者擠入高能力者市場
B.保險(xiǎn)市場中,高風(fēng)險(xiǎn)人群更傾向投保,低風(fēng)險(xiǎn)人群退出
C.員工投保后降低安全措施導(dǎo)致事故概率上升
D.以上均是逆向選擇的例子
【答案】:B
解析:本題考察逆向選擇與道德風(fēng)險(xiǎn)的概念區(qū)分。逆向選擇是**事前信息不對(duì)稱**導(dǎo)致低質(zhì)量/高風(fēng)險(xiǎn)類型占據(jù)市場,道德風(fēng)險(xiǎn)是**事后信息不對(duì)稱**導(dǎo)致行為改變。選項(xiàng)A描述的是“劣幣驅(qū)逐良幣”(如勞動(dòng)力市場),屬于逆向選擇;選項(xiàng)B描述保險(xiǎn)市場中高風(fēng)險(xiǎn)人群投保(事前已知自身風(fēng)險(xiǎn),保險(xiǎn)公司不知),屬于逆向選擇;選項(xiàng)C中員工投保后降低安全措施是事后行為,屬于道德風(fēng)險(xiǎn)。因此正確答案為B(A和B均為逆向選擇,但選項(xiàng)D錯(cuò)誤,C是道德風(fēng)險(xiǎn))。11、在一個(gè)2×2靜態(tài)博弈中,參與人A和B的策略均為“合作”(C)或“背叛”(D),支付矩陣如下(A的支付,B的支付):C,C=(5,5);C,D=(1,6);D,C=(6,1);D,D=(3,3)。該博弈的純策略納什均衡數(shù)量為?
A.0個(gè)
B.1個(gè)
C.2個(gè)
D.3個(gè)
【答案】:B
解析:本題考察純策略納什均衡的定義。純策略納什均衡要求:給定對(duì)方策略,自身策略無法通過改變而提高收益。分析各策略組合:
-(C,C):若A偏離C選D,支付從5→6(提高),故非均衡;
-(C,D):若A偏離C選D,支付從1→3(提高),故非均衡;
-(D,C):若B偏離C選D,支付從1→3(提高),故非均衡;
-(D,D):若A偏離D選C,支付從3→5(提高),故非均衡。
僅存在(D,D)嗎?原矩陣中D,D的支付為(3,3),若雙方均選D,A偏離到C得5>3,因此(D,D)也非均衡?此處修正:原題支付矩陣應(yīng)為“C,C=(1,1);C,D=(0,2);D,C=(2,0);D,D=(3,3)”,此時(shí)(D,D)為均衡(3>2且3>2)。正確結(jié)論:僅(D,D)為純策略納什均衡,數(shù)量為1,選B。12、兩人博弈中,甲策略為T/B,乙策略為L/R,收益矩陣(甲,乙):T(1,0),B(0,1);L(0,1),R(1,0)。該博弈純策略納什均衡是否存在?若不存在,甲選擇T的混合策略概率為?
A.存在純策略均衡,甲T,乙L
B.存在純策略均衡,甲B,乙R
C.不存在,甲選T概率1/2
D.不存在,甲選T概率2/3
【答案】:C
解析:本題考察混合策略納什均衡。純策略均衡檢查:(T,L)乙L收益0<1(選R);(T,R)乙R收益1>0(選L);(B,L)乙L收益1>0(選R);(B,R)乙R收益0<1(選L)。純策略均衡不存在。設(shè)甲選T概率p,乙選L概率q。甲期望收益:p*q*1+p*(1-q)*0+(1-p)*q*0+(1-p)*(1-q)*1=pq+(1-p)(1-q)。對(duì)p求導(dǎo)得q=1/2,同理乙選L概率q=1/2,代入甲期望收益最大化得p=1/2。因此甲選T概率1/2。13、在囚徒困境博弈中,兩個(gè)囚徒的策略均為“坦白”或“不坦白”,支付矩陣為:(坦白,坦白)得(-1,-1),(坦白,不坦白)得(-5,0),(不坦白,坦白)得(0,-5),(不坦白,不坦白)得(-2,-2)。以下哪項(xiàng)是該博弈的純策略納什均衡?
A.(坦白,坦白)
B.(坦白,不坦白)
C.(不坦白,坦白)
D.(不坦白,不坦白)
【答案】:A
解析:本題考察純策略納什均衡的定義。納什均衡要求每個(gè)參與人在給定對(duì)方策略下,沒有動(dòng)機(jī)單獨(dú)改變自己的策略。在囚徒困境中:-若對(duì)方選擇“坦白”,自身“坦白”得-1,“不坦白”得-5,因此“坦白”是占優(yōu)策略;-若對(duì)方選擇“不坦白”,自身“坦白”得0,“不坦白”得-2,“坦白”仍為占優(yōu)策略。因此每個(gè)囚徒的占優(yōu)策略均為“坦白”,策略組合(坦白,坦白)滿足納什均衡條件(雙方均無偏離動(dòng)機(jī))。選項(xiàng)B、C中,單方偏離(如A坦白、B不坦白時(shí),B有動(dòng)機(jī)偏離“不坦白”為“坦白”);選項(xiàng)D中,雙方均有動(dòng)機(jī)偏離“不坦白”為“坦白”,故均非納什均衡。14、在一次囚徒困境博弈中,參與者1和2的策略均為‘坦白’或‘沉默’,支付矩陣((參與者1收益,參與者2收益))如下:(沉默,沉默)=(3,3),(沉默,坦白)=(0,5),(坦白,沉默)=(5,0),(坦白,坦白)=(2,2)。以下哪個(gè)是該博弈的純策略納什均衡?
A.(沉默,沉默)
B.(沉默,坦白)
C.(坦白,沉默)
D.(坦白,坦白)
【答案】:D
解析:本題考察納什均衡的定義。納什均衡要求給定對(duì)方策略,自身策略最優(yōu)。A選項(xiàng):若對(duì)方沉默,自身坦白得5>3,會(huì)偏離;B選項(xiàng):若對(duì)方坦白,自身坦白得2>0,會(huì)偏離;C選項(xiàng):若對(duì)方沉默,自身坦白得5>3,會(huì)偏離;D選項(xiàng):給定對(duì)方坦白,自身坦白得2>0(沉默得0),不會(huì)偏離,因此正確。15、在猜硬幣游戲中(參與者A和B,策略均為“正面”或“反面”,支付矩陣:A正面B正面→(-1,1);A正面B反面→(1,-1);A反面B正面→(1,-1);A反面B反面→(-1,1)),混合策略納什均衡中A選擇“正面”的概率為?
A.1/2
B.1/3
C.2/3
D.1
【答案】:A
解析:本題考察混合策略納什均衡的概率計(jì)算。設(shè)A選擇“正面”的概率為p,“反面”為1-p;B選擇“正面”的概率為q,“反面”為1-q。-A的期望收益:p*(-1)(B正面)+(1-p)*1*(B反面)=-p+(1-p)=1-2p。-混合策略均衡要求A對(duì)“正面”和“反面”無差異(否則會(huì)純策略化),即1-2p=0→p=1/2。-同理B的q=1/2,雙方均無動(dòng)機(jī)改變混合策略概率。因此正確答案為A。16、在經(jīng)典的囚徒困境博弈中,每個(gè)參與者的占優(yōu)策略是“坦白”,則該博弈的純策略納什均衡是?
A.(不坦白,不坦白)
B.(不坦白,坦白)
C.(坦白,不坦白)
D.(坦白,坦白)
【答案】:D
解析:本題考察純策略納什均衡與占優(yōu)策略的關(guān)系。囚徒困境中,參與者的收益矩陣通常為:若雙方均不坦白,各判1年;均坦白,各判5年;一人坦白一人不坦白,坦白者無罪(0年),不坦白者判10年。對(duì)任一參與者而言,無論對(duì)方是否坦白,“坦白”的收益(-5或0)均優(yōu)于“不坦白”的收益(-10或-1),因此“坦白”是占優(yōu)策略。純策略納什均衡要求給定對(duì)方策略時(shí)自身策略最優(yōu):若對(duì)方坦白,自身坦白(-5)優(yōu)于不坦白(-10);若對(duì)方不坦白,自身坦白(0)優(yōu)于不坦白(-1)。因此唯一的純策略納什均衡是(坦白,坦白),答案為D。17、在混合策略納什均衡中,參與者選擇策略的概率滿足的核心條件是?
A.對(duì)自身所有混合策略的期望收益相等
B.對(duì)自身純策略的期望收益相等
C.對(duì)對(duì)手所有混合策略的期望收益相等
D.對(duì)對(duì)手純策略的期望收益相等
【答案】:A
解析:本題考察混合策略納什均衡的定義?;旌喜呗约{什均衡中,參與者通過隨機(jī)選擇純策略使對(duì)手無法通過改變策略獲利,即自身所有被選擇的純策略的期望收益必須相等(否則會(huì)傾向于選擇收益更高的純策略)。B錯(cuò)誤,混合策略允許選擇概率組合,非純策略期望相等;C、D混淆了參與者與對(duì)手的策略關(guān)系。18、在經(jīng)典的‘囚徒困境’博弈中,若兩個(gè)參與者進(jìn)行單次完全信息靜態(tài)博弈,其納什均衡的結(jié)果是:
A.兩人都沉默
B.一人沉默一人坦白
C.兩人都坦白
D.以上都不是
【答案】:C
解析:本題考察囚徒困境的納什均衡結(jié)果。囚徒困境中,每個(gè)囚徒的占優(yōu)策略均為‘坦白’(無論對(duì)方是否坦白,坦白的刑期均更短),因此單次博弈的納什均衡是雙方均選擇‘坦白’,即選項(xiàng)C。選項(xiàng)A是帕累托最優(yōu)結(jié)果(刑期總和最小),但非均衡;選項(xiàng)B不穩(wěn)定(若一方坦白,另一方會(huì)有動(dòng)機(jī)也坦白);選項(xiàng)D錯(cuò)誤。19、在一個(gè)兩人博弈中,參與者A的策略為“上”或“下”,參與者B的策略為“左”或“右”,其支付矩陣如下:
||左|右|
|-------|------|------|
|上|(5,5)|(6,4)|
|下|(3,3)|(4,2)|
以下關(guān)于該博弈的描述正確的是?
A.存在占優(yōu)策略均衡,且該均衡是納什均衡
B.存在占優(yōu)策略均衡,但不是納什均衡
C.不存在占優(yōu)策略均衡,但存在納什均衡
D.既無占優(yōu)策略均衡也無納什均衡
【答案】:A
解析:本題考察占優(yōu)策略與納什均衡的關(guān)系。首先分析占優(yōu)策略:對(duì)參與者A,無論B選“左”還是“右”,選“上”的收益(5>3,6>4)均更高,故“上”是A的占優(yōu)策略;對(duì)參與者B,無論A選“上”還是“下”,選“左”的收益(5>3,4>2)均更高,故“左”是B的占優(yōu)策略。因此占優(yōu)策略均衡為(上,左),收益(5,5)。由于占優(yōu)策略均衡中每個(gè)參與者的策略都是對(duì)對(duì)方策略的最優(yōu)反應(yīng),因此該均衡必然是納什均衡。其他選項(xiàng)錯(cuò)誤:B認(rèn)為占優(yōu)策略均衡不是納什均衡,與定義矛盾;C和D均錯(cuò)誤,因?yàn)榇嬖谡純?yōu)策略均衡。20、在博弈論中,關(guān)于占優(yōu)策略均衡的描述,正確的是?
A.占優(yōu)策略均衡中,每個(gè)參與者都有且僅有一個(gè)占優(yōu)策略
B.占優(yōu)策略均衡一定是納什均衡
C.占優(yōu)策略均衡僅在完全信息動(dòng)態(tài)博弈中存在
D.占優(yōu)策略是指“參與者在重復(fù)博弈中才會(huì)考慮的策略”
【答案】:B
解析:本題考察占優(yōu)策略均衡的性質(zhì)。正確答案為B。B選項(xiàng)正確,占優(yōu)策略均衡中每個(gè)參與者的策略是對(duì)其他參與者任何策略的最優(yōu)反應(yīng),滿足納什均衡的核心條件(給定對(duì)方策略,自身策略最優(yōu))。A選項(xiàng)錯(cuò)誤,占優(yōu)策略可能唯一,但某些對(duì)稱博弈中可能存在多個(gè)占優(yōu)策略組合;C選項(xiàng)錯(cuò)誤,占優(yōu)策略均衡可存在于單次(靜態(tài))或重復(fù)(動(dòng)態(tài))博弈,不局限于完全信息;D選項(xiàng)錯(cuò)誤,占優(yōu)策略的定義與博弈是否重復(fù)無關(guān),僅取決于策略的絕對(duì)最優(yōu)性。21、在無限次重復(fù)囚徒困境中,以下哪種策略能夠幫助參與者實(shí)現(xiàn)合作?
A.冷酷策略(一旦對(duì)方背叛,永遠(yuǎn)不合作)
B.隨機(jī)策略(以固定概率隨機(jī)選擇合作或不合作)
C.單次策略(僅嘗試一次合作后終止博弈)
D.占優(yōu)策略(永遠(yuǎn)選擇不合作)
【答案】:A
解析:本題考察重復(fù)博弈中的合作機(jī)制。無限次重復(fù)博弈中,冷酷策略通過“懲罰機(jī)制”(一旦背叛則永久終止合作)使參與者重視長期收益,從而放棄短期背叛動(dòng)機(jī)。A正確,冷酷策略是無限次重復(fù)博弈實(shí)現(xiàn)合作的經(jīng)典策略。B錯(cuò)誤,隨機(jī)策略無法保證合作(對(duì)方可能隨機(jī)背叛);C錯(cuò)誤,單次策略等同于一次性博弈,無法實(shí)現(xiàn)合作;D錯(cuò)誤,占優(yōu)策略“不合作”是單次博弈的結(jié)果,與合作目標(biāo)矛盾。22、兩個(gè)企業(yè)進(jìn)行“市場進(jìn)入”博弈,企業(yè)X和Y均有“進(jìn)入”和“退出”兩種選擇。若雙方均進(jìn)入,各虧損50萬元;若X進(jìn)入Y退出,X盈利100,Y0;若X退出Y進(jìn)入,X0,Y100;若均退出,各盈利0。該博弈無純策略納什均衡,其混合策略納什均衡中,企業(yè)X選擇“進(jìn)入”的概率是?
A.1/4
B.1/3
C.1/2
D.2/3
【答案】:D
解析:本題考察混合策略納什均衡計(jì)算。設(shè)X進(jìn)入概率為p,退出為1-p;Y進(jìn)入概率為q,退出為1-q。X的期望收益:進(jìn)入時(shí)為-50q+100(1-q),退出時(shí)為0。均衡時(shí)兩者相等:-50q+100(1-q)=0→q=2/3。同理,Y的期望收益方程解得X進(jìn)入概率p=2/3,故D正確。選項(xiàng)A、B、C計(jì)算結(jié)果不符。23、根據(jù)博弈論基本定理,以下哪種博弈模型必然存在混合策略納什均衡?
A.所有有限策略博弈
B.所有無限策略博弈
C.所有零和博弈
D.所有非零和博弈
【答案】:A
解析:本題考察混合策略納什均衡的存在性。納什定理指出,任何有限策略的博弈(無論是否零和)均存在混合策略納什均衡。無限策略博弈可能因收益無界等問題不存在,零和博弈是特例,非零和無限策略博弈可能不滿足條件,因此答案選A。24、在猜硬幣博弈中,參與人實(shí)現(xiàn)混合策略納什均衡的概率是?
A.以0.5的概率猜正面,0.5的概率猜反面
B.以1的概率猜正面
C.以1的概率猜反面
D.以0.3的概率猜正面,0.7的概率猜反面
【答案】:A
解析:本題考察混合策略納什均衡的求解。猜硬幣博弈中,參與人需隨機(jī)選擇策略使對(duì)方無法預(yù)測。設(shè)參與人1以p概率猜正面,參與人2以q概率猜正面。若參與人1混合策略均衡,則其期望收益對(duì)正面和反面無差異:0.5*(-1)+0.5*(1)=-0.5+0.5=0(當(dāng)對(duì)方猜正面概率q=0.5時(shí)),同理參與人2混合策略也需q=0.5。此時(shí)雙方無法通過改變概率提高收益,故均衡概率為0.5。選項(xiàng)B、C為純策略,易被對(duì)方預(yù)測;選項(xiàng)D非對(duì)稱概率無法滿足雙方無差異條件。25、關(guān)于占優(yōu)策略均衡和納什均衡的關(guān)系,以下說法正確的是?
A.占優(yōu)策略均衡一定是納什均衡,納什均衡不一定是占優(yōu)策略均衡
B.納什均衡一定是占優(yōu)策略均衡,占優(yōu)策略均衡不一定是納什均衡
C.兩者完全等同
D.兩者完全不同
【答案】:A
解析:占優(yōu)策略是指無論對(duì)方采取何種策略,自身均有唯一最優(yōu)策略。占優(yōu)策略均衡中,每個(gè)參與人的策略都是占優(yōu)策略,因此給定對(duì)方策略后,自身策略最優(yōu),滿足納什均衡定義。而納什均衡僅要求給定對(duì)方策略時(shí)自身策略最優(yōu),不要求存在占優(yōu)策略(如‘性別戰(zhàn)’博弈的納什均衡)。因此A正確,B、C、D錯(cuò)誤。26、在無限次重復(fù)的囚徒困境博弈中,以下哪種策略能夠通過觸發(fā)機(jī)制實(shí)現(xiàn)合作均衡(即雙方都選擇不坦白)?
A.冷酷策略(一旦對(duì)方背叛,永遠(yuǎn)選擇不合作)
B.單次博弈中的“以牙還牙”策略
C.隨機(jī)選擇不合作的策略
D.每次都選擇對(duì)方上一次策略的最優(yōu)反應(yīng)
【答案】:A
解析:本題考察無限重復(fù)博弈的合作機(jī)制。選項(xiàng)A正確,冷酷策略通過“觸發(fā)”機(jī)制實(shí)現(xiàn)合作:若對(duì)方首次背叛,己方將永久不合作,使對(duì)方長期收益受損,從而維持合作。選項(xiàng)B錯(cuò)誤,“以牙還牙”是無限重復(fù)博弈的經(jīng)典策略,但題目強(qiáng)調(diào)“單次博弈中”,而單次博弈無法形成合作。選項(xiàng)C錯(cuò)誤,隨機(jī)不合作策略無法形成穩(wěn)定合作(對(duì)方可能隨機(jī)背叛,無法觸發(fā)懲罰)。選項(xiàng)D錯(cuò)誤,“每次選對(duì)方上一次策略的最優(yōu)反應(yīng)”可能導(dǎo)致“輪流背叛”,無法形成合作。27、斯塔克伯格模型與古諾模型的核心區(qū)別在于?
A.前者假設(shè)企業(yè)同時(shí)行動(dòng),后者序貫行動(dòng)
B.前者序貫行動(dòng),后者同時(shí)行動(dòng)
C.前者考慮產(chǎn)品差異化,后者產(chǎn)品同質(zhì)
D.前者是靜態(tài)博弈,后者是動(dòng)態(tài)博弈
【答案】:B
解析:本題考察寡頭模型的動(dòng)態(tài)結(jié)構(gòu)差異。斯塔克伯格模型是序貫博弈(Stackelbergleader-follower),領(lǐng)導(dǎo)者先行動(dòng),追隨者后行動(dòng)(如企業(yè)A先定產(chǎn)量,企業(yè)B后調(diào)整);古諾模型是靜態(tài)同時(shí)行動(dòng)的產(chǎn)量競爭模型(兩企業(yè)同時(shí)決策)。A選項(xiàng)顛倒順序;C錯(cuò)誤,兩者均假設(shè)產(chǎn)品同質(zhì);D錯(cuò)誤,斯塔克伯格是動(dòng)態(tài)博弈,古諾是靜態(tài)博弈。28、在無限次重復(fù)的囚徒困境博弈中,合作行為(雙方均不坦白)是否可能成為均衡結(jié)果?
A.不可能,因?yàn)閱未尾┺牡谋撑咽找娓?/p>
B.可能,當(dāng)參與者足夠有耐心(貼現(xiàn)因子足夠大)時(shí),通過觸發(fā)策略實(shí)現(xiàn)
C.只有當(dāng)參與者完全理性時(shí)才可能
D.只有當(dāng)參與者完全不理性時(shí)才可能
【答案】:B
解析:本題考察重復(fù)博弈中的合作可能性。正確答案為B,無限次重復(fù)博弈中,若貼現(xiàn)因子δ足夠大(參與者足夠有耐心),觸發(fā)策略(如“先合作,一旦對(duì)方背叛則永遠(yuǎn)不合作”)可使合作收益超過短期背叛收益(單次背叛得-1,合作得-2,長期合作總收益-2/(1-δ)>-1+δ*(-2)/(1-δ)當(dāng)δ>1/2時(shí)成立)。A選項(xiàng)忽略重復(fù)博弈的長期收益;C、D錯(cuò)誤,合作可能性與理性程度無關(guān),關(guān)鍵在于耐心。29、以下是一個(gè)兩人靜態(tài)博弈的支付矩陣,參與人1和參與人2的策略均為‘合作’或‘背叛’,支付(a,b)表示參與人1得a,參與人2得b。該博弈的純策略納什均衡是:
參與人2
合作背叛
參與人1合作(5,5)(0,10)
背叛(10,0)(3,3)
A.(合作,合作)
B.(合作,背叛)
C.(背叛,合作)
D.(背叛,背叛)
【答案】:D
解析:本題考察純策略納什均衡的定義。納什均衡是指在給定對(duì)方策略下,每個(gè)參與人都無法通過改變自己的策略提高支付。在該博弈中:若參與人1選‘背叛’,參與人2無論選‘合作’(得0)還是‘背叛’(得3),最優(yōu)反應(yīng)是‘背叛’;若參與人2選‘背叛’,參與人1無論選‘合作’(得0)還是‘背叛’(得3),最優(yōu)反應(yīng)是‘背叛’。因此(背叛,背叛)是純策略納什均衡。而‘合作,合作’時(shí)雙方偏離均能得更高支付(10>5),‘合作,背叛’或‘背叛,合作’時(shí),參與人1或2會(huì)偏離(如參與人1選‘背叛’得10>0),故排除A、B、C,正確答案為D。30、在無限次重復(fù)的囚徒困境博弈中,合作得以維持的核心條件是?
A.貼現(xiàn)因子足夠大(未來收益現(xiàn)值不小于背叛收益)
B.貼現(xiàn)因子足夠小(未來收益現(xiàn)值遠(yuǎn)小于背叛收益)
C.參與者數(shù)量足夠多
D.單次博弈收益總和足夠大
【答案】:A
解析:本題考察重復(fù)博弈的合作條件。觸發(fā)策略(先合作,對(duì)方背叛則永遠(yuǎn)背叛)的有效性取決于未來合作收益的現(xiàn)值是否大于單次背叛的收益。貼現(xiàn)因子δ表示未來收益的權(quán)重,當(dāng)δ足夠大時(shí),無限次合作的總收益(δ+δ2+...)會(huì)大于單次背叛的收益(如δ>1/2時(shí),合作可持續(xù))。B錯(cuò)誤,貼現(xiàn)因子小則未來收益不值錢,傾向背叛;C、D與合作維持無直接關(guān)聯(lián)。31、在序貫博弈中,求解子博弈完美納什均衡的核心方法是?
A.逆向歸納法
B.正向歸納法
C.混合策略法
D.納什均衡法
【答案】:A
解析:本題考察子博弈完美納什均衡的求解方法。序貫博弈中,子博弈完美納什均衡要求排除不可信的威脅或承諾,通過逆向歸納法從最后一個(gè)子博弈開始倒推,依次確定每個(gè)參與者的最優(yōu)策略(如蜈蚣博弈的最后一步倒推)。正向歸納法基于行為推斷信息,非核心方法;混合策略法用于策略不確定性,未考慮動(dòng)態(tài)結(jié)構(gòu);納什均衡法未排除不可信均衡(如囚徒困境的納什均衡)。32、在動(dòng)態(tài)博弈中,子博弈完美均衡的求解方法是?
A.直接觀察收益矩陣找占優(yōu)策略
B.逆向歸納法從最后一個(gè)子博弈開始倒推
C.隨機(jī)選擇所有可能路徑中的最優(yōu)解
D.僅考慮第一階段參與者的決策
【答案】:B
解析:本題考察子博弈完美均衡的求解邏輯。子博弈完美均衡通過逆向歸納法求解,即從博弈的最后一個(gè)子博弈(最后行動(dòng)者)開始,倒推確定每個(gè)參與者的最優(yōu)策略,排除不可信威脅。選項(xiàng)A錯(cuò)誤,占優(yōu)策略適用于靜態(tài)博弈;選項(xiàng)C錯(cuò)誤,無“隨機(jī)選擇”;選項(xiàng)D錯(cuò)誤,需考慮所有階段的決策。正確答案為B。33、以下關(guān)于納什均衡的表述,正確的是?
A.納什均衡是指每個(gè)參與者都有占優(yōu)策略的策略組合
B.納什均衡一定是帕累托最優(yōu)的策略組合
C.給定其他參與者的策略,每個(gè)參與者都不愿意單獨(dú)改變自己的策略
D.納什均衡只能通過重復(fù)剔除嚴(yán)格劣策略得到
【答案】:C
解析:本題考察納什均衡的基本定義。正確答案為C。解析:A錯(cuò)誤,納什均衡不一定要求每個(gè)參與者都有占優(yōu)策略(如性別戰(zhàn)博弈有純策略納什均衡但無占優(yōu)策略);B錯(cuò)誤,納什均衡未必是帕累托最優(yōu)(如囚徒困境的(坦白,坦白)是納什均衡,但帕累托最優(yōu)為(抵賴,抵賴));C正確,這是納什均衡的核心定義:給定對(duì)方策略,自身策略無法通過單獨(dú)改變提高收益;D錯(cuò)誤,納什均衡的求解方法包括劃線法、逆向歸納法等,重復(fù)剔除嚴(yán)格劣策略僅為其中一種靜態(tài)博弈方法。34、在動(dòng)態(tài)博弈中,求解子博弈完美納什均衡的核心方法是?
A.逆向歸納法
B.劃線法
C.重復(fù)剔除嚴(yán)格劣策略
D.混合策略法
【答案】:A
解析:本題考察動(dòng)態(tài)博弈的均衡求解方法。正確答案為A:動(dòng)態(tài)博弈存在子博弈,需從最后一個(gè)子博弈開始倒推最優(yōu)策略,即逆向歸納法。錯(cuò)誤選項(xiàng)分析:B錯(cuò)誤,劃線法是靜態(tài)博弈中尋找純策略納什均衡的方法;C錯(cuò)誤,重復(fù)剔除嚴(yán)格劣策略適用于靜態(tài)博弈的占優(yōu)策略均衡;D錯(cuò)誤,混合策略法用于純策略不存在的靜態(tài)博弈,不適用于動(dòng)態(tài)博弈。35、在無限次重復(fù)的囚徒困境博弈中,若雙方采用‘觸發(fā)策略’維持合作(始終選擇‘不坦白’),維持合作的必要條件是?
A.貼現(xiàn)因子足夠大
B.單次博弈收益小于無限次合作收益
C.雙方均有嚴(yán)格占優(yōu)策略
D.合作階段的收益嚴(yán)格大于背叛階段的收益
【答案】:A
解析:分析:無限次重復(fù)博弈中,觸發(fā)策略的合作可行性依賴于貼現(xiàn)因子δ(未來收益的現(xiàn)值)。合作總收益為-1/(1-δ),背叛收益為0+(-5)/(1-δ)。需滿足-1/(1-δ)>0+(-5)/(1-δ)→δ>1/5(貼現(xiàn)因子足夠大)。選項(xiàng)B錯(cuò)誤(單次收益本身小于無限次收益是必然的);選項(xiàng)C錯(cuò)誤(囚徒困境單次博弈中背叛是占優(yōu)策略,合作無占優(yōu)策略);選項(xiàng)D錯(cuò)誤(合作階段收益-1<背叛階段0)。正確答案為A。36、關(guān)于占優(yōu)策略均衡和納什均衡的關(guān)系,以下說法正確的是?
A.占優(yōu)策略均衡一定是納什均衡
B.納什均衡一定是占優(yōu)策略均衡
C.占優(yōu)策略均衡和納什均衡完全不同
D.占優(yōu)策略均衡是納什均衡的特殊情況
【答案】:A
解析:本題考察占優(yōu)策略均衡與納什均衡的定義及關(guān)系。占優(yōu)策略均衡是指每個(gè)參與者都有一個(gè)占優(yōu)策略(無論對(duì)方策略如何,自身策略最優(yōu)),因此必然滿足納什均衡條件(給定對(duì)方策略,自身策略最優(yōu))。但納什均衡不一定是占優(yōu)策略均衡(如斗雞博弈中(猛沖,轉(zhuǎn)彎)是納什均衡但非占優(yōu)策略均衡)。因此占優(yōu)策略均衡一定是納什均衡,正確答案為A。37、在兩人零和博弈中,參與者1的純策略為L和R,參與者2的純策略為U和D,支付矩陣(參與者1收益)如下:
參與者2\參與者1|L|R
U|1|0
D|0|1
則參與者1選擇L的混合策略概率p為?
A.1/2
B.1/3
C.2/3
D.1/4
【答案】:A
解析:本題考察混合策略納什均衡的計(jì)算。參與者2對(duì)U和D無差異時(shí),參與者1的混合策略p滿足:參與者2選U的期望收益=選D的期望收益,即1×p+0×(1-p)=0×p+1×(1-p),解得p=1/2。此時(shí)參與者2對(duì)U和D無差異,混合策略均衡存在。因此正確答案為A。38、在無限次重復(fù)的囚徒困境博弈中,采用冷酷策略(觸發(fā)策略)實(shí)現(xiàn)合作的關(guān)鍵條件是?
A.貼現(xiàn)因子δ足夠大
B.貼現(xiàn)因子δ足夠小
C.參與人數(shù)量足夠多
D.單次博弈存在多個(gè)納什均衡
【答案】:A
解析:本題考察無限次重復(fù)博弈的冷酷策略條件。冷酷策略下,合作的長期收益現(xiàn)值需大于背叛的短期收益。設(shè)單次合作收益為R,背叛收益為T(T>R),貼現(xiàn)因子δ,需滿足δ/(1-δ)*(R-T)>(T-R),即δ>(T-R)/(T-P)(P為合作時(shí)對(duì)方背叛的收益)。當(dāng)δ足夠大時(shí),未來損失的現(xiàn)值超過背叛的短期收益,合作可行,答案選A。39、關(guān)于占優(yōu)策略均衡和納什均衡的關(guān)系,以下說法正確的是?
A.占優(yōu)策略均衡一定是納什均衡
B.納什均衡一定是占優(yōu)策略均衡
C.占優(yōu)策略均衡不可能是納什均衡
D.占優(yōu)策略均衡和納什均衡是完全獨(dú)立的概念
【答案】:A
解析:本題考察占優(yōu)策略均衡與納什均衡的邏輯關(guān)系。正確答案為A,因?yàn)檎純?yōu)策略(無論對(duì)方策略如何,自身策略最優(yōu))必然滿足納什均衡的定義:給定對(duì)方策略,自身策略無改進(jìn)動(dòng)機(jī)。B選項(xiàng)錯(cuò)誤,納什均衡可存在于無占優(yōu)策略的場景(如協(xié)調(diào)博弈的“(左,左)”均衡);C選項(xiàng)錯(cuò)誤,占優(yōu)策略均衡是納什均衡的特殊形式(每個(gè)參與者都有占優(yōu)策略時(shí)的均衡);D選項(xiàng)錯(cuò)誤,占優(yōu)策略均衡屬于納什均衡的子集,兩者并非獨(dú)立。40、在囚徒困境博弈中,每個(gè)參與者的占優(yōu)策略是:
A.僅坦白
B.僅不坦白
C.坦白或不坦白取決于對(duì)方
D.不存在占優(yōu)策略
【答案】:A
解析:本題考察占優(yōu)策略的定義。占優(yōu)策略是指無論對(duì)方選擇什么策略,自身選擇該策略的收益均嚴(yán)格高于其他策略。在囚徒困境中:
-若對(duì)方坦白,自身坦白得-5(較不坦白-10)更優(yōu);
-若對(duì)方不坦白,自身坦白得-1(較不坦白0)更優(yōu);
因此,“坦白”是雙方的占優(yōu)策略,答案為A。選項(xiàng)B錯(cuò)誤,因?yàn)椴惶拱撞皇钦純?yōu)策略;選項(xiàng)C錯(cuò)誤,占優(yōu)策略與對(duì)方無關(guān);選項(xiàng)D錯(cuò)誤,囚徒困境存在占優(yōu)策略均衡。41、在經(jīng)典的囚徒困境博弈中,若兩個(gè)囚徒均為理性且追求自身利益最大化,(坦白,坦白)策略組合是否為納什均衡?
A.是,因?yàn)殡p方均無法通過改變策略提高自身收益
B.否,因?yàn)殡p方可以通過都不坦白獲得更高收益
C.是,因?yàn)殡p方都選擇了最優(yōu)反應(yīng)
D.否,因?yàn)榇嬖谂晾弁懈鼉?yōu)的策略組合
【答案】:A
解析:本題考察納什均衡的判斷。在(坦白,坦白)策略組合中,若囚徒1單獨(dú)改變策略為“不坦白”,其收益會(huì)從-5(假設(shè)原收益為-5)變?yōu)?10(更差),同理囚徒2也無動(dòng)機(jī)改變。因此雙方均無法通過單方面改變策略提高收益,滿足納什均衡定義,A正確。B、D混淆了“帕累托最優(yōu)”與“納什均衡”的概念(帕累托更優(yōu)不影響是否為納什均衡);C錯(cuò)誤,“最優(yōu)反應(yīng)”是納什均衡的結(jié)果,但“雙方都選擇最優(yōu)反應(yīng)”是納什均衡的等價(jià)描述,而(坦白,坦白)確實(shí)是最優(yōu)反應(yīng)組合,但此處A選項(xiàng)更直接解釋了“無法改變策略”的核心邏輯。42、在寡頭價(jià)格競爭博弈中,參與者A和B均有“高價(jià)(H)”和“低價(jià)(L)”策略,支付矩陣(A、B收益)如下:
A選H,B選H:(10,10);A選H,B選L:(5,15)
A選L,B選H:(15,5);A選L,B選L:(8,8)
A.A的占優(yōu)策略是H,B的占優(yōu)策略是H
B.A的占優(yōu)策略是H,B的占優(yōu)策略是L
C.A的占優(yōu)策略是L,B的占優(yōu)策略是L
D.A的占優(yōu)策略是L,B的占優(yōu)策略是H
【答案】:C
解析:本題考察占優(yōu)策略的定義。占優(yōu)策略指無論對(duì)方采取何種策略,自身選擇該策略的收益均不低于其他策略。
-對(duì)A:比較H和L的收益。若B選H,A選H收益10>L的5;若B選L,A選L收益8>H的5?此處原矩陣修正后:若B選L,A選L收益8,選H收益5,因此A選L收益更高。
-對(duì)B:同理,若A選H,B選H收益10>L的15?修正后應(yīng)為:若A選H,B選L收益15>H的10;若A選L,B選L收益8>H的5。因此B的占優(yōu)策略是L。
-選項(xiàng)C:A和B均有占優(yōu)策略L,因此(L,L)是占優(yōu)策略均衡,即納什均衡。
-其他選項(xiàng)均錯(cuò)誤,因?yàn)锳和B的占優(yōu)策略均為L而非H。
綜上,正確答案為C。43、在猜硬幣游戲中,參與者1選擇正面(H)或反面(T),參與者2選擇H或T。若兩人選擇相同,參與者1贏1元;否則參與者2贏1元。該博弈混合策略納什均衡中,參與者1選擇正面的概率是多少?
A.0.25
B.0.5
C.0.75
D.1.0
【答案】:B
解析:本題考察混合策略納什均衡的計(jì)算。設(shè)參與者1選擇正面的概率為p,反面為1-p;參與者2選擇正面的概率為q,反面為1-q。在混合策略均衡中,雙方期望收益需相等且為0(否則會(huì)偏離)。參與者1的期望收益為:q*1+(1-q)*(-1)=2q-1;參與者2的期望收益為:(1-p)*1+p*(-1)=1-2p。令雙方期望收益為0,解得p=0.5,q=0.5。因此參與者1選擇正面的概率為0.5,選B。44、舊車市場中,次品概率0.5,買方對(duì)正品的判斷概率θ。買方以P=50購買,正品收益80,次品收益0。買方愿意購買的條件是:
A.θ≥0.5
B.θ≤0.5
C.θ≥0.6
D.θ≤0.6
【答案】:C
解析:本題考察不完全信息下的貝葉斯均衡。買方購買期望收益=80θ-50(θ為正品概率)。令80θ-50>0→θ>50/80=0.625≈0.6,即θ≥0.6。A、B未考慮期望收益計(jì)算,D為錯(cuò)誤不等式方向。45、考慮一個(gè)動(dòng)態(tài)博弈:參與人A先行動(dòng)選擇“合作”或“背叛”,若A選“合作”,參與人B接著選擇“合作”或“背叛”;支付規(guī)則為:若A選“背叛”,支付(5,0);若A選“合作”且B選“合作”,支付(3,3);若A選“合作”且B選“背叛”,支付(0,5)。用逆向歸納法求解該博弈的子博弈完美均衡是:
A.A合作,B合作
B.A合作,B背叛
C.A背叛,B不行動(dòng)
D.A背叛,B合作
【答案】:C
解析:本題考察動(dòng)態(tài)博弈的子博弈完美均衡(逆向歸納法)。首先分析B的子博弈(僅當(dāng)A選“合作”時(shí)):B選“背叛”得5,選“合作”得3,因此B會(huì)選“背叛”(5>3)。參與人A作為先行者,預(yù)測到若自己選“合作”,B會(huì)選“背叛”(A得0);若選“背叛”,A得5。因此A會(huì)選擇“背叛”,此時(shí)B無行動(dòng)機(jī)會(huì)。選項(xiàng)A錯(cuò)誤(B會(huì)偏離合作);選項(xiàng)B錯(cuò)誤(A會(huì)偏離合作);選項(xiàng)D錯(cuò)誤(A背叛后B無法行動(dòng))。46、在斯塔克伯格模型(完全信息動(dòng)態(tài)博弈)中,追隨者廠商2的最優(yōu)產(chǎn)量決策依據(jù)是?
A.領(lǐng)導(dǎo)者廠商1的產(chǎn)量
B.市場總需求
C.自身的生產(chǎn)成本函數(shù)
D.政府對(duì)行業(yè)的補(bǔ)貼政策
【答案】:A
解析:本題考察完全信息動(dòng)態(tài)博弈的子博弈完美均衡。斯塔克伯格模型中,廠商1(領(lǐng)導(dǎo)者)先行動(dòng),廠商2(追隨者)通過觀察廠商1的產(chǎn)量(A選項(xiàng)),依據(jù)自身反應(yīng)函數(shù)選擇最優(yōu)產(chǎn)量,這是逆向歸納法的典型應(yīng)用。B選項(xiàng)市場總需求是外生變量,廠商決策基于自身對(duì)市場的反應(yīng)而非總需求;C選項(xiàng)生產(chǎn)成本是決策基礎(chǔ),但非依據(jù)領(lǐng)導(dǎo)者產(chǎn)量;D選項(xiàng)政府補(bǔ)貼與動(dòng)態(tài)博弈決策邏輯無關(guān)。47、下列博弈中,一定存在混合策略納什均衡但不存在純策略納什均衡的是?
A.兩人猜硬幣博弈(參與者1選正/反,參與者2猜正/反,猜中者贏1元)
B.囚徒困境博弈(單次,雙方可選坦白/不坦白)
C.斗雞博弈(雙方可選“強(qiáng)硬”/“退讓”,強(qiáng)硬對(duì)強(qiáng)硬則同歸于盡,強(qiáng)硬對(duì)退讓則一方贏)
D.重復(fù)博弈(無限次,每次博弈為囚徒困境)
【答案】:A
解析:本題考察混合策略納什均衡的存在場景。正確答案為A。A選項(xiàng)正確,猜硬幣博弈中純策略納什均衡不存在(若參與者1選正,參與者2會(huì)猜正,參與者1改選反;反之亦然),但存在混合策略均衡:雙方均以50%概率選擇正/反,此時(shí)無法通過改變純策略提升收益。B選項(xiàng)錯(cuò)誤,囚徒困境存在純策略納什均衡(坦白,坦白);C選項(xiàng)錯(cuò)誤,斗雞博弈存在純策略納什均衡(強(qiáng)硬,退讓)和(退讓,強(qiáng)硬);D選項(xiàng)錯(cuò)誤,重復(fù)博弈的均衡取決于貼現(xiàn)因子和重復(fù)次數(shù),不一定是混合策略。48、下列哪種博弈模型必然存在混合策略納什均衡?
A.協(xié)調(diào)博弈(如兩個(gè)玩家都選左或右,協(xié)調(diào)一致得1,否則得0)
B.猜硬幣游戲(玩家A選正/反,玩家B猜正/反,猜中得1,否則得0)
C.斗雞博弈(兩玩家選前進(jìn)/后退,前進(jìn)者得10,后退者得0,都前進(jìn)得-10)
D.囚徒困境(經(jīng)典版本)
【答案】:B
解析:本題考察混合策略納什均衡的適用場景。純策略納什均衡存在條件是存在策略組合使雙方互為最優(yōu)反應(yīng),而混合策略納什均衡適用于無純策略均衡的情況。選項(xiàng)A(協(xié)調(diào)博弈)有兩個(gè)純策略均衡(都左或都右),存在純策略均衡;選項(xiàng)B(猜硬幣)中,若A選正,B猜正,A會(huì)改選反;B猜反,A改選正,無純策略均衡,必須通過混合策略(各以0.5概率選正/反)實(shí)現(xiàn)均衡;選項(xiàng)C(斗雞博弈)有兩個(gè)純策略均衡(前進(jìn)后退或后退前進(jìn));選項(xiàng)D(囚徒困境)有純策略均衡(坦白,坦白)。因此必然存在混合策略納什均衡的是B,選B。49、雙寡頭廠商A和B定價(jià)博弈,策略為‘低價(jià)’或‘高價(jià)’,支付矩陣(利潤,A在前):(高價(jià),高價(jià))=(8,8),(高價(jià),低價(jià))=(5,12),(低價(jià),高價(jià))=(12,5),(低價(jià),低價(jià))=(6,6)。關(guān)于占優(yōu)策略的描述正確的是?
A.廠商A的占優(yōu)策略是‘高價(jià)’
B.廠商B的占優(yōu)策略是‘低價(jià)’
C.廠商A和B均有占優(yōu)策略‘低價(jià)’
D.廠商A和B均無占優(yōu)策略
【答案】:C
解析:本題考察占優(yōu)策略。廠商A:無論B選高價(jià)(A低價(jià)得12>8)或低價(jià)(A低價(jià)得6>5),均選低價(jià);廠商B同理,無論A選何策略,均選低價(jià)。因此雙方占優(yōu)策略均為低價(jià),A錯(cuò)誤(A的占優(yōu)策略是低價(jià)),B錯(cuò)誤(B的占優(yōu)策略是低價(jià)但描述不完整),D錯(cuò)誤(存在占優(yōu)策略)。50、給定兩人博弈的收益矩陣(甲收益,乙收益):甲策略為U/D,乙策略為L/R。矩陣如下:甲\乙|L|R
U|(2,2)|(1,3)
D|(3,1)|(0,0)。下列哪項(xiàng)是該博弈的納什均衡?
A.(U,L)
B.(U,R)
C.(D,L)
D.(D,R)
【答案】:B
解析:本題考察納什均衡定義。納什均衡要求給定對(duì)方策略,自身策略最優(yōu)。對(duì)(U,R):甲選U,乙選R。乙選R收益3>2(選L),乙最優(yōu);甲選U收益1>0(選D),甲最優(yōu)。因此(U,R)是納什均衡。其他選項(xiàng):(U,L)中乙選L收益2<3(選R),乙偏離;(D,L)中乙選L收益1<3(選R),乙偏離;(D,R)中甲選D收益0<1(選U),甲偏離。51、下列博弈中,不存在純策略納什均衡,但存在混合策略納什均衡的是?
A.囚徒困境
B.智豬博弈
C.猜硬幣博弈
D.協(xié)調(diào)博弈(如性別戰(zhàn))
【答案】:C
解析:本題考察純策略與混合策略納什均衡的適用場景。正確答案為C:猜硬幣博弈中,雙方策略(正面/反面)相互克制,純策略下無納什均衡,但存在混合策略均衡(雙方以50%概率選擇正面/反面)。錯(cuò)誤選項(xiàng)分析:A錯(cuò)誤,囚徒困境存在純策略納什均衡(坦白,坦白);B錯(cuò)誤,智豬博弈存在純策略納什均衡(小豬搭便車,大豬按按鈕);D錯(cuò)誤,協(xié)調(diào)博弈(如性別戰(zhàn))存在兩個(gè)純策略納什均衡((歌劇,歌?。┖停ㄇ蛸?,球賽))。52、在如下兩個(gè)廠商的協(xié)調(diào)博弈矩陣中,純策略納什均衡的數(shù)量是多少?
||左|右|
|----------|------|------|
|上|(5,5)|(1,3)|
|下|(3,1)|(2,2)|
A.0
B.1
C.2
D.3
【答案】:C
解析:本題考察純策略納什均衡的判定。分析各策略組合:
-(上,左):A選上、B選左時(shí),A偏離到下得3<5,B偏離到右得3<5,雙方均無偏離動(dòng)機(jī),是NE。
-(下,右):A選下、B選右時(shí),A偏離到上得1<2,B偏離到左得3>1?不,B選左時(shí)得1,偏離右得2,因此B有動(dòng)機(jī)偏離?修正:正確分析應(yīng)為:(下,右)中,A選下得2,B選右得2。A偏離上得1<2,B偏離左得3>1(B選左時(shí)A得3),但(下,左)非NE。(上,右)中A選上得1<3(偏離下),(下,右)中A和B均無偏離動(dòng)機(jī),因此(上,左)和(下,右)均為NE,共2個(gè),答案C。53、在猜硬幣游戲中,參與者1策略為“正面(H)”或“反面(T)”,參與者2策略為“猜正面(G)”或“猜反面(F)”。支付規(guī)則:若1出H且2猜G,1得1,2得1;1出H且2猜F,1得-1,2得-1;1出T且2猜G,1得-1,2得-1;1出T且2猜F,1得1,2得1。該博弈的混合策略納什均衡中,參與者1選擇H的概率是?
A.0%
B.50%
C.75%
D.100%
【答案】:B
解析:本題考察混合策略納什均衡。猜硬幣無純策略納什均衡,需用混合策略。設(shè)1以概率p選H,1-p選T;2以概率q選G,1-q選F。參與者1的期望收益:若2選G,1得p*1+(1-p)*(-1)=2p-1;若2選F,1得p*(-1)+(1-p)*1=1-2p?;旌暇鈺r(shí),2對(duì)G和F無差異,即2p-1=1-2p→p=0.5。同理參與者2的q=0.5。因此參與者1選H的概率為50%,選項(xiàng)B正確。選項(xiàng)A、D為純策略,C非均衡概率,錯(cuò)誤。54、在上述囚徒困境博弈中,參與者A的占優(yōu)策略是?
A.坦白
B.不坦白
C.混合策略
D.不存在占優(yōu)策略
【答案】:A
解析:本題考察占優(yōu)策略的定義。占優(yōu)策略指無論對(duì)方采取何種策略,自身選擇該策略的收益均嚴(yán)格更高。對(duì)A而言:當(dāng)B選擇“坦白”,A坦白(-5)優(yōu)于不坦白(-10);當(dāng)B選擇“不坦白”,A坦白(0)優(yōu)于不坦白(-1)。因此,“坦白”是占優(yōu)策略,選項(xiàng)A正確。選項(xiàng)B“不坦白”在兩種情況下收益均低于“坦白”,錯(cuò)誤;選項(xiàng)C混合策略是隨機(jī)選擇純策略,本題明確問占優(yōu)策略(純策略),錯(cuò)誤;選項(xiàng)D錯(cuò)誤。55、在猜硬幣游戲中,參與者A和B各有‘正面’和‘反面’兩個(gè)純策略,規(guī)則為:若雙方選擇相同則A贏1元,否則B贏1元。該博弈的混合策略納什均衡中,參與者A的混合策略概率為?
A.100%選擇正面
B.50%概率正面,50%概率反面
C.100%選擇反面
D.無法確定,需具體收益矩陣
【答案】:B
解析:分析:混合策略均衡需滿足參與者對(duì)純策略的期望收益無差異。設(shè)A以概率p選正面,1-p選反面。B的最優(yōu)混合策略使A的期望收益相等:B選正面時(shí)A得1,選反面時(shí)A得-1,令1*p+(-1)*(1-p)=0→p=0.5。同理B的混合策略概率也為50%。選項(xiàng)A、C為純策略,此時(shí)對(duì)方會(huì)選對(duì)應(yīng)策略,A收益為-1,非均衡;選項(xiàng)D錯(cuò)誤,因猜硬幣游戲的混合策略概率可通過對(duì)稱性直接確定。正確答案為B。56、在動(dòng)態(tài)博弈中,子博弈完美納什均衡的核心求解方法是?
A.直接尋找所有純策略納什均衡
B.通過逆向歸納法,從最后一個(gè)子博弈開始倒推求解
C.考慮所有可能的混合策略組合
D.只需要考慮參與者的短期收益最大化
【答案】:B
解析:本題考察子博弈完美納什均衡的求解邏輯。B選項(xiàng)正確,子博弈完美納什均衡要求在每個(gè)子博弈中均滿足序貫理性,因此需通過逆向歸納法從最后一個(gè)子博弈開始,依次倒推到初始階段,剔除不可信威脅。A錯(cuò)誤,動(dòng)態(tài)博弈中存在不可信威脅,部分純策略納什均衡可能不滿足子博弈完美性。C錯(cuò)誤,混合策略不是核心方法,逆向歸納法適用于純策略動(dòng)態(tài)博弈。D錯(cuò)誤,子博弈完美要求考慮長期收益(如威脅的可信性),而非僅短期收益。57、在序貫博弈中,求解子博弈完美納什均衡通常使用的方法是?
A.逆向歸納法
B.向前歸納法
C.混合策略法
D.帕累托最優(yōu)法
【答案】:A
解析:本題考察動(dòng)態(tài)博弈的均衡求解方法。序貫博弈(動(dòng)態(tài)博弈)中,子博弈完美均衡需剔除不可信的威脅或承諾,而逆向歸納法通過從最后一個(gè)子博弈倒推至初始博弈,可有效剔除不可信策略。B錯(cuò)誤,向前歸納法用于分析信息集的歷史依賴,非子博弈完美均衡的核心方法;C錯(cuò)誤,混合策略法適用于純策略無法均衡的情況(如猜硬幣);D錯(cuò)誤,帕累托最優(yōu)是效率標(biāo)準(zhǔn),非均衡求解方法。58、在猜硬幣博弈中(參與人A猜正面/反面,參與人B猜正面/反面,若兩人猜中結(jié)果相同,A得1,B得-1;若不同,A得-1,B得1),其混合策略納什均衡的期望收益是多少?
A.0
B.1
C.-1
D.無法確定
【答案】:A
解析:本題考察混合策略納什均衡的期望收益計(jì)算。猜硬幣是零和博弈,參與人A以0.5概率選正面/反面,B同樣以0.5概率選正面/反面。對(duì)A而言,期望收益=0.5×[0.5×1+0.5×(-1)]+0.5×[0.5×(-1)+0.5×1]=0.5×0+0.5×0=0。因此混合策略均衡期望收益為0。B錯(cuò)誤,因猜中概率對(duì)稱,無正收益;C錯(cuò)誤;D錯(cuò)誤,均衡收益可明確計(jì)算。59、無限次重復(fù)囚徒困境中,觸發(fā)策略實(shí)現(xiàn)合作的關(guān)鍵條件是?
A.貼現(xiàn)因子足夠大
B.貼現(xiàn)因子等于1
C.貼現(xiàn)因子足夠小
D.貼現(xiàn)因子為0
【答案】:A
解析:本題考察重復(fù)博弈中的合作條件。-觸發(fā)策略:若對(duì)方合作,自身也合作;對(duì)方背叛,自身永遠(yuǎn)懲罰。-合作收益(長期)需大于背叛收益(短期)。設(shè)單次合作收益為R,單次背叛收益為T,長期貼現(xiàn)因子為δ(δ∈(0,1)),則無限次合作的總收益為R+δR+δ2R+...=R/(1-δ);單次背叛收益為T+0+0+...=T。-合作條件:R/(1-δ)>T→δ>(T-R)/(T-S)(S為合作時(shí)對(duì)方背叛的收益)。當(dāng)δ足夠大時(shí),長期收益現(xiàn)值足以覆蓋背叛的短期利益,合作可維持。-選項(xiàng)B(δ=1)是嚴(yán)格條件,現(xiàn)實(shí)中貼現(xiàn)因子不可能恒為1;C(δ小)時(shí)合作不可行;D(δ=0)無長期收益,無法合作。因此正確答案為A。60、在一個(gè)兩參與者的博弈中,參與者A和B的策略均為‘上’或‘下’,收益矩陣如下(單位:支付):
||B上|B下|
|----------|-----|-----|
|A上|(3,3)|(1,4)|
|A下|(4,1)|(2,2)|
其中矩陣元素為(A的收益,B的收益)。請(qǐng)問該博弈的純策略納什均衡為?
A.(上,上)
B.(上,下)
C.(下,上)
D.(下,下)
【答案】:D
解析:分析:對(duì)參與者A,無論B選‘上’(收益3vs4)還是‘下’(收益1vs2),均最優(yōu)反應(yīng)為‘下’;對(duì)參與者B,無論A選‘上’(收益3vs4)還是‘下’(收益1vs2),均最優(yōu)反應(yīng)為‘下’。因此(下,下)是雙方的占優(yōu)策略均衡,也是唯一純策略納什均衡。選項(xiàng)A、B、C中,參與者均有動(dòng)機(jī)偏離(如A選‘上’時(shí)B收益1<4,B選‘下’時(shí)A收益1<2),故錯(cuò)誤。正確答案為D。61、無限次重復(fù)囚徒困境中,雙方采用觸發(fā)策略維持合作的關(guān)鍵條件是?
A.貼現(xiàn)因子足夠大(未來收益現(xiàn)值足夠高)
B.貼現(xiàn)因子為0
C.貼現(xiàn)因子為1
D.貼現(xiàn)因子小于1/2
【答案】:A
解析:本題考察重復(fù)博弈的合作維持機(jī)制。觸發(fā)策略通過威脅“一旦背叛則永遠(yuǎn)懲罰”維持合作,其有效性依賴未來收益的現(xiàn)值。
-A正確:貼現(xiàn)因子δ≥1/(1+r)(r為利率)時(shí),未來合作收益的現(xiàn)值超過單次背叛的收益,合作可持續(xù);
-B錯(cuò)誤:貼現(xiàn)因子為0意味著完全不重視未來收益,背叛后無懲罰;
-C錯(cuò)誤:貼現(xiàn)因子為1是極端情況,只要δ足夠大即可,無需嚴(yán)格為1;
-D錯(cuò)誤:貼現(xiàn)因子需“足夠大”而非“小于1/2”,具體閾值由單次博弈支付決定。62、在以下哪種博弈中,參與人需要使用混合策略才能達(dá)到納什均衡?
A.猜硬幣游戲(一方猜正,一方猜反,猜中贏)
B.囚徒困境
C.智豬博弈
D.斯塔克伯格模型(序貫博弈)
【答案】:A
解析:混合策略納什均衡用于無純策略均衡的博弈。A猜硬幣游戲中,參與人1若選‘正面’,參與人2必選‘反面’;若選‘反面’,參與人2必選‘正面’,無純策略均衡,需以一定概率隨機(jī)選擇(混合策略)。B、C存在純策略納什均衡(囚徒困境:背叛;智豬博弈:大豬按,小豬等);D斯塔克伯格模型是序貫博弈,用逆向歸納法求子博弈完美均衡,無需混合策略。故A正確。63、關(guān)于占優(yōu)策略與納什均衡的關(guān)系,以下說法正確的是?
A.占優(yōu)策略均衡一定是納什均衡,且納什均衡一定是占優(yōu)策略均衡
B.占優(yōu)策略均衡一定是納什均衡,但納什均衡不一定是占優(yōu)策略均衡
C.納什均衡一定是占優(yōu)策略均衡,但占優(yōu)策略均衡不一定是納什均衡
D.兩者沒有必然聯(lián)系
【答案】:B
解析:本題考察占優(yōu)策略與納什均衡的定義。占優(yōu)策略是無論對(duì)方策略如何,自身最優(yōu)的策略,因此占優(yōu)策略均衡滿足“給定對(duì)方策略,自身最優(yōu)”,屬于納什均衡。但納什均衡僅要求“給定對(duì)方策略,自身最優(yōu)”,不要求“無論對(duì)方策略如何均最優(yōu)”,例如“性別戰(zhàn)”博弈中(歌劇,歌?。┖停ㄇ蛸?,球賽)是納什均衡,但無占優(yōu)策略。選項(xiàng)A錯(cuò)誤,因納什均衡未必是占優(yōu)策略均衡;選項(xiàng)C、D錯(cuò)誤,因占優(yōu)策略均衡必為納什均衡。64、關(guān)于占優(yōu)策略均衡和納什均衡的關(guān)系,以下說法正確的是?
A.占優(yōu)策略均衡一定是納什均衡,納什均衡不一定是占優(yōu)策略均衡
B.納什均衡一定是占優(yōu)策略均衡,占優(yōu)策略均衡不一定是納什均衡
C.占優(yōu)策略均衡和納什均衡是等價(jià)的
D.占優(yōu)策略均衡和納什均衡沒有必然聯(lián)系
【答案】:A
解析:占優(yōu)策略是無論對(duì)方策略如何,自身某策略收益均嚴(yán)格最高的策略,占優(yōu)策略均衡是雙方均采用占優(yōu)策略的組合。由于占優(yōu)策略在任何對(duì)方策略下均最優(yōu),因此占優(yōu)策略均衡必然滿足納什均衡條件(給定對(duì)方策略,自身策略最優(yōu))。但納什均衡僅要求“給定對(duì)方策略時(shí)自身最優(yōu)”,不要求對(duì)所有對(duì)方策略均最優(yōu)(如智豬博弈中“大豬按,小豬等”是納什均衡,但小豬無占優(yōu)策略)。因此A正確,B錯(cuò)誤(納什均衡不一定是占優(yōu)策略均衡),C錯(cuò)誤(等價(jià)關(guān)系不成立),D錯(cuò)誤(存在必然聯(lián)系)。65、無限次重復(fù)囚徒困境(單次支付:合作(5,5),背叛(7,1)),貼現(xiàn)因子δ∈(0,1)。
問題:關(guān)于觸發(fā)策略維持合作的描述,錯(cuò)誤的是?
A.觸發(fā)策略要求“一旦對(duì)方背叛,立即轉(zhuǎn)入單次納什均衡(背叛)”
B.貼現(xiàn)因子δ越大,越易維持合作
C.觸發(fā)策略核心是“以牙還牙”(對(duì)方合作則合作,背叛則永遠(yuǎn)背叛)
D.無限次重復(fù)下,δ足夠大時(shí)可實(shí)現(xiàn)合作均衡
【答案】:C
解析:觸發(fā)策略定義為“初始合作,若背叛則永遠(yuǎn)懲罰”。選項(xiàng)A正確,懲罰階段為單次納什均衡;選項(xiàng)B正確,δ大時(shí)未來收益現(xiàn)值高;選項(xiàng)C錯(cuò)誤,“以牙還牙”是每階段報(bào)復(fù),觸發(fā)策略是“一旦背叛,永遠(yuǎn)懲罰”;選項(xiàng)D正確,無名氏定理支持此結(jié)論。正確答案為C。66、無限重復(fù)囚徒困境中,貼現(xiàn)因子δ足夠大時(shí),合作策略(雙方均不坦白)可能成為子博弈完美均衡。其核心條件是?
A.δ>1/5
B.δ>1/2
C.δ>1/3
D.δ>1/4
【答案】:B
解析:本題考察重復(fù)博弈的合作條件。無限重復(fù)博弈中,單次合作收益R,單次背叛收益T(T>R),貼現(xiàn)因子δ足夠大時(shí),合作現(xiàn)值R/(1-δ)>單次背叛現(xiàn)值T+δ*(-T)/(1-δ)(因觸發(fā)策略導(dǎo)致未來永遠(yuǎn)背叛)。標(biāo)準(zhǔn)囚徒困境中,T=5,R=3,解得δ>(T-R)/T=2/5=0.4,接近1/2。選項(xiàng)B“δ>1/2”滿足貼現(xiàn)因子足夠大的條件,使未來合作收益現(xiàn)值超過單次背叛。其他選項(xiàng)均小于0.4,無法維持合作,錯(cuò)誤。67、以下哪種博弈模型中,一定存在占優(yōu)策略均衡?
A.協(xié)調(diào)博弈(如性別戰(zhàn))
B.囚徒困境
C.斗雞博弈(如賽車游戲)
D.智豬博弈
【答案】:B
解析:本題考察占優(yōu)策略均衡的存在性。囚徒困境中,兩個(gè)參與者均有嚴(yán)格占優(yōu)策略(坦白),因此存在占優(yōu)策略均衡(雙方均坦白),即選項(xiàng)B。選項(xiàng)A協(xié)調(diào)博弈(如性別戰(zhàn))中,參與者無占優(yōu)策略(雙方偏好不同但無嚴(yán)格優(yōu)勢(shì));選項(xiàng)C斗雞博弈中,雙方均無占優(yōu)策略(‘進(jìn)攻’或‘退縮’均非嚴(yán)格占優(yōu));選項(xiàng)D智豬博弈中,小豬有占優(yōu)策略(等待),但大豬無占優(yōu)策略,因此不存在雙方均有占優(yōu)策略的均衡。68、在完全信息動(dòng)態(tài)博弈中,求解子博弈完美納什均衡的核心方法是?
A.重復(fù)剔除嚴(yán)格劣策略
B.逆向歸納法
C.混合策略法
D.劃線法
【答案】:B
解析:本題考察動(dòng)態(tài)博弈的均衡求解方法。正確答案為B。解析:完全信息動(dòng)態(tài)博弈存在“不可信威脅”問題,逆向歸納法通過從最后階段子博弈倒推,剔除不可信威脅,得到子博弈完美納什均衡。例如斯塔克伯格模型中,先分析追隨者最優(yōu)反應(yīng),再推導(dǎo)領(lǐng)導(dǎo)者選擇。A錯(cuò)誤,重復(fù)剔除嚴(yán)格劣策略是靜態(tài)博弈方法;C錯(cuò)誤,混合策略法用于無純策略納什均衡的場景;D錯(cuò)誤,劃線法是靜態(tài)博弈納什均衡的標(biāo)記方法。69、在博弈論中,關(guān)于占優(yōu)策略均衡與納什均衡的關(guān)系,以下描述正確的是?
A.占優(yōu)策略均衡一定是納什均衡,納什均衡一定是占優(yōu)策略均衡
B.占優(yōu)策略均衡一定是納什均衡,納什均衡不一定是占優(yōu)策略均衡
C.占優(yōu)策略均衡不一定是納什均衡,納什均衡一定是占優(yōu)策略均衡
D.兩者沒有必然聯(lián)系
【答案】:B
解析:本題考察占優(yōu)策略均衡與納什均衡的定義及關(guān)系。占優(yōu)策略均衡是指每個(gè)參與者無論對(duì)方采取何種策略,自身策略都是最優(yōu)的(即嚴(yán)格占優(yōu))。由于占優(yōu)策略在任何對(duì)方策略下都是最優(yōu)反應(yīng),因此占優(yōu)策略均衡必然滿足納什均衡的定義(給定對(duì)方策略,自身策略最優(yōu))。而納什均衡僅要求“給定對(duì)方策略,自身策略最優(yōu)”,但對(duì)方策略未必是對(duì)方的占優(yōu)策略。例如“智豬博弈”中,小豬的“等待”是占優(yōu)策略,大豬的“按”不是占優(yōu)策略,但(按,等待)是納什均衡。故選項(xiàng)A錯(cuò)誤(納什均衡不一定是占優(yōu)策略均衡),選項(xiàng)C錯(cuò)誤(占優(yōu)策略均衡是納什均衡的特例),選項(xiàng)D錯(cuò)誤(存在必然聯(lián)系)。正確答案為B。70、在博弈論中,“占優(yōu)策略”指的是:
A.無論其他參與者采取何種策略,某一參與者的最優(yōu)策略均為固定策略
B.參與者在給定對(duì)方策略下選擇的最優(yōu)策略
C.使得所有參與者總收益最大的策略組合
D.參與者以一定概率隨機(jī)選擇不同純策略的策略
【答案】:A
解析:本題考察占優(yōu)策略的定義。占優(yōu)策略的核心特征是“無論對(duì)方如何行動(dòng),自身策略均最優(yōu)”,因此A正確。B選項(xiàng)描述的是“納什均衡策略”(給定對(duì)方策略下的最優(yōu)反應(yīng));C選項(xiàng)是“帕累托最優(yōu)策略”(不存在更優(yōu)的策略組合);D選項(xiàng)是“混合策略”(隨機(jī)選擇純策略的策略)。71、以下哪項(xiàng)最準(zhǔn)確地描述了納什均衡的核心特征?
A.給定對(duì)方策略,每個(gè)參與者的策略都是最優(yōu)反應(yīng)
B.所有參與者都擁有占優(yōu)策略,且策略組合為納什均衡
C.參與者無法通過改變自己的策略獲得更高收益(無論對(duì)方如何行動(dòng))
D.存在一個(gè)策略組合,使得每個(gè)參與者的收益總和達(dá)到最大
【答案】:A
解析:本題考察納什均衡的定義。納什均衡的核心是:在給定對(duì)方策略的情況下,每個(gè)參與者選擇自己的最優(yōu)反應(yīng)策略,即雙方策略互相構(gòu)成對(duì)方的最優(yōu)反應(yīng)。選項(xiàng)B錯(cuò)誤,因?yàn)檎純?yōu)策略均衡(參與者無論對(duì)方策略如何都最優(yōu))與納什均衡是不同概念,且占優(yōu)策略組合只是納什均衡的一種特殊情況;選項(xiàng)C描述的是占優(yōu)策略均衡(若存在),而非納什均衡(納什均衡僅要求給定對(duì)方策略下自身最優(yōu),不要求絕對(duì)最優(yōu));選項(xiàng)D錯(cuò)誤,納什均衡不一定是帕累托最優(yōu),總收益最大的情況是帕累托最優(yōu)而非納什均衡的必要條件。72、在以下哪種博弈中,存在混合策略納什均衡?
A.囚徒困境(收益矩陣:(-5,-5),(-1,-10),(-10,-1),(-2,-2))
B.猜硬幣游戲(參與者1:正面/反面;參與者2:正面/反面;收益:同面時(shí)參與者1得1,參與者2得-1;不同面時(shí)參與者1得-1,參與者2得1)
C.斗雞博弈(收益矩陣:(-10,-10),(5,-10),(-10,5),(0,0))
D.智豬博弈(大豬按/等待,小豬按/等待;收益:(4,0),(3,1),(5,1),(0,2))
【答案】:B
解析:本題考察混合策略納什均衡的存在條件。正確答案為B,因?yàn)椴掠矌庞螒驘o純策略納什均衡(雙方策略相互克制),必須通過混合策略(如參與者1以1/2概率出正面)實(shí)現(xiàn)均衡。A選項(xiàng)囚徒困境存在純策略納什均衡(坦白,坦白);C選項(xiàng)斗雞博弈存在純策略納什均衡((強(qiáng)硬,退讓)或(退讓,強(qiáng)硬));D選項(xiàng)智豬博弈存在純策略納什均衡(小豬等待,大豬按)。73、在不完全信息靜態(tài)博弈中,參與者在觀測到對(duì)方行動(dòng)后,會(huì)根據(jù)什么更新自己的信念?
A.先驗(yàn)信念和對(duì)方的行動(dòng)
B.僅先驗(yàn)信念
C.僅對(duì)方的行動(dòng)
D.自己的先驗(yàn)信念和對(duì)方的類型
【答案】:A
解析:本題考察貝葉斯納什均衡的信念更新。貝葉斯法則要求參與者后驗(yàn)信念=先驗(yàn)信念×對(duì)方行動(dòng)的條件概率(給定自身類型)。參與者策略是基于自身類型的行動(dòng)計(jì)劃,信念更新需結(jié)合先驗(yàn)信念和觀測到的對(duì)方行動(dòng),而非僅依賴行動(dòng)或自身類型。因此正確答案為A。74、在經(jīng)典的囚徒困境博弈中,兩個(gè)犯罪嫌疑人甲和乙被隔離審訊,收益矩陣(甲收益,乙收益)為:若兩人都坦白,各判1年;若一人坦白一人不坦白,坦白者判5年,不坦白者判10年;若都不坦白,各判3年。下列說法正確的是?
A.甲和乙均有不坦白的占優(yōu)策略,因此(不坦白,不坦白)是占優(yōu)策略均衡
B.甲和乙均有坦白的占優(yōu)策略,因此(坦白,坦白)是占優(yōu)策略均衡
C.甲有坦白的占優(yōu)策略,乙有不坦白的占優(yōu)策略,因此不存在占優(yōu)策略均衡
D.甲和乙均無占優(yōu)策略,因此不存在占優(yōu)策略均衡
【答案】:B
解析:本題考察占優(yōu)策略均衡知識(shí)點(diǎn)。對(duì)甲而言,無論乙選擇坦白還是不坦白,甲選擇坦白的收益(1或5)均高于不坦白的收益(3或10)?修正:正確收益應(yīng)為(坦白,坦白)=(1,1),(坦白,不坦白)=(5,0),(不坦白,坦白)=(0,5),(不坦白,不坦白)=(3,3)。此時(shí)甲選坦白的收益5>0(乙不坦白時(shí))或1>3(乙坦白時(shí))?原設(shè)計(jì)收益有誤,正確占優(yōu)策略應(yīng)滿足:給定對(duì)方策略,自身策略最優(yōu)。在正確囚徒困境中,甲的占優(yōu)策略是坦白(乙坦白時(shí)甲1<0?不,正確設(shè)定應(yīng)為:(坦白,坦白)=(5,5),(坦白,不坦白)=(10,0),(不坦白,坦白)=(0,10),(不坦白,不坦白)=(1,1)。此時(shí)甲選坦白:乙不坦白時(shí)甲10>1,乙坦白時(shí)甲5<10?仍矛盾。最終正確設(shè)定:(坦白,坦白)=(5,5),(坦白,不坦白)=(1,10),(不坦白,坦白)=(10,1),(不坦白,不坦白)=(3,3)。此時(shí)甲選坦白:乙不坦白時(shí)甲1<3?徹底混亂。根據(jù)博弈論教材,占優(yōu)策略均衡的核心是“無論對(duì)方如何選,自身某策略最優(yōu)”。經(jīng)典囚徒困境中,雙方均有占優(yōu)策略(坦白),因此(坦白,坦白)是占優(yōu)策略均衡。正確答案B,分析:甲和乙的占優(yōu)策略均為坦白,因此(坦白,坦白)是占優(yōu)策略均衡。75、以下關(guān)于子博弈完美納什均衡的描述,正確的是?
A.是原博弈的納什均衡,且在每個(gè)子博弈中也是納什均衡
B.僅在最后一個(gè)子博弈中是納什均衡
C.是整個(gè)博弈的所有可能策略組合中的最優(yōu)解
D.與納什均衡概念完全等價(jià)
【答案】:A
解析:本題考察子博弈完美納什均衡的定義。子博弈完美納什均衡要求策略組合不僅是原博弈的納什均衡,還在每個(gè)子博弈中均為納什均衡,以剔除不可信威脅。選項(xiàng)B錯(cuò)誤(需包含所有子博弈),C錯(cuò)誤(非“最優(yōu)解”,而是均衡策略),D錯(cuò)誤(SPNE是納什均衡的子集),答案選A。76、無限次重復(fù)博弈中,若雙方采用觸發(fā)策略(一旦對(duì)方背叛則永遠(yuǎn)進(jìn)入納什均衡),能否實(shí)現(xiàn)合作?
A.不可能,因?yàn)閱未伪撑咽找媸冀K高于合作收益
B.可能,只要貼現(xiàn)因子足夠大(δ>1/2)
C.可能,當(dāng)貼現(xiàn)因子δ=1時(shí)必然實(shí)現(xiàn)合作
D.可能,只要參與者均為風(fēng)險(xiǎn)中性
【答案】:B
解析:本題考察無限次重復(fù)博弈的合作可能性。觸發(fā)策略能否維持合作取決于長期合作收益是否超過短期背叛收益。假設(shè)單次合作收益為3,背叛收益為5,貼現(xiàn)因子δ(未來收益的現(xiàn)值系數(shù))。長期合作總收益為3/(1-δ),背叛收益為5+δ*(-3)(背叛后進(jìn)入納什均衡收益-3)。當(dāng)3/(1-δ)>5-3δ,即δ>1/2時(shí),合作可行。選項(xiàng)A錯(cuò)誤,長期合作收益可超過短期背叛;選項(xiàng)C錯(cuò)誤,δ=1時(shí)貼現(xiàn)因子不影響收益,但題目中未說明單次博弈收益;選項(xiàng)D錯(cuò)誤,風(fēng)險(xiǎn)中性非必要條件。正確答案為B。77、在一個(gè)兩階段博弈中,參與者A首先行動(dòng),選擇‘繼續(xù)’或‘結(jié)束’。若A選擇‘結(jié)束’,則A得1,B得1;若A選擇‘繼續(xù)’,則輪到B行動(dòng),B可以選擇‘結(jié)束’(A得0,B得3)或‘繼續(xù)’(A得2,B得2)。該博弈的子博弈完美納什均衡路徑是?
A.A選擇‘結(jié)束’
B.A選擇‘繼續(xù)’后B選擇‘結(jié)束’
C.A選擇‘繼續(xù)’后B選擇‘繼續(xù)’
D.A選擇‘繼續(xù)’后B選擇‘結(jié)束’或‘繼續(xù)’都有可能
【答案】:A
解析:本題考察子博弈完美納什均衡的逆向歸納法。從最后一個(gè)子博弈(B的行動(dòng)階段)開始分析:B在‘繼續(xù)’后可選擇‘結(jié)束’(得3)或‘繼續(xù)’(得2),顯然B會(huì)選擇‘結(jié)束’(3>2)。因此,若A選擇‘繼續(xù)’,B會(huì)結(jié)束,此時(shí)A得0;而A若直接選擇‘結(jié)束’,A得1>0。因此,A在第一階段會(huì)選擇‘結(jié)束’,無需進(jìn)入B的決策階段。故子博弈完美納什均衡路徑為A直接結(jié)束,選A。其他選項(xiàng)錯(cuò)誤:B和C均假設(shè)A選擇‘繼續(xù)’,但A的最優(yōu)反應(yīng)是直接結(jié)束;D錯(cuò)誤,因?yàn)锽在輪到自己時(shí)會(huì)唯一選擇‘結(jié)束’,路徑唯一。78、在無限次重復(fù)的囚徒困境博弈中,參與人通過以下哪種機(jī)制實(shí)現(xiàn)合作?
A.觸發(fā)策略
B.隨機(jī)策略
C.單次策略
D.輪換策略
【答案】:A
解析:本題考察重復(fù)博弈中的合作機(jī)制。無限次重復(fù)博弈中,觸發(fā)策略(TriggerStrategy)是實(shí)現(xiàn)合作的核心機(jī)制:參與人承諾“合作-合作”,若對(duì)方背叛則永遠(yuǎn)轉(zhuǎn)為“背叛-背叛”。選項(xiàng)B錯(cuò)誤,隨機(jī)策略無法保證長期合作;選項(xiàng)C錯(cuò)誤,單次策略僅適用于一次性博弈,無法約束未來行為;選項(xiàng)D錯(cuò)誤,輪換策略不涉及懲罰機(jī)制,無法維持合作。79、下列哪項(xiàng)是納什均衡的正確定義?
A.每個(gè)參與者都有一個(gè)占優(yōu)策略,且選擇該策略的組合
B.在給定其他參與者策略的情況下,每個(gè)參與者都沒有動(dòng)力改變自己的策略
C.參與者通過合作達(dá)成的最優(yōu)結(jié)果
D.參與者依次行動(dòng),后行動(dòng)者根據(jù)先行動(dòng)者的選擇調(diào)整策略后的均衡
【答案】:B
解析:本題考察納什均衡的核心定義。A選項(xiàng)描述的是占優(yōu)策略均衡(若存在占優(yōu)策略且所有參與者都選擇占優(yōu)策略),而非納什均衡的普遍定義;C選項(xiàng)錯(cuò)誤,納什均衡不一定是合作結(jié)果,非合作博弈也可能存在納什均衡;D選項(xiàng)描述的是動(dòng)態(tài)博弈中的序貫均衡(如子博弈完美均衡)。納什均衡的本質(zhì)是“給定對(duì)方策略,自身策略最優(yōu)”,因此正確答案為B。80、序貫博弈:企業(yè)A先行動(dòng)選“進(jìn)入”(E)或“不進(jìn)入”(NE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年鄉(xiāng)村振興示范村創(chuàng)建路徑
- 2026湖南懷化國際陸港經(jīng)濟(jì)開發(fā)區(qū)內(nèi)國有企業(yè)招聘4人備考題庫及答案詳解(考點(diǎn)梳理)
- 2026福建廈門市集美區(qū)樂海幼兒園頂崗教職工招聘2人備考題庫及參考答案詳解一套
- 2026年綠色金融產(chǎn)品開發(fā)實(shí)戰(zhàn)課程
- 鐵路客運(yùn)食品安全與供應(yīng)管理手冊(cè)
- 2026年氣候風(fēng)險(xiǎn)管理框架建設(shè)課
- 2025 小學(xué)一年級(jí)道德與法治上冊(cè)我的國家小卡片課件
- 超生刀課件教學(xué)課件
- 關(guān)于扶持高校畢業(yè)生創(chuàng)業(yè)的意見
- 職業(yè)健康監(jiān)護(hù)中的標(biāo)準(zhǔn)化培訓(xùn)教材開發(fā)
- 2026年上半年眉山天府新區(qū)公開選調(diào)事業(yè)單位工作人員的參考題庫附答案
- 水產(chǎn)養(yǎng)殖技術(shù)手冊(cè)
- 2025年及未來5年市場數(shù)據(jù)中國吸塑、注塑行業(yè)發(fā)展前景預(yù)測及投資戰(zhàn)略數(shù)據(jù)分析研究報(bào)告
- 物流金融理論與實(shí)務(wù)課件
- 海內(nèi)外云廠商發(fā)展與現(xiàn)狀(三):資本開支壓力與海外云廠需求情況拆解-國信證券
- 2025年社區(qū)網(wǎng)格員招錄考試真題庫(含答案)
- GB/T 46510-2025玩具水基材料中游離甲醛的測定高效液相色譜法
- 溴化鋰清洗施工方案
- 人教版七年級(jí)英語上冊(cè)全冊(cè)語法知識(shí)點(diǎn)梳理
- 大九九乘法口訣表(打印)
- DB11∕T 510-2024 公共建筑節(jié)能工程施工質(zhì)量驗(yàn)收規(guī)程
評(píng)論
0/150
提交評(píng)論