2025年大學(xué)《數(shù)理基礎(chǔ)科學(xué)》專業(yè)題庫- 博弈論基礎(chǔ)概念介紹_第1頁
2025年大學(xué)《數(shù)理基礎(chǔ)科學(xué)》專業(yè)題庫- 博弈論基礎(chǔ)概念介紹_第2頁
2025年大學(xué)《數(shù)理基礎(chǔ)科學(xué)》專業(yè)題庫- 博弈論基礎(chǔ)概念介紹_第3頁
2025年大學(xué)《數(shù)理基礎(chǔ)科學(xué)》專業(yè)題庫- 博弈論基礎(chǔ)概念介紹_第4頁
2025年大學(xué)《數(shù)理基礎(chǔ)科學(xué)》專業(yè)題庫- 博弈論基礎(chǔ)概念介紹_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2025年大學(xué)《數(shù)理基礎(chǔ)科學(xué)》專業(yè)題庫——博弈論基礎(chǔ)概念介紹考試時(shí)間:______分鐘總分:______分姓名:______一、簡述博弈論研究的主要對象和特點(diǎn)。二、在一個簡單的囚徒困境博弈中,如果兩個囚徒都選擇沉默(不招供),他們各自會得到1年的監(jiān)禁。如果兩人都選擇招供(背叛),每人會得到3年的監(jiān)禁。如果一人招供,另一人沉默,則招供者獲得自由,沉默者得到5年的監(jiān)禁。請用文字描述這個博弈的基本要素(參與者、策略、支付),并解釋為什么這個博弈存在一個納什均衡,即使這個均衡的結(jié)果對兩個囚徒來說都比都選擇沉默差。三、什么是納什均衡?請解釋在戰(zhàn)略式博弈中,一個策略組合成為納什均衡的含義。為什么納什均衡被認(rèn)為是分析非合作博弈的重要工具?四、假設(shè)一個博弈只有兩個參與者,稱為A和B。參與者A有兩個可選策略:上(U)和下(D)。參與者B有兩個可選策略:左(L)和右(R)。支付由以下方式?jīng)Q定:如果A選擇上且B選擇左,A得到3,B得到1;如果A選擇上且B選擇右,A得到0,B得到0;如果A選擇下且B選擇左,A得到1,B得到2;如果A選擇下且B選擇右,A得到2,B得到3。請描述參與者A的支付,并解釋為什么這個博弈可能存在多個純策略納什均衡。在不使用博弈矩陣的情況下,請嘗試描述這個博弈并找出所有的純策略納什均衡。五、什么是擴(kuò)展式博弈?它與戰(zhàn)略式博弈的主要區(qū)別是什么?請簡要說明擴(kuò)展式博弈中“信息集”和“決策結(jié)點(diǎn)”的概念。六、在一個簡單的兩人序貫博弈(擴(kuò)展式博弈)中,參與者A首先行動,可以選擇左邊(L)或右邊(R)。如果A選擇左邊,參與者B會得到3,自己得到1;如果A選擇右邊,參與者B會得到1,自己得到3。參與者B在得知A的選擇后進(jìn)行反應(yīng),可以選擇接受(A)或拒絕(R)。如果B接受,博弈結(jié)束,A得到2,B得到其行動帶來的支付;如果B拒絕,雙方都得到0。請用文字描述這個博弈的順序、關(guān)鍵節(jié)點(diǎn)和支付,并解釋為什么逆向歸納法是求解這類擴(kuò)展式博弈子博弈精煉納什均衡的常用方法。請嘗試找出這個博弈的子博弈精煉納什均衡。七、簡述子博弈精煉納什均衡的概念,并解釋為什么在分析序貫博弈時(shí),它比納什均衡更為精確。請說明為什么逆向歸納法得到的均衡滿足子博弈精煉納什均衡的要求。八、重復(fù)囚徒困境博弈與一次性囚徒困境博弈的主要區(qū)別是什么?解釋為什么在重復(fù)囚徒困境中,即使一次性博弈的納什均衡是雙方都背叛,也可能會出現(xiàn)雙方都傾向于合作的策略(例如“以牙還牙”策略)。合作在重復(fù)博弈中是如何維持的?試卷答案一、博弈論研究的是多個決策主體在互動情況下的決策行為及其結(jié)果。其特點(diǎn)在于強(qiáng)調(diào)決策的互動性和策略性,即每個參與者的最優(yōu)選擇不僅取決于自身的偏好和決策,還取決于其他參與者的可能決策。博弈論通過建立數(shù)學(xué)模型來分析這種互動,關(guān)注均衡結(jié)果、策略選擇和激勵兼容等問題。二、該博弈的基本要素如下:*參與者:兩個囚徒,分別稱為囚徒1和囚徒2。*策略:每個囚徒有兩個策略:沉默(不招供)和招供(背叛)。*支付:支付以年監(jiān)禁數(shù)表示,格式為(囚徒1支付,囚徒2支付)。例如,(沉默,沉默)->(1,1);(招供,沉默)->(0,5);(沉默,招供)->(5,0);(招供,招供)->(3,3)。這個博弈存在一個納什均衡,即兩個囚徒都選擇招供((招供,招供))。這是因?yàn)椋瑹o論對方選擇沉默還是招供,對于每個囚徒來說,選擇招供都是他們的最佳策略。具體來說,如果囚徒2選擇沉默,囚徒1選擇招供得到0年,選擇沉默得到1年,招供更好;如果囚徒2選擇招供,囚徒1選擇招供得到3年,選擇沉默得到5年,招供仍然更好。對囚徒2同理。因此,(招供,招供)是納什均衡,因?yàn)閚eitherplayercanunilaterallydeviateandimprovetheirownpayoffgiventheotherplayer'sstrategy.盡管這個均衡的結(jié)果(各判3年)比雙方都沉默的結(jié)果(各判1年)差,但它是雙方在給定對方策略下的理性選擇。三、納什均衡是指在一個博弈中,每個參與者都選擇了最優(yōu)策略,并且沒有任何參與者可以通過單方面改變自己的策略來提高自己的支付(收益)。換句話說,對于任何一個參與者i,策略Si*是對所有其他參與者策略組合S-J*的最優(yōu)反應(yīng),其中S-J*是除了參與者i之外所有其他參與者的策略組合。在戰(zhàn)略式博弈中,這意味著在納什均衡策略組合(S1*,S2*,...,Sn*)下,對于任何參與者i,有Si*是對(S1*,...,Si-1*,S'i,Si+1*,...,Sn*)的最優(yōu)反應(yīng),而S'i不是對(S1*,...,Si-1*,S1*,Si+1*,...,Sn*)的最優(yōu)反應(yīng)。納什均衡是分析非合作博弈的重要工具,因?yàn)樗峁┝艘粋€預(yù)測參與者行為的基準(zhǔn):在納什均衡狀態(tài)下,參與者沒有動機(jī)去偏離他們當(dāng)前選擇的策略,這反映了在非合作環(huán)境下的一種穩(wěn)定狀態(tài)或“默契”。四、參與者A的支付描述:*如果B選擇左,A選擇上,A得到3;A選擇下,A得到1。*如果B選擇右,A選擇上,A得到0;A選擇下,A得到2。(注:題目要求不使用博弈矩陣,但描述支付是分析的基礎(chǔ)。此處以文字描述A的支付情況。)這個博弈可能存在多個純策略納什均衡。例如,如果A選擇上,那么B會選擇左(因?yàn)锽選擇左得到1,選擇右得到0),此時(shí)A的支付是3。對于B來說,如果A選擇上,B選擇左是1,選擇右是0,所以B會選擇左。此時(shí),(上,左)是一個納什均衡,因?yàn)锳不能通過單方面改為下來提高自己的支付(從3降到2),B也不能通過單方面改為右來提高自己的支付(從1降到0)。如果A選擇下,那么B會選擇右(因?yàn)锽選擇左得到2,選擇右得到3),此時(shí)A的支付是2。對于B來說,如果A選擇下,B選擇左得到2,選擇右得到3,所以B會選擇右。此時(shí),(下,右)是一個納什均衡,因?yàn)锳不能通過單方面改為上來提高自己的支付(從2降到0),B也不能通過單方面改為左來提高自己的支付(從3降到2)。因此,這個博弈存在至少兩個純策略納什均衡:(上,左)和(下,右)。在不使用博弈矩陣的情況下,可以通過分析每個參與者在對方選擇不同策略時(shí)的最優(yōu)反應(yīng)來找出所有純策略納什均衡。對于均衡(上,左):A選擇上是對B選擇左的最優(yōu)反應(yīng)(3>1),B選擇左是對A選擇上的最優(yōu)反應(yīng)(1>0)。對于均衡(下,右):A選擇下是對B選擇右的最優(yōu)反應(yīng)(2>0),B選擇右是對A選擇下的最優(yōu)反應(yīng)(3>2)。五、擴(kuò)展式博弈是一種用來描述序貫決策(即按時(shí)間順序進(jìn)行的決策)的博弈模型。它使用博弈樹來表示博弈的進(jìn)程,其中節(jié)點(diǎn)代表決策點(diǎn)或信息集,邊代表行動或結(jié)果。擴(kuò)展式博弈可以包含不完美信息(即參與者不完全了解其他參與者的狀態(tài)或決策),而戰(zhàn)略式博弈通常假設(shè)信息是完全的。主要區(qū)別在于表示方法(擴(kuò)展式用博弈樹,戰(zhàn)略式用矩陣)以及對信息假設(shè)的不同(擴(kuò)展式可以處理不完美信息,戰(zhàn)略式通常假設(shè)完全信息)。“信息集”是指一個決策者在進(jìn)行決策時(shí)所能獲得的信息狀態(tài)集合,在博弈樹上表現(xiàn)為一個包含多個節(jié)點(diǎn)的集合。如果決策者在一個信息集內(nèi)行動,他不知道自己確切處于該信息集的哪個節(jié)點(diǎn),只知道他處于該信息集內(nèi)。“決策結(jié)點(diǎn)”是指博弈樹中代表參與者需要做出決策的點(diǎn)。六、在這個簡單的兩人序貫博弈(擴(kuò)展式博弈)中:*順序:參與者A首先行動,做出選擇L或R。*關(guān)鍵節(jié)點(diǎn):存在兩個決策結(jié)點(diǎn),一個在A處(L或R),一個在B處(僅在A選擇R后才出現(xiàn),選擇接受A或拒絕A)。*支付:如題所述,A選擇L時(shí),B支付3,A支付1;A選擇R時(shí),B支付1,A支付3。B接受時(shí),A支付2,B支付其行動帶來的支付(A選擇L時(shí)為3,A選擇R時(shí)為1)。B拒絕時(shí),雙方都支付0。該博弈是序貫的,參與者行動有先后順序。逆向歸納法是求解這類擴(kuò)展式博弈子博弈精煉納什均衡的常用方法,因?yàn)樗诶硇詤⑴c者假設(shè),認(rèn)為參與者在每個決策點(diǎn)都會選擇對自己最優(yōu)的行動。具體步驟是:從博弈的最后一個決策點(diǎn)(如果存在)開始,向后推導(dǎo)每個決策者的最優(yōu)選擇,然后移動到前一個決策點(diǎn),重復(fù)此過程直到第一個決策點(diǎn)。對于本題:1.如果A選擇右(R),那么輪到B決策。B看到自己的支付:如果接受(A=2,B=1),如果拒絕(0,0)。B會選擇接受,因?yàn)?>0。所以,如果A選擇R,博弈將走到B接受,結(jié)果為(A=2,B=1)。2.如果A選擇左(L),那么輪到B決策。B看到自己的支付:如果接受(A=1,B=3),如果拒絕(0,0)。B會選擇接受,因?yàn)?>0。所以,如果A選擇L,博弈將走到B接受,結(jié)果為(A=1,B=3)。3.現(xiàn)在輪到A決策。A知道如果選擇L,最終結(jié)果是(A=1,B=3)。如果選擇R,最終結(jié)果是(A=2,B=1)。A會選擇支付更高的策略,即選擇R。因此,子博弈精煉納什均衡是A選擇右,B在A選擇右時(shí)接受。結(jié)果是(A=2,B=1)。七、子博弈精煉納什均衡是在納什均衡概念的基礎(chǔ)上,用于分析序貫博弈(擴(kuò)展式博弈)的更精確的均衡概念。它要求均衡策略組合在每一個子博弈中都構(gòu)成納什均衡。一個子博弈是指原博弈樹中一個包含初始節(jié)點(diǎn)和一個終端節(jié)點(diǎn)(且不包括任何其他終端節(jié)點(diǎn))的子樹。納什均衡可能包含不合理的威脅(即參與者宣布在某些情況下會采取對自身不利但阻止他人偏離的策略,這些策略在現(xiàn)實(shí)中不會執(zhí)行)。子博弈精煉納什均衡通過要求參與者只在“真正可能被達(dá)到”的子博弈中采取納什均衡策略來排除這些不合理性。換句話說,子博弈精煉納什均衡是原博弈的一個納什均衡,且對于博弈中每個子博弈,該策略組合也是該子博弈的納什均衡。逆向歸納法正是求解滿足子博弈精煉納什均衡要求的方法。通過逆向歸納法得到的均衡,確保了在博弈的每一個階段,當(dāng)決策者行動時(shí),他們都是根據(jù)當(dāng)時(shí)的信息做出了對自己最優(yōu)的選擇,因此排除了包含不可信威脅的納什均衡。八、重復(fù)囚徒困境博弈與一次性囚徒困境博弈的主要區(qū)別在于博弈的次數(shù)或重復(fù)期。一次性囚徒困境是參與者之間只進(jìn)行一次決策互動。在一次性博弈中,由于博弈只有一次,參與者沒有未來互動可以影響當(dāng)前決策,因此每個參與者的最優(yōu)策略都是betrayal(背叛),即納什均衡是雙方背叛。在重復(fù)囚徒困境中,參與者進(jìn)行多輪決策互動,知道未來的博弈依賴于當(dāng)前的選擇。這使得合作(cooperation)成為可能,即使合作在單次博弈中不是最優(yōu)策

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論