構(gòu)建策略情境模型

上傳人：4*** IP屬地：湖北上傳時(shí)間：2022-10-10 格式：PPT 頁(yè)數(shù)：67 大小：4.99MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩62頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論內(nèi)容的邏輯結(jié)構(gòu)第一部分博弈論概述（策略情境的構(gòu)建）第二部分求解策略式博弈第三部分求解擴(kuò)展式博弈第四部分不完全信息博弈第五部分重復(fù)博弈第六部分演化博弈2 構(gòu)建策略情境模型博弈論研究的是當(dāng)人們處于相互依存的環(huán)境下（策略情境）的決策問(wèn)題。建一個(gè)模型以便我們可以用博弈論來(lái)分析這種復(fù)雜的相互依賴(lài)關(guān)系；模型所包含問(wèn)題的方法。本章聚焦于第一個(gè)問(wèn)題：利用博弈論構(gòu)建策略情境下一章主要研究：如何求解這些博弈模型為此，我們首先需要構(gòu)然后我們需要學(xué)習(xí)用以解決這一在博弈論框架下構(gòu)建策略情境主要有兩種方法擴(kuò)展式（對(duì)策略情境中參與者面臨的序列選擇的描述）策略式（比擴(kuò)展式抽象，但策略式簡(jiǎn)潔更

2、便于分析）此外，信息是進(jìn)行策略博弈中的一種重要元素因此，在構(gòu)建策略情境中要區(qū)分區(qū)分完美信息與不完美信息兩種情況。最后，參與人的特征、策略、共同知識(shí)等也是是構(gòu)建策略情境不可或缺的概念，需要了解。本章主要內(nèi)容 2.1 擴(kuò)展式博弈：完美信息 2.2 擴(kuò)展式博弈：不完美信息 2.3 策略是什么 2.4 策略式博弈 2.5 擴(kuò)展式轉(zhuǎn)化為策略式 2.6 策略式轉(zhuǎn)化為擴(kuò)展式 2.7 共同知識(shí)及模擬博弈時(shí)的其他問(wèn)題關(guān)于博弈中參與人的心理狀況（假定）策略情境是由特定環(huán)境下人們之間的相互作用決定的，與人進(jìn)行基本定義。盡管對(duì)人的描述可以從多個(gè)角度進(jìn)行，但是在多數(shù)情況下，理解和預(yù)測(cè)人們的行為只需要清楚關(guān)于參

3、與人的兩個(gè)主要特征（的假定）：偏好信念為了構(gòu)建和分析策略博弈，需要首先對(duì)參（人們進(jìn)行博弈就是根據(jù)自己的偏好進(jìn)行選擇）（互動(dòng)下的選擇要求對(duì)其他參與人偏好有認(rèn)識(shí)） 1. 偏好“在參與人面對(duì)兩個(gè)選擇時(shí)，總是可以肯定自己更喜歡哪一個(gè)，或者兩者都喜歡。關(guān)于參與人的偏好的第一個(gè)假定：關(guān)于參與人偏好的第二個(gè)假定是：一個(gè)人的偏好有一定的一貫性。對(duì)于如何描述決策者的偏好有兩種方式：一種是對(duì)每組可能的“行動(dòng)”，指定決策者喜歡的選擇，或者表明決策者在不同選擇之間覺(jué)得無(wú)所謂。另外我們可以借用“支付函數(shù)”來(lái)描述偏好，也就是將所有的選擇賦予特定的數(shù)值，以代表這些選擇的效用，數(shù)字大的行動(dòng)更受到偏愛(ài)。以如下表示：

4、如果對(duì)A中的行動(dòng)a和B中的行動(dòng)b，有決策者偏好可所以根據(jù)該表就可以清楚地看到能對(duì)格瑞斯產(chǎn)生最大效用的選擇電報(bào)電話公司。某個(gè)人的偏好取決于很多因素，比如成長(zhǎng)環(huán)境和過(guò)程等等。我們這里只關(guān)心偏好是如何影響人的行為的。在很多情況下，效應(yīng)并非僅僅取決于決策者本人，他還要受到其他人的影響。2 信念這意味著一個(gè)人在選擇最優(yōu)服務(wù)商時(shí)，要考慮其經(jīng)常與誰(shuí)通話因此，為了做出最佳選擇，格瑞斯首先要明確麗莎的選擇由此推導(dǎo)出參與博弈的人必須具備的第二個(gè)特征對(duì)其他參與者可能做出選擇的信念這種信念的產(chǎn)生有兩種途徑：聰明的與愚蠢的愚蠢的途徑是一種簡(jiǎn)單的經(jīng)驗(yàn)行為，也就是人們通過(guò)不斷重復(fù)的相互作用，對(duì)另一個(gè)人可能采取的行

5、為做出正確或錯(cuò)誤的判斷。通過(guò)智慧的路徑形成的信念稱(chēng)為模擬內(nèi)省內(nèi)省是對(duì)自我思想和感受的一種測(cè)試，模擬內(nèi)省就是一個(gè)人通過(guò)模擬另一個(gè)人的內(nèi)省過(guò)程，形成對(duì)其未來(lái)行為的判斷。在博弈論的研究中，模擬內(nèi)省是一種默認(rèn)的獲得信念的方法。模擬內(nèi)省如何發(fā)揮作用要想獲得洞穿別人想法的能力，首先要學(xué)會(huì)自我認(rèn)識(shí)也就是認(rèn)識(shí)到自身的存在。僅僅會(huì)思考還不夠，還要學(xué)會(huì)思考別人所思考的。想別人之所想并非容易做到，需要具備心理學(xué)上所說(shuō)的心智理論機(jī)制具備完整心智理論機(jī)制意味著你要認(rèn)識(shí)到，如同你所想別人所想一樣，別人就可能也在想你所想。完備的心智理論機(jī)制是博弈論制定策略的精髓，它也導(dǎo)致了所謂“無(wú)窮后退”的出現(xiàn)。我們前面討

6、論了人們?cè)谀男┓矫媸窍嗨频模悍侠碚撘?guī)范的偏好、自我認(rèn)知和完整的心智理論機(jī)制下面我們要研究的是人們之間有什么不同？3 參與者有何區(qū)別人身上的三個(gè)方面差別與博弈論有特別的聯(lián)系。首先，人們之間的偏好存在差異；機(jī)會(huì)不同，第三，人們獲取的信息不同，最后，人們?cè)趽碛械募记缮弦泊嬖诓町?。而人門(mén)無(wú)論在策略抉擇上，還是在計(jì)劃實(shí)施上，都會(huì)用到技巧。具有其次，每個(gè)人的選擇和技巧的構(gòu)成要素有天賦、機(jī)敏、沉著、詭辯等等?，F(xiàn)實(shí)中人們具有的技巧怎樣？人們之間的差異有多大？參與者不會(huì)被假定為像愛(ài)因斯坦那樣聰明，也不會(huì)被假定是像憨豆那樣的笨人。我們假定參與人至少具有一定的識(shí)別力和變通力，即智力健全。另一個(gè)問(wèn)題

7、是我們是否允許參與者使用花樣繁多的技巧。博弈論的一個(gè)關(guān)鍵假設(shè)是，人們都有著相似的技巧也就是策略性的行為限定于一定程度的博弈領(lǐng)域中。雖然，現(xiàn)實(shí)中某人有可能因?yàn)閾碛懈噙x擇或掌握信息而占有優(yōu)勢(shì)，但根據(jù)博弈論的假設(shè)，任何人都沒(méi)有高出正常人的智慧。答案是否定的。2.1 擴(kuò)展式博弈：完美信息我們通過(guò)構(gòu)建一個(gè)綁架博弈模型來(lái)學(xué)習(xí)如何構(gòu)建博弈理論模型博弈論的主要目的是在于推導(dǎo)人們行為背后的動(dòng)機(jī)，因此博弈模型應(yīng)側(cè)重于體現(xiàn)個(gè)體所做的決定。在描述這個(gè)綁架情境時(shí)，模型應(yīng)涉及以下幾個(gè)問(wèn)題：蓋伊和薇薇卡何時(shí)采取行動(dòng)？當(dāng)他們行動(dòng)時(shí)有幾種可供選擇的行動(dòng)方案？當(dāng)他們采取行動(dòng)時(shí)掌握的信息是什么？這個(gè)模型稱(chēng)為決策樹(shù)決策樹(shù)

8、的分析由上而下（左右）每個(gè)點(diǎn)叫決策節(jié)點(diǎn)這些節(jié)點(diǎn)代表博弈中在某個(gè)點(diǎn)某些人需要做出選擇從決策點(diǎn)延伸出來(lái)的線是一系列分枝每個(gè)分枝代表可供選擇的一種方案選擇一個(gè)分枝代表選擇一個(gè)行動(dòng)方案First, Guy needs to decide whether to kidnap Orlando.首先，蓋伊選擇綁架還是不綁架博弈結(jié)束Second, if Guy kidnaps Orlando, Vivica needs to decide whether to pay ransom.如果他選擇綁架薇薇卡得知消息并決定是否交贖金Third, after knowing Whether Vivica has pa

9、id ransom or not Guy needs to decide whether to kill Orlandoor release him.在觀察到薇薇卡是否交付贖金后，蓋伊決定實(shí)釋放還是殺掉奧蘭多博弈有五種結(jié)果，每個(gè)結(jié)果對(duì)應(yīng)決策樹(shù)的一個(gè)路徑。構(gòu)建上述博弈模型的目的是對(duì)薇薇卡和蓋伊將采取什么行動(dòng)做出預(yù)測(cè)。信息來(lái)看，我們是無(wú)法求解的。因?yàn)槟Ｐ驮诿枋鰠⑴c者如何行動(dòng)時(shí)，只知道他們可選者的行動(dòng)方案（撕票或者釋放）與他們了解到的信息（是否交付贖金）是不夠的。知道參與人最看重的是什么。（這與參與人的偏好有關(guān)）但僅從目前模型中反映的我們還需要否則沒(méi)辦法預(yù)測(cè)他們的選擇。從上述博弈的5種結(jié)果可以分

10、析每個(gè)參與人最看重什么假設(shè)蓋伊只想要錢(qián)，如果不交贖金他會(huì)殺掉奧蘭多，蓋伊來(lái)說(shuō)，綁架薇薇卡交贖金奧蘭多被釋放是最佳結(jié)果次好結(jié)果是綁架薇薇卡交贖金殺了奧蘭多；次次好結(jié)果是不綁架，因?yàn)槿绻鞭笨ú唤悔H金沒(méi)必要綁架僅次于最壞結(jié)果是綁架薇薇卡不交贖金殺了奧蘭多最壞的結(jié)果是綁架薇薇卡不交贖金奧蘭所被釋放那么對(duì) 為準(zhǔn)確描述博弈中蓋伊的偏好，我們可以賦予每個(gè)結(jié)果一個(gè)數(shù)值，對(duì)于參與者而言，數(shù)值越大結(jié)果越好。這個(gè)數(shù)值就是收益，表示參與者的狀況（如福利、幸福狀況等），最高數(shù)值表示最好結(jié)果。關(guān)心奧蘭多勝于關(guān)心錢(qián)因此為確保博弈樹(shù)中包含所有的相關(guān)信息，圖中列出了每個(gè)參與者得到的收益每個(gè)終點(diǎn)節(jié)對(duì)應(yīng)博弈的一個(gè)結(jié)果，節(jié)點(diǎn)下的數(shù)

11、值表示對(duì)應(yīng)的結(jié)果中蓋伊和薇薇卡得到的收益。總結(jié)一下，擴(kuò)展式博弈是包含決策節(jié)點(diǎn)、分枝和終點(diǎn)結(jié)的決策樹(shù)。列行動(dòng)，并描述了這些選擇行動(dòng)的環(huán)境，包括可供參與者選擇的行動(dòng)方案以及參與人對(duì)于博弈中發(fā)生情況的知曉情況（信息集）。它借用樹(shù)型結(jié)構(gòu)來(lái)描述參與者采取的序2.2 擴(kuò)展式博弈：不完美信息在綁架博弈中，如果參與人（綁架者與受害者親人）在采取行動(dòng)時(shí)不知道對(duì)方如何行動(dòng)就是不完美信息博弈比如蓋伊在決定是如何處置（撕票或釋放）受害者時(shí)不知道薇薇卡是否交付贖金；薇薇卡在決定是否交付贖金時(shí)也不知道蓋伊的決定。也就是說(shuō)，兩人在沒(méi)有對(duì)方下一步行動(dòng)信息的情況下同時(shí)獨(dú)立做出決策。為了模擬不完美信息博弈，需要引入信息集的

12、概念。信息集是指相對(duì)于特定的參與者，他所觀察到的所有博弈中可能發(fā)生的行動(dòng)的集合。決策路徑（決策節(jié)點(diǎn)），但是對(duì)于特定參與者而言，無(wú)法對(duì)他們進(jìn)行明確區(qū)分。當(dāng)蓋伊決定如何處置奧蘭多時(shí)，和這兩個(gè)決策節(jié)點(diǎn)構(gòu)成了他的信息集。如果他不知道薇薇卡的選擇也就不確定自己處于那個(gè)節(jié)點(diǎn)。信息集包含博弈中的所有信息集概念的引入使我們可以構(gòu)建各種不同情況的博弈，即便我們可能缺乏博弈下的相關(guān)信息。比如信息集既可以體現(xiàn)完美信息博弈的情況，也就是一個(gè)參與人知道所有博弈中各階段的情況。也可以體現(xiàn)不完美信息博弈的情況，也就是一個(gè)參與人不確定其他參與人如何行動(dòng)。圖2-6 2-7都是綁架博弈的不完美信息情形，蓋伊和薇薇卡的

13、信息集用線連接起來(lái)，至少有一個(gè)或多個(gè)信息集包含多個(gè)決策節(jié)點(diǎn)。與人所有的信息集都只有一個(gè)決策節(jié)點(diǎn)。右圖是綁架博弈的完美信息情形，參2.3 策略是什么策略是規(guī)定參與者在博弈中如何采取行動(dòng)的決策規(guī)則策略不是一系列的行動(dòng)，而是一系列的應(yīng)變計(jì)劃，或者相機(jī)行動(dòng)計(jì)劃：根據(jù)形勢(shì)決定如何行動(dòng)。我們以綁架博弈為例，說(shuō)明什么是策略（1）綁架者的策略是什么？這個(gè)規(guī)定描述了在每種情形下可供參與者選擇的行動(dòng)方案綁架者蓋伊發(fā)現(xiàn)自己處在3種情形下策略是一個(gè)完備的決策規(guī)則蓋伊發(fā)現(xiàn)自己所處的3種情形與他有3個(gè)信息集相同。實(shí)際上一個(gè)參與者所處的“情形”被定義為一個(gè)信息集；所以一種策略賦予一個(gè)參與者每個(gè)信息集一種行動(dòng)方案3種情形每

14、個(gè)情形2種選擇，可供選擇的行動(dòng)策略是23=8第1種情形的選擇第2種情形第3種情形第1種情形的選擇第2種情形第3種情形因?yàn)檗鞭笨ㄖ挥幸粋€(gè)信息集（情形），她的策略就是1個(gè)情形兩種可供選擇的行動(dòng)方案。她有兩種可行的策略蓋伊的策略集包含8個(gè)策略薇薇卡的策略集包含2個(gè)策略這個(gè)博弈共包含16種策略組合。因此，對(duì)一個(gè)參與人來(lái)說(shuō)，策略集是這個(gè)參與者所有策略的集合。我們需要注意蓋伊一些策略中的特殊性。比如蓋伊第5種到第8種規(guī)定不綁架，后面的策略卻是告訴他在選擇綁架情況下該如何行動(dòng)。一件事情，但同時(shí)指導(dǎo)他不做他該做的事情。之所以一個(gè)策略集要包含這些表面看起來(lái)好像矛盾的策略原因在于： “不合理”的策略更容易處理；

15、策略并不影響我們的結(jié)論；錯(cuò)誤，他們可能需要一個(gè)意外狀況的計(jì)劃。這時(shí)你是需要另外一個(gè)路徑上的所有行動(dòng)方案的。也就是說(shuō)，策略指導(dǎo)他做（ 1）將所有可能的策略歸于信息集內(nèi)要比剔除一些（2）包含這些所謂“不合理”的（3）更重要的是，萬(wàn)一參與人犯了對(duì)策略最簡(jiǎn)單書(shū)寫(xiě)方式是，對(duì)于每個(gè)信息集所選擇的行動(dòng)，將其所對(duì)應(yīng)的標(biāo)簽連接整合起來(lái)。比如對(duì)于這個(gè)策略可寫(xiě)成（綁架，撕票、釋放）其他的還有（綁架，撕票、撕票）（綁架，釋放、撕票）（綁架，釋放、釋放）（不綁架，撕票、撕票）（不綁架，釋放、撕票）（不綁架，釋放、釋放）（不綁架，撕票、釋放）2.4 策略式博弈除了用擴(kuò)展式描述博弈外，還可以用策略式的描述方式策略式博弈包

16、含3個(gè)要素：（1）參與者集合；（2）參與者的策略集；（3）參與者的收益函數(shù)參與人：2個(gè)嫌疑犯參與人的策略集：沉默，告密收益函數(shù)：參與人的收益要根據(jù)他們各自的偏好釋放 4年1年 1 年3年 3年4年釋放 2.5 擴(kuò)展式轉(zhuǎn)為策略式對(duì)每一個(gè)擴(kuò)展式博弈來(lái)說(shuō)，總存在一個(gè)策略式表示式。右擊球右投手右擊球右投手左擊球左投手2.6 策略式轉(zhuǎn)為擴(kuò)展式盡管每個(gè)擴(kuò)展式只可以轉(zhuǎn)化為一個(gè)相應(yīng)的策略式博弈，但策略式博弈卻可以轉(zhuǎn)化為多個(gè)擴(kuò)展式博弈。這意味著在將擴(kuò)展式博弈轉(zhuǎn)化為策略式博弈時(shí)，丟失了一些信息。但這些信息的丟失無(wú)關(guān)緊要。丟失的是參與者行動(dòng)的順序，但在博弈中重要的不是行動(dòng)的順序，而是當(dāng)參與者行動(dòng)時(shí)所知道的博

17、弈信息。 2.7 共同知識(shí) 在構(gòu)建博弈過(guò)程中，我們假設(shè)參與人在某種程度上對(duì)博弈的規(guī)則具有共同的知識(shí)。就是每個(gè)參與者知道自己正在參與的博弈是什么每個(gè)參與者知道其他參與者知道自己正在參與的博弈是什么上面顯然沒(méi)有列出所有情況，因?yàn)檫@個(gè)邏輯可以無(wú)限推導(dǎo)下去。所以，共同知識(shí)包含的信息比參與者知道的信息要多：它涉及其他參與者知道的信息，和其他參與者知道的其他參與者知道的信息等等。博弈論不適用于以下情況：某參與人不知道其他參與人是否參與博弈，不知道其他參與人可以選擇的所有行動(dòng)，不知道其他參與人的是否有意識(shí)追求最大利益。模擬博弈時(shí)的其他問(wèn)題1.參與者還記得之前的發(fā)生的事嗎？在博弈論中，我們假設(shè)參與者在博弈過(guò)程中擁有“完美記憶”（Perfect recall），所以博弈中的參與者知道博弈任何階段中發(fā)生過(guò)的事實(shí)。2. 一個(gè)參與者可以改變博弈的進(jìn)程嗎？答案是不可以。在這個(gè)案例中，很顯然約翰

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

構(gòu)建策略情境模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

構(gòu)建策略情境模型

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔