博弈論基礎(chǔ)及應(yīng)用

上傳人：z*** IP屬地：天津上傳時間：2023-04-19 格式：DOCX 頁數(shù)：5 大?。?6.60KB 積分：6 舉報 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

博弈論對策論、游戲論）博弈論又名對策論、游戲論，是一門研究互動關(guān)系“游戲”的參與者各自選擇策略的科學(xué)，博弈論把這些復(fù)雜關(guān)系理論化，以便分析其中的邏輯和規(guī)律，并對實際決策提供指導(dǎo)和借鑒。游戲三要素（博弈的規(guī)則、結(jié)構(gòu)）：1、博弈、游戲參加者。博弈論分析，假定參與者都是機智而理性的。2、行為和策略空間。博弈參與者必須知道他自己及其對手伙伴的策略選擇范圍，并了解各種策略之間的因果關(guān)系。3、有可評價優(yōu)劣高下的決策行為結(jié)果。博弈論用數(shù)字表示這類結(jié)果，并稱之為支付。支付矩陣廠商A左廠商A左（生產(chǎn)-漲價、做廣告）（右不生產(chǎn)降價、不做廣告）上（生產(chǎn)，漲價、做廣告）—1,20，1下（不生產(chǎn)降價不做廣告）2，11,0可以用支付矩陣（得益矩陣、收益矩陣、贏得矩陣）來描述一個博弈結(jié)構(gòu)廠商B支配策略：由于游戲參與者試圖實現(xiàn)自身利益最大化并具有理性的決策能力，加上信息方面的假定，所以上述支付矩陣表示的博弈具有一個簡單而確定的結(jié)果。從廠商A角度來說，它采取策略“下”而得到的支付總是好于“上”（2,1分別對1,0）。同樣，對于廠商B來說，選擇策略“左”得到的利益總是優(yōu)于“右”（1,2分別對0,1）。因此，我們可以確定預(yù)期均衡選擇策略是A選擇“下”而B選擇“左”的策略。囚徒困境：下面支付矩陣表示著名的“囚徒困境”游戲，從博弈論角度看，這是一個存在支配均衡的博弈；因為對囚犯A、B來說，無論對方如何選擇，“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看，最好的選擇是合作，即同時選擇保持沉默，然而，由于猜忌，試圖獲得更大好處（3個月刑期）等競爭性動機阻礙了他們達到更好的互利選擇，他們面臨“囚徒困境”。我們將看到，寡頭壟斷廠商經(jīng)常面臨類似的困境。囚犯B囚犯a坦白坦白沉默5年，5年3個月，10年囚犯A沉默10年，3個月1年，1年納什均衡：支配均衡是一個特例，并非每個博弈都存在支配均衡。下面修改的支配均衡表示博弈中，廠商A、B在選擇做廣告問題上存在的策略關(guān)系。其中廠商A沒有支配策略，因為A的最佳決策取決于B的選擇。例如，當(dāng)B選擇做廣告時，A應(yīng)當(dāng)選擇做廣告，由此得到10而不是6的支付得益，然而，當(dāng)B選擇不做廣告時，A應(yīng)當(dāng)選擇不做廣告，從而得到20而不是15的支付得益。假定兩個廠商需要同時決策，A應(yīng)當(dāng)如何決策？廠商B廠商A廠商A上（做廣告）左（做廣告）右（不做廣告）10，515,0下（不做廣告） 6，820，2解答這個問題，A需要把自己放在B的位置，從B的角度看什么是最好的選擇，并在此基礎(chǔ)上考慮自己的選擇。支付矩陣表明B有一個支配策略：不論A選擇如何，B選擇做廣告時利益較大（5,8對0，2），因而A可以判斷B會選擇做廣告，而在B做廣告時，A應(yīng)當(dāng)選擇做廣告，因而。均衡結(jié)果是雙方都做廣告。上述均衡結(jié)果被稱作納什均衡。納什均衡指給定一組對手行為前提下，各博弈方存在的最佳選擇；在納什均衡狀態(tài)下，只要其他參與者不變換策略選擇，任何單個參與者不可能單方面通過變換策略來提高它的所獲支付。美國數(shù)學(xué)家和統(tǒng)計學(xué)家納什（Nash）50年代提出的折椅概念，所以稱作納什均衡。納什均衡和支配策略均衡的區(qū)別是：在納什均衡下，“我（你）所做的是給定你（我）的選擇我（你）所能做的最好的”而支配均衡下，“我（你）所做的是丕論你（我）的選擇，我（你）所能做的更好的”支配均衡必然是納什均衡，納什均衡未必是支配均衡。一個博弈可能有好幾個納什均衡（即幾組穩(wěn)定并且自我堅持的策略），有時又可能不存在納什均衡，下面左表存在兩個納什均衡，右表則沒有納什均衡。B左B左右上2,10，0下0，01,2左右上0，00，-1下1,0-1,3重復(fù)博弈：上面討論的“囚徒困境”暗含所幾個假定是靜態(tài)所一次性的博弈，結(jié)果陷入了個體理性決策導(dǎo)致集體非理性結(jié)果的困境。現(xiàn)在我們改變條件，討論博弈可以多次進行的重復(fù)博弈（RepeatedGame）,這時，囚犯同時選擇沉默有可能成為納什均衡。因為重復(fù)性博弈中，選擇坦白的機會成本太高，可能成為不利的選擇。例如：A有機會對B組成策略聯(lián)盟，并對B宣布如下方針：我將選擇沉默，并要求你也如此來增進各自利益；然而，如果你半途背叛選擇坦白，我從下一階段游戲開始一直選擇坦白，這一方針跟A利益一致，因而是可信的。從B角度來看，如和A合作，可能每階段得到1年監(jiān)禁的較好結(jié)果；如中途變卦，固然當(dāng)期可得3個月的更好結(jié)果，但此后便每次面臨5年監(jiān)禁的結(jié)果，顯然是不利的。因而重復(fù)博弈中，“沉默”＋“沉默”點可能成為雙方的最佳選擇，因而成為納什均衡——由于博弈條件由一次性變?yōu)橹貜?fù)性，均衡狀態(tài)隨之發(fā)生變化。序列博弈前面討論的博弈是參與者同時選擇。在序列博弈（SequentialGame）中，各博弈方先后依次行動。下面的支付矩陣描述了一個博弈，如果同時行動，它有兩個納什均衡（“甜，咸”或“咸，甜”）。假定A可以先推出甜餅干（假如較快投入生產(chǎn)），就有了序列博弈：A先作決策，B隨后選擇。A決策是必須考慮競爭廠商B廠商A上廠商A上（咸餅干）左（咸餅干）右（甜餅干）-5,-510,20下（甜餅干）20,10-5,-5者的理性反應(yīng)；A知道不論自己推出哪種餅干，B處于自身利益會推出另一種；因而A推出甜餅干，B在給定A決策時選擇咸餅干；給定B的選擇，A的選擇仍然最佳。結(jié)果兩個納什均衡點收斂為一個（下，左）其中A由于具有先行者優(yōu)勢（FirstMover'sAdvantege）而得到較大利益。中國電信、中國聯(lián)通的價格競爭模型：A（中國電信）是老牌企業(yè)，實力雄厚，占據(jù)了絕大多數(shù)的市場份額；B（中國聯(lián)通）剛成立不久，翅膀沒有長硬，是政府為打破壟斷鼓勵競爭而籌建的，B得到了政府的一些優(yōu)惠，其中就有B的價格可以比A低10%。這一舉動，還不會對A產(chǎn)生多大的影響，因為A的根基實在是太牢固了。在這樣的市場分配下，A、B可以達到平衡，但由于B在價格方面的優(yōu)勢，市場份額逐步壯大，到了一定程度，對A造成了影響。這時候，A該怎么辦？B（中國聯(lián)通）A（中國電信）維持A（中國電信）維持5,10-10,15降價15,-5-5,-5維持降價A降價、B維持，則A獲利15,B損失5,整體獲利10；A維持、B維持，則A獲利5，B獲利10，整體獲利15；A維持、B降價，則A損失10，B獲利15,整體獲利5；A降價、B降價，則A損失5，B損失5,整體損失10。從A角度看，顯然降價要比維持好,降價至少可以保證比B好，在概率均等的情況下,A降價的收益為15x50%-5x50%=5，維持的收益為5x50%-10x50%=-2.5，為了自身利益的最大化，A就不可避免地選擇了降價。從B角度看，降價也比維持好，其降價收益為5,維持收益為2.5,B也會選擇降價。在這輪博弈中，A、B都將降價作為策略，因此各損失5，整體損失10，整體收益是最差的。這就是此博弈最終所出現(xiàn)的納什均衡。電信業(yè)價格戰(zhàn)博弈模型是典型的囚徒困境現(xiàn)象，各個局部都尋求利益的最大化，而整體利益卻不是最優(yōu)，甚至是最差。許多其他行業(yè)的價格競爭都是典型的囚徒困境現(xiàn)象，如可口可樂公司和百事可樂公司之間的競爭、各大航空公司之間的價格競爭等等。OPEC組織成員國之間的合作與背叛“囚徒困境”告訴我們，個人理性和集體理性之間存在矛盾，基于個人理性的正確選擇會降低大家的福利，也就是說，基于個人利益最大化的前提下，帕累托改進得不到進行，帕累托最優(yōu)得不到實現(xiàn)。上述我們在對電信價格競爭的博弈分析中，只是一次性的“囚徒困境”博弈，因此得到了互相降價的納什均衡。而在現(xiàn)實生活當(dāng)中，信任與合作很少達到如此兩難的境地，無論在自然界還是在人類社會，“合作”都是一種隨處可見的現(xiàn)象。比如中東石油輸出國組織（OrganizationgofPetroleumExpotingCountries簡稱OPEC）的成立，本身就是要限制各石油生產(chǎn)國的產(chǎn)量，以保持石油價格，以便獲取利潤，是合作的產(chǎn)物。OPEC之所以能夠成立，各組織成員國之間之所以能夠合作，是因為囚徒困境如果是一次性博弈（Oneshotgame）的話，基于個人利益最大化，得到納什均衡解，但如果是多次博弈，人們就有了合作的可能性，囚徒困境就有可能破解，合作就有可能達成。連續(xù)的合作有可能成為重復(fù)的囚徒困境的均衡解，這也是博弈論上著名的"大眾定理"（FolkTheorem）的含義。但合作的可能性不是必然性。博弈論的研究表明，要想使合作成為多次博弈的均衡解，博弈的一方（最好是實力更強的一方）必須主動通過可信的承諾（Crediblecommitment），向另一方表示合作的善意，努力把這個善意表達清楚，并傳達出去。如果該困境同時涉及多個對手，則要在博弈對手中形成聲譽，并用心地維護這個聲譽。這里"可信的承諾"是一個很牽強的翻譯，"Crediblecommitment”并不是什么空口諾言，而是實實在在的付出。所以合作是非常困難的。所以O(shè)PEC組織經(jīng)常會有成員國不遵守組織的協(xié)定，私自增加石油產(chǎn)量。每個成員國都這樣想，只要他們不增加產(chǎn)量，我增加一點點產(chǎn)量對價格沒什么影響，結(jié)果每個國家都增加產(chǎn)量，造成石油價格下跌，大家的利潤都受到損失。當(dāng)然，一些產(chǎn)量增加較少的國家損失更多，于是也更加大量生產(chǎn)，造成價格進一步下降一結(jié)果，陷入一個困境：大家都增加產(chǎn)量，價格下跌，大家再增加產(chǎn)量，價格再下跌……。理論上，幾乎所有的卡特爾（正是串謀在一起的廠商稱作Cartel都會遭到失敗，原因就在于卡特爾的協(xié)定（類似囚犯的攻守同盟）不是一個納什均衡，沒有成員有興趣遵守。那么

人人文庫> 全部分類> 行業(yè)資料 > 各類標準

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論基礎(chǔ)及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

博弈論基礎(chǔ)及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔