博弈論基礎(chǔ)及應(yīng)用_第1頁
博弈論基礎(chǔ)及應(yīng)用_第2頁
博弈論基礎(chǔ)及應(yīng)用_第3頁
博弈論基礎(chǔ)及應(yīng)用_第4頁
博弈論基礎(chǔ)及應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

博弈論對策論、游戲論)博弈論又名對策論、游戲論,是一門研究互動關(guān)系“游戲”的參與者各自選擇策略的科學(xué),博弈論把這些復(fù)雜關(guān)系理論化,以便分析其中的邏輯和規(guī)律,并對實際決策提供指導(dǎo)和借鑒。游戲三要素(博弈的規(guī)則、結(jié)構(gòu)):1、博弈、游戲參加者。博弈論分析,假定參與者都是機智而理性的。2、行為和策略空間。博弈參與者必須知道他自己及其對手伙伴的策略選擇范圍,并了解各種策略之間的因果關(guān)系。3、有可評價優(yōu)劣高下的決策行為結(jié)果。博弈論用數(shù)字表示這類結(jié)果,并稱之為支付。支付矩陣廠商A左廠商A左(生產(chǎn)-漲價、做廣告)(右不生產(chǎn)降價、不做廣告)上(生產(chǎn),漲價、做廣告)—1,20,1下(不生產(chǎn)降價不做廣告)2,11,0可以用支付矩陣(得益矩陣、收益矩陣、贏得矩陣)來描述一個博弈結(jié)構(gòu)廠商B支配策略:由于游戲參與者試圖實現(xiàn)自身利益最大化并具有理性的決策能力,加上信息方面的假定,所以上述支付矩陣表示的博弈具有一個簡單而確定的結(jié)果。從廠商A角度來說,它采取策略“下”而得到的支付總是好于“上”(2,1分別對1,0)。同樣,對于廠商B來說,選擇策略“左”得到的利益總是優(yōu)于“右”(1,2分別對0,1)。因此,我們可以確定預(yù)期均衡選擇策略是A選擇“下”而B選擇“左”的策略。囚徒困境:下面支付矩陣表示著名的“囚徒困境”游戲,從博弈論角度看,這是一個存在支配均衡的博弈;因為對囚犯A、B來說,無論對方如何選擇,“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時選擇保持沉默,然而,由于猜忌,試圖獲得更大好處(3個月刑期)等競爭性動機阻礙了他們達到更好的互利選擇,他們面臨“囚徒困境”。我們將看到,寡頭壟斷廠商經(jīng)常面臨類似的困境。囚犯B囚犯a坦白坦白沉默5年,5年3個月,10年囚犯A沉默10年,3個月1年,1年納什均衡:支配均衡是一個特例,并非每個博弈都存在支配均衡。下面修改的支配均衡表示博弈中,廠商A、B在選擇做廣告問題上存在的策略關(guān)系。其中廠商A沒有支配策略,因為A的最佳決策取決于B的選擇。例如,當(dāng)B選擇做廣告時,A應(yīng)當(dāng)選擇做廣告,由此得到10而不是6的支付得益,然而,當(dāng)B選擇不做廣告時,A應(yīng)當(dāng)選擇不做廣告,從而得到20而不是15的支付得益。假定兩個廠商需要同時決策,A應(yīng)當(dāng)如何決策?廠商B廠商A廠商A上(做廣告)左(做廣告)右(不做廣告)10,515,0下 (不做廣告) 6,820,2解答這個問題,A需要把自己放在B的位置,從B的角度看什么是最好的選擇,并在此基礎(chǔ)上考慮自己的選擇。支付矩陣表明B有一個支配策略:不論A選擇如何,B選擇做廣告時利益較大(5,8對0,2),因而A可以判斷B會選擇做廣告,而在B做廣告時,A應(yīng)當(dāng)選擇做廣告,因而。均衡結(jié)果是雙方都做廣告。上述均衡結(jié)果被稱作納什均衡。納什均衡指給定一組對手行為前提下,各博弈方存在的最佳選擇;在納什均衡狀態(tài)下,只要其他參與者不變換策略選擇,任何單個參與者不可能單方面通過變換策略來提高它的所獲支付。美國數(shù)學(xué)家和統(tǒng)計學(xué)家納什(Nash)50年代提出的折椅概念,所以稱作納什均衡。納什均衡和支配策略均衡的區(qū)別是:在納什均衡下,“我(你)所做的是給定你(我)的選擇我(你)所能做的最好的”而支配均衡下,“我(你)所做的是丕論你(我)的選擇,我(你)所能做的更好的”支配均衡必然是納什均衡,納什均衡未必是支配均衡。一個博弈可能有好幾個納什均衡(即幾組穩(wěn)定并且自我堅持的策略),有時又可能不存在納什均衡,下面左表存在兩個納什均衡,右表則沒有納什均衡。B左B左右上2,10,0下0,01,2左右上0,00,-1下1,0-1,3重復(fù)博弈:上面討論的“囚徒困境”暗含所幾個假定是靜態(tài)所一次性的博弈,結(jié)果陷入了個體理性決策導(dǎo)致集體非理性結(jié)果的困境。現(xiàn)在我們改變條件,討論博弈可以多次進行的重復(fù)博弈(RepeatedGame),這時,囚犯同時選擇沉默有可能成為納什均衡。因為重復(fù)性博弈中,選擇坦白的機會成本太高,可能成為不利的選擇。例如:A有機會對B組成策略聯(lián)盟,并對B宣布如下方針:我將選擇沉默,并要求你也如此來增進各自利益;然而,如果你半途背叛選擇坦白,我從下一階段游戲開始一直選擇坦白,這一方針跟A利益一致,因而是可信的。從B角度來看,如和A合作,可能每階段得到1年監(jiān)禁的較好結(jié)果;如中途變卦,固然當(dāng)期可得3個月的更好結(jié)果,但此后便每次面臨5年監(jiān)禁的結(jié)果,顯然是不利的。因而重復(fù)博弈中,“沉默”+“沉默”點可能成為雙方的最佳選擇,因而成為納什均衡——由于博弈條件由一次性變?yōu)橹貜?fù)性,均衡狀態(tài)隨之發(fā)生變化。序列博弈前面討論的博弈是參與者同時選擇。在序列博弈(SequentialGame)中,各博弈方先后依次行動。下面的支付矩陣描述了一個博弈,如果同時行動,它有兩個納什均衡(“甜,咸”或“咸,甜”)。假定A可以先推出甜餅干(假如較快投入生產(chǎn)),就有了序列博弈:A先作決策,B隨后選擇。A決策是必須考慮競爭廠商B廠商A上廠商A上(咸餅干)左(咸餅干)右(甜餅干)-5,-510,20下(甜餅干)20,10-5,-5者的理性反應(yīng);A知道不論自己推出哪種餅干,B處于自身利益會推出另一種;因而A推出甜餅干,B在給定A決策時選擇咸餅干;給定B的選擇,A的選擇仍然最佳。結(jié)果兩個納什均衡點收斂為一個(下,左)其中A由于具有先行者優(yōu)勢(FirstMover'sAdvantege)而得到較大利益。中國電信、中國聯(lián)通的價格競爭模型:A(中國電信)是老牌企業(yè),實力雄厚,占據(jù)了絕大多數(shù)的市場份額;B(中國聯(lián)通)剛成立不久,翅膀沒有長硬,是政府為打破壟斷鼓勵競爭而籌建的,B得到了政府的一些優(yōu)惠,其中就有B的價格可以比A低10%。這一舉動,還不會對A產(chǎn)生多大的影響,因為A的根基實在是太牢固了。在這樣的市場分配下,A、B可以達到平衡,但由于B在價格方面的優(yōu)勢,市場份額逐步壯大,到了一定程度,對A造成了影響。這時候,A該怎么辦?B(中國聯(lián)通)A(中國電信)維持A(中國電信)維持5,10-10,15降價15,-5-5,-5維持 降價A降價、B維持,則A獲利15,B損失5,整體獲利10;A維持、B維持,則A獲利5,B獲利10,整體獲利15;A維持、B降價,則A損失10,B獲利15,整體獲利5;A降價、B降價,則A損失5,B損失5,整體損失10。從A角度看,顯然降價要比維持好,降價至少可以保證比B好,在概率均等的情況下,A降價的收益為15x50%-5x50%=5,維持的收益為5x50%-10x50%=-2.5,為了自身利益的最大化,A就不可避免地選擇了降價。從B角度看,降價也比維持好,其降價收益為5,維持收益為2.5,B也會選擇降價。在這輪博弈中,A、B都將降價作為策略,因此各損失5,整體損失10,整體收益是最差的。這就是此博弈最終所出現(xiàn)的納什均衡。電信業(yè)價格戰(zhàn)博弈模型是典型的囚徒困境現(xiàn)象,各個局部都尋求利益的最大化,而整體利益卻不是最優(yōu),甚至是最差。許多其他行業(yè)的價格競爭都是典型的囚徒困境現(xiàn)象,如可口可樂公司和百事可樂公司之間的競爭、各大航空公司之間的價格競爭等等。OPEC組織成員國之間的合作與背叛“囚徒困境”告訴我們,個人理性和集體理性之間存在矛盾,基于個人理性的正確選擇會降低大家的福利,也就是說,基于個人利益最大化的前提下,帕累托改進得不到進行,帕累托最優(yōu)得不到實現(xiàn)。上述我們在對電信價格競爭的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降價的納什均衡。而在現(xiàn)實生活當(dāng)中,信任與合作很少達到如此兩難的境地,無論在自然界還是在人類社會,“合作”都是一種隨處可見的現(xiàn)象。比如中東石油輸出國組織(OrganizationgofPetroleumExpotingCountries簡稱OPEC)的成立,本身就是要限制各石油生產(chǎn)國的產(chǎn)量,以保持石油價格,以便獲取利潤,是合作的產(chǎn)物。OPEC之所以能夠成立,各組織成員國之間之所以能夠合作,是因為囚徒困境如果是一次性博弈(Oneshotgame)的話,基于個人利益最大化,得到納什均衡解,但如果是多次博弈,人們就有了合作的可能性,囚徒困境就有可能破解,合作就有可能達成。連續(xù)的合作有可能成為重復(fù)的囚徒困境的均衡解,這也是博弈論上著名的"大眾定理"(FolkTheorem)的含義。但合作的可能性不是必然性。博弈論的研究表明,要想使合作成為多次博弈的均衡解,博弈的一方(最好是實力更強的一方)必須主動通過可信的承諾(Crediblecommitment),向另一方表示合作的善意,努力把這個善意表達清楚,并傳達出去。如果該困境同時涉及多個對手,則要在博弈對手中形成聲譽,并用心地維護這個聲譽。這里"可信的承諾"是一個很牽強的翻譯,"Crediblecommitment”并不是什么空口諾言,而是實實在在的付出。所以合作是非常困難的。所以O(shè)PEC組織經(jīng)常會有成員國不遵守組織的協(xié)定,私自增加石油產(chǎn)量。每個成員國都這樣想,只要他們不增加產(chǎn)量,我增加一點點產(chǎn)量對價格沒什么影響,結(jié)果每個國家都增加產(chǎn)量,造成石油價格下跌,大家的利潤都受到損失。當(dāng)然,一些產(chǎn)量增加較少的國家損失更多,于是也更加大量生產(chǎn),造成價格進一步下降一結(jié)果,陷入一個困境:大家都增加產(chǎn)量,價格下跌,大家再增加產(chǎn)量,價格再下跌……。理論上,幾乎所有的卡特爾(正是串謀在一起的廠商稱作Cartel都會遭到失敗,原因就在于卡特爾的協(xié)定(類似囚犯的攻守同盟)不是一個納什均衡,沒有成員有興趣遵守。那么

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論