15第七專題第1次：競爭型決策-基本概念

上傳人：1*** IP屬地：廣東上傳時間：2026-01-22 格式：PPTX 頁數(shù)：50 大小：3.47MB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩45頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

編寫組決策理論與方法第一講競爭型決策概述專題七競爭型決策主要內(nèi)容博弈的基本概念1完全信息靜態(tài)博弈2典型案例3競爭無處不在引例博弈論(gametheory)主要是解決決策者之間沖突和合作的理論。具體來講，是解決決策主體的行為在發(fā)生直接的相互作用時，人們?nèi)绾芜M行決策以及這種決策的均衡問題。引例一.基本概念

囚徒困境囚徒乙坦白抵賴囚徒甲坦白（－8，－8）（0，－10）抵賴（－10，0）（－1，－1）警方拘捕了兩個同案的犯罪嫌疑人（囚徒）后，為防止串供，將其分開拘押，隔離審問。對他倆的政策是：若一人招供但另一人未招，則招者立即被釋放，未招者判入獄10年；若二人都招則兩人各判刑8年；若兩人都不招則未獲證據(jù)但因私入民宅各拘留1年。

如果都是理性的個體，應(yīng)該作何決策？典型的博弈現(xiàn)象可以看出：1.兩個囚徒?jīng)Q策時都已自己的最大利益為目標，結(jié)果是無法實現(xiàn)最大利益或者是較大利益；2.也反應(yīng)了一個很深刻的問題，即個體理性與集體理性之間的矛盾，即從個體利益出發(fā)的行為往往不能實現(xiàn)集體的最大利益；3.同時也揭示了個體理性本身存在的內(nèi)在矛盾，即從個體利益出發(fā)的行為最終也不一定能真正實現(xiàn)個體利益的最大化。典型的博弈現(xiàn)象

博弈就是一些人或組織在一定的環(huán)境和規(guī)則下，同時或先后，一次或多次，從各自允許選擇的行動或策略中進行選擇并加以實施，各自取得相應(yīng)結(jié)果的過程。博弈的概念要素博弈的參與者。又稱博弈方或局中人，是指博弈中獨立決策、獨立承擔(dān)結(jié)果的決策主體。

博弈的要素參與者的支付

。每個參與者從各種策略組合中獲得的收益或效用，它是策略組合s的函數(shù)，所以也被稱為支付函數(shù)。記博弈方i的支付函數(shù)為ui(s)

。

要素博弈的要素以上是博弈問題的三個基本要素博弈的標準式囚徒困境中參與者：嫌犯甲和嫌犯乙策略集：{坦白，拒絕}支付：博弈結(jié)束，參與者得到的回報。雙方的支付由所選策略決定。當(dāng)兩個嫌犯都選擇“坦白”時，他們的支付都是-1，即坐牢1年。要素博弈的要素博弈方的信息。博弈的次序。所有隨機事件的概率分布擴展要素分類博弈的分類參與者的數(shù)量：兩人博弈和多人博弈參與者策略的數(shù)量：有限博弈和無限博弈收益情況：零和博弈、常和博弈和變和博弈行動的順序：靜態(tài)博弈、動態(tài)博弈、信息結(jié)構(gòu)：完全信息博弈和不完全信息博弈參與者理性：非合作博弈和合作博弈分類博弈的分類參與者的數(shù)量：兩人博弈和多人博弈兩人博弈就是存在兩個各自獨立決策，但策略和支付具有相互依存與制約關(guān)系的博弈方的決策問題。多人博弈是指有三個或三個以上參與者進行的博弈。參與者尋求自身最大利益的決策活動，只是現(xiàn)在其他參與者不是一個，在分析參與者的策略行為時，不僅要考慮兩兩之間的相互作用，還要考慮參與者可能會形成聯(lián)盟。分類博弈的分類參與者策略的數(shù)量：有限博弈和無限博弈有限博弈：參與者的數(shù)量和所有策略集合都是有限的。無限博弈：只要參與者數(shù)量或某一個參與者的策略集合是無限的，該博弈稱無限博弈。分類博弈的分類收益情況：零和博弈、常和博弈和變和博弈零和博弈：所有參與者的得益總和始終為零的博弈，其是最常見的一種博弈類型，同時也是被研究得最早、最多的博弈問題。常和博弈：所有參與者的得益總和始終為某一非零常數(shù)的博弈，常用于分析固定份額財富或資源的分配。變和博弈：博弈中參與者的利益總和會隨著策略組合的不同而變化。分類博弈的分類行動的順序：靜態(tài)博弈、動態(tài)博弈、重復(fù)博弈靜態(tài)博弈：所有參與者同時采取行動，或者，雖然行動有先后次序但是參與者無法看到別人的行動。動態(tài)博弈：參與者的決策行動是有先后順序的，而且后決策行動的參與者能夠觀察到先決策行動的參與者所選擇的策略的博弈。如下棋游戲和紙牌游戲。重復(fù)博弈：同一個博弈反復(fù)進行所構(gòu)成的整體博弈過程，構(gòu)成重復(fù)博弈的一次性博弈叫作“元博弈”或者“階段博弈”。分類博弈的分類信息結(jié)構(gòu)：完全信息博弈和不完全信息博弈

在網(wǎng)上流傳著這樣一個故事。一個古董商發(fā)現(xiàn)一個人用珍貴的茶碟裝貓食，于是假裝對他的貓非常喜愛，想從他手里買下這只貓。貓主人一口回絕。為此古董商狠心出了高價，才說服貓主人成交。成交后，古董商裝作不經(jīng)意地說:“這個碟子它用習(xí)慣了，就一塊兒送我吧。”貓主人微微一笑:“你知道用這個碟子，我賣了多少貓嗎?”

在這個故事中，古董商掌握著“茶碟是古董”這個信息，非常得意，并自作聰明地認為養(yǎng)貓人不知道。誰知貓主人不但知道，而且還利用了古董商“認為自己不知道”的錯誤認識，更勝一籌。信息的重要性分類博弈的分類信息結(jié)構(gòu)：完全信息博弈和不完全信息博弈

完全信息博弈：每個參與者對其他參與者的策略集合及支付函數(shù)有準確認識的博弈。

不完全信息博弈：至少部分參與者不完全了解其他參與者支付情況的博弈。分類博弈的分類參與者理性：非合作博弈和合作博弈

合作博弈：強調(diào)集體理性和效率，參與者的決策是以集體目標最大化為驅(qū)動。

非合作博弈：強調(diào)個體理性，即個體利益最大化。

行動順序信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什（1950,1951）完全信息動態(tài)博弈子博弈精煉納什均衡澤爾騰（1965）不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼（1967-1968）不完全信息動態(tài)博弈精煉貝葉斯納什均衡澤爾騰（1975）博弈的分類二.完全信息靜態(tài)博弈

完全信息靜態(tài)博弈概念內(nèi)涵每一參與者都擁有其他所有參與者的特征、策略集和支付函數(shù)等方面的準確信息，這樣的博弈稱為完全信息博弈。參與者同時行動，或者非同時行動但后行動者觀察不到先行動者的選擇的博弈，稱為靜態(tài)博弈。同時滿足完全信息和靜態(tài)兩個條件的博弈稱為完全信息靜態(tài)博弈。囚徒博弈石頭剪子布田忌賽馬無限策略博弈(古諾博弈)……擁有支付函數(shù)的準確信息：1.指支付函數(shù)是確定的；2.支付函數(shù)是公共信息。

常見分析方法囚徒困境中，“雙方都坦白”是極為可能出現(xiàn)的結(jié)果，而且這一結(jié)果非?！胺€(wěn)定”：假如任何一個人單方面改變自己的選擇，將會得到更差的結(jié)果。所以沒有人單方面更改策略，雙方處于一個膠著狀態(tài)，即均衡狀態(tài)。怎樣分析并求得這個均衡？

常見分析方法占優(yōu)戰(zhàn)略均衡

重復(fù)剔除占優(yōu)戰(zhàn)略均衡

劃線法

箭頭法

常見分析方法占優(yōu)戰(zhàn)略均衡

占優(yōu)戰(zhàn)略就是指不管其他參與者策略為何，該參與者總能可找到一個最佳策略。這個最優(yōu)策略稱為上策。如果在競爭型決策中每個參與者都有上策，這些上策所構(gòu)成的策略組合必然會受到所有參與者的歡迎，這樣的策略組合稱為該博弈的一個均衡點，稱為“占優(yōu)戰(zhàn)略均衡”。

常見分析方法占優(yōu)戰(zhàn)略均衡

占優(yōu)戰(zhàn)略均衡分析是最基本的博弈分析方法，占優(yōu)戰(zhàn)略均衡非常穩(wěn)定，根據(jù)它可以做出最肯定的預(yù)測，因為它反映了博弈方對策略的絕對偏好，只要找到占優(yōu)戰(zhàn)略均衡，博弈分析任務(wù)基本完成。實際上經(jīng)常出現(xiàn)所有參與者都沒有上策，如石頭剪刀布游戲。

不具有普遍適用性。

常見分析方法重復(fù)剔除占優(yōu)戰(zhàn)略均衡

如果一個參與者的某個策略給他帶來的收益總是比另一種策略所帶來的收益少，該策略對于該參與者來說就是“嚴格下策”，無論在什么時候，參與者都不會選擇該策略。

因此，可以將包含該策略的所有策略組合消去，這樣就可以簡化博弈局面，一直循環(huán)往復(fù)，不斷消去“嚴格下策”，直到只剩一個策略組合為止，這個策略組合就是該博弈局面的均衡點，這種均衡稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”，也稱為“嚴格下策反復(fù)消去占優(yōu)戰(zhàn)略均衡”。

常見分析方法重復(fù)剔除占優(yōu)戰(zhàn)略均衡

步驟：1、首先找出某一博弈參與人的嚴格下策，將它剔除掉，重新構(gòu)造一個不包括已剔除下策的博弈；2、然后繼續(xù)剔除這個新的博弈中某一參與人的嚴格下策；3、重復(fù)進行這一過程，直到剩下唯一的參與人策略組合為止。

常見分析方法劃線法

基本思路：找出一個參與者針對其他參與者每種策略或策略組合（對多人博弈）的最佳對策，即自己的可選策略中與其他博弈方的策略或策略組合配合，給自己帶來最大得益的策略，在其支付值下劃線。若存在一個策略組合，使得所有參與者的支付值下都劃了線，則該策略組合就是一個均衡點。

常見分析方法劃線法

乙