版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
博弈論基礎(chǔ)復(fù)習資料匯編一、博弈論的基本概念1.1博弈的定義與本質(zhì)博弈論研究的是多個決策者在相互影響的環(huán)境中如何制定策略以實現(xiàn)自身目標的理論。其核心在于決策者的策略選擇會相互作用,每個參與者的收益不僅取決于自身行動,還依賴于其他參與者的行為。這種互動性使得博弈分析區(qū)別于單個決策者的最優(yōu)化問題。1.2博弈的基本要素參與者(Players):在博弈中獨立決策、承擔后果的決策主體,可以是個人、企業(yè)或國家等。策略(Strategies):參與者在博弈中可選擇的行動方案集合,需注意策略的完備性與互斥性。收益(Payoffs):參與者在特定策略組合下獲得的效用或收益,是策略選擇的直接后果。信息(Information):參與者對其他參與者特征、策略空間及收益函數(shù)的了解程度。均衡(Equilibrium):所有參與者策略選擇達到穩(wěn)定狀態(tài),無人愿意單方面改變策略。1.3博弈的分類合作博弈與非合作博弈:區(qū)分標準在于參與者之間是否存在具有約束力的協(xié)議。合作博弈關(guān)注聯(lián)盟形成與利益分配,非合作博弈聚焦個體策略互動。靜態(tài)博弈與動態(tài)博弈:靜態(tài)博弈中參與者同時選擇策略;動態(tài)博弈則存在行動順序,后行動者可觀察先行動者的選擇。完全信息與不完全信息博弈:完全信息指所有參與者了解彼此的策略空間與收益函數(shù);不完全信息則存在信息不對稱。二、完全信息靜態(tài)博弈2.1博弈的標準式表述通過矩陣形式(雙矩陣博弈)描述參與者、策略與收益。以雙人博弈為例,行代表參與者1的策略,列代表參與者2的策略,矩陣元素為對應(yīng)策略組合下雙方的收益。2.2占優(yōu)策略與占優(yōu)策略均衡占優(yōu)策略:無論其他參與者選擇何種策略,某參與者存在的最優(yōu)策略。占優(yōu)策略均衡:所有參與者均選擇占優(yōu)策略所形成的策略組合。需注意,并非所有博弈都存在占優(yōu)策略均衡。2.3納什均衡定義:在某策略組合中,給定其他參與者的策略,每個參與者選擇的策略都是自身最優(yōu)反應(yīng),即單方面偏離無法獲得更高收益。求解方法:劃線法(在支付矩陣中標記每個參與者對其他參與者策略的最優(yōu)反應(yīng))、箭頭法(標示策略偏離方向)。多重納什均衡:部分博弈存在多個納什均衡,需通過精煉均衡或額外標準(如帕累托最優(yōu)、風險占優(yōu)等)進行篩選。2.4經(jīng)典模型囚徒困境:揭示個體理性與集體理性的沖突,納什均衡結(jié)果帕累托劣于合作結(jié)果。重復(fù)博弈可能促成合作解。智豬博弈:分析“搭便車”現(xiàn)象,說明弱者可能選擇等待策略,強者被迫主動行動。性別戰(zhàn):體現(xiàn)協(xié)調(diào)博弈特征,存在多個納什均衡,參與者需通過某種機制達成一致。三、完全信息動態(tài)博弈3.1博弈的擴展式表述通過博弈樹直觀呈現(xiàn)動態(tài)博弈結(jié)構(gòu),包括節(jié)點(決策點、終點)、枝(行動)、信息集(表示參與者對歷史的了解程度)。3.2子博弈精煉納什均衡子博弈:原博弈中滿足特定條件的局部博弈,需包含完整信息集與終點。定義:策略組合在原博弈及所有子博弈中均構(gòu)成納什均衡,可剔除包含不可置信威脅的均衡。求解方法:逆向歸納法,從博弈終點開始逆向推導(dǎo)各參與者的最優(yōu)策略。3.3可信性與承諾行動動態(tài)博弈中,威脅或承諾的可信性是關(guān)鍵。承諾行動通過改變收益函數(shù)或行動順序,使原本不可信的威脅變得可信。3.4經(jīng)典模型斯塔克爾伯格模型:雙寡頭產(chǎn)量競爭的動態(tài)版本,領(lǐng)導(dǎo)者先選擇產(chǎn)量,追隨者觀察后選擇最優(yōu)產(chǎn)量,均衡結(jié)果不同于古諾模型。討價還價模型:分析分配問題,參與者輪流出價,貼現(xiàn)因子、耐心程度影響最終分配結(jié)果。四、不完全信息靜態(tài)博弈4.1海薩尼轉(zhuǎn)換引入虛擬參與者“自然”,由自然先選擇參與者的類型(反映私有信息),將不完全信息博弈轉(zhuǎn)化為不完美信息博弈進行分析。4.2貝葉斯納什均衡類型與信念:參與者的類型決定其收益函數(shù),參與者對其他參與者類型的概率分布稱為信念。定義:在給定自身類型及對其他參與者類型信念的條件下,每個參與者的策略是對其他參與者策略的最優(yōu)反應(yīng)。4.3經(jīng)典模型貝葉斯囚徒困境:參與者對對方類型(如“理性”或“非理性”)存在不確定性,合作策略可能在特定信念下出現(xiàn)。拍賣模型:常見的不完全信息博弈場景,如一級密封價格拍賣、二級密封價格拍賣(維克瑞拍賣),不同拍賣機制的均衡策略與效率存在差異。五、博弈論的學(xué)習方法與注意事項5.1核心思維換位思考:分析博弈時需站在所有參與者的角度思考其最優(yōu)策略,避免僅從單一視角出發(fā)。均衡思維:理解納什均衡的穩(wěn)定性,認識到均衡結(jié)果可能并非帕累托最優(yōu)。模型化能力:將現(xiàn)實問題抽象為博弈模型,明確參與者、策略、收益與信息結(jié)構(gòu)。5.2常見誤區(qū)混淆納什均衡與占優(yōu)策略均衡:納什均衡不要求策略在所有情況下最優(yōu),僅需在給定他人策略時最優(yōu)。忽視信息結(jié)構(gòu)的影響:信息完全與否、對稱與否對博弈結(jié)果有顯著影響,需準確判斷博弈信息環(huán)境。過度泛化博弈結(jié)論:任何博弈模型均基于特定假設(shè),應(yīng)用結(jié)論時需注意前提條件是否符合現(xiàn)實。5.3應(yīng)用與拓展博弈論在經(jīng)濟學(xué)(產(chǎn)業(yè)組織、公共政策)、政治學(xué)(選舉、國際沖突)、生物學(xué)(進化博弈)等領(lǐng)域有廣泛應(yīng)用。學(xué)習中可結(jié)合具體案例加深理解,同時關(guān)注博弈論與其他學(xué)科的交叉融合。六、總結(jié)博弈論提供了分析互動決策問題的系統(tǒng)性框架,其核心價值在于揭示策略互
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職服裝款式設(shè)計(設(shè)計基礎(chǔ))試題及答案
- 2026年化工分析(電化學(xué)分析技術(shù))試題及答案
- 2025年高職(財務(wù)管理綜合實訓(xùn))投資管理實操試題及答案
- 2025年中職第三學(xué)年(防火墻技術(shù))網(wǎng)絡(luò)安全防護測試題及答案
- 2025年中職工業(yè)互聯(lián)網(wǎng)技術(shù)(工業(yè)互聯(lián)網(wǎng)基礎(chǔ))試題及答案
- 2025年中職第二學(xué)年(家政服務(wù)與管理)家庭膳食搭配實務(wù)測試題及答案
- 2025年中職(會計)成本核算綜合試題及答案
- 2025年大學(xué)第四學(xué)年(服裝設(shè)計與工程)服裝綜合設(shè)計試題及答案
- 2026年粉底銷售(客戶接待)試題及答案
- 2025年高職統(tǒng)計學(xué)(統(tǒng)計教育心理學(xué)案例分析)試題及答案
- 遺產(chǎn)分割協(xié)議書
- 京瓷哲學(xué)手冊樣本
- 形神拳動作名稱與圖解
- 博士生入學(xué)復(fù)試面試報告?zhèn)€人簡歷介紹含內(nèi)容模板兩篇
- 食品工廠設(shè)計 課件 第二章 廠址選擇
- 2023年生產(chǎn)車間各類文件匯總
- WORD版A4橫版密封條打印模板(可編輯)
- 2013標致508使用說明書
- 中考滿分(合集15篇)
- 《大數(shù)據(jù)營銷》-課程教學(xué)大綱
- GB/T 18993.1-2020冷熱水用氯化聚氯乙烯(PVC-C)管道系統(tǒng)第1部分:總則
評論
0/150
提交評論