Lecture4-合作演化1-囚徒困境博弈

上傳人：翰*** IP屬地：廣西上傳時(shí)間：2024-05-26 格式：PPTX 頁(yè)數(shù)：17 大?。?8.40KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩12頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講合作演化1

——囚徒困境博弈

主要內(nèi)容引言兩人囚徒困境博弈多人囚徒困境博弈引言：從合作談起一些理由：廣義的社會(huì)科學(xué)中，最根本的單位是“人”人與人之間的關(guān)系構(gòu)成了社會(huì)，而最根本的人與人之間的關(guān)系是“合作”經(jīng)濟(jì)學(xué)中，“合作-分工-專業(yè)化生產(chǎn)”是經(jīng)濟(jì)開(kāi)展的一條重要線索〔往往被主流忽略〕相比與更加復(fù)雜的經(jīng)濟(jì)系統(tǒng)，“合作”這一問(wèn)題更容易模型化，也更容易仿真；社會(huì)仿真應(yīng)用在“合作”這個(gè)問(wèn)題上更加普遍〔相比于仿真在其他社會(huì)科學(xué)領(lǐng)域的應(yīng)用而言〕引言：從合作談起何為“合作”？Cooperationmeansthatadonorpaysacost,c,forarecipienttogetabenefit,b.為什么“合作”？〔Nowak&Sigmund,2007)Kinselection親緣選擇Directreciprocity直接互惠Indirectreciprocity間接互惠Graphselection圖選擇Groupselection群體選擇簡(jiǎn)單的兩人囚徒困境博弈兩個(gè)囚徒A,B被警察抓住，警察將其分別帶到不同的房間里，然后說(shuō)：“我們知道是你倆做了這些，但是我們沒(méi)有足夠的證據(jù)，如果你們都繼續(xù)保持沉默，將被判刑1年；如果你們成認(rèn)了罪刑，將被判刑3年；如果你的同伴成認(rèn)了而你沒(méi)有，你將被判刑5年；而如果你成認(rèn)了而你的同伴沒(méi)有，那我們將放你走。”簡(jiǎn)單的兩人囚徒困境博弈囚徒A面臨的選擇保持沉默承認(rèn)罪刑保持沉默1年5年承認(rèn)罪刑

0年3年BA簡(jiǎn)單的兩人囚徒困境博弈兩個(gè)囚徒面臨的選擇理性思考下-不合作個(gè)體理性-集體非理性合作如何發(fā)生？保持沉默承認(rèn)罪刑保持沉默1年，1年5年，0年承認(rèn)罪刑

0年，5年3年，3年BA重復(fù)性的兩人囚徒困境博弈一次性VS重復(fù)性：在一次性博弈中，你和你的同伴僅進(jìn)行一次博弈；在重復(fù)性的博弈中，你和你的同伴在一次博弈之后還很有可能再遇見(jiàn)，再次進(jìn)行博弈。對(duì)于參與重復(fù)性博弈的個(gè)人來(lái)說(shuō)，其采取的策略集合可能包括：一直合作ALLC〔alwayscooperate〕一直背叛ALLD〔alwaysdefect〕針?shù)h相對(duì)TFT〔tit-for-tat〕……重復(fù)性的兩人囚徒困境博弈囚徒困境博弈的一般性表達(dá)支付水平的上下決定了策略的優(yōu)劣CooperateDefectCooperateR,RS,TDefectT,SP,PPlayerBPlayerAS<P<R<T;S+T<2R重復(fù)性的兩人囚徒困境博弈在重復(fù)性的兩人囚徒困境博弈中，哪種策略是最好的？得到的支付水平最高考慮下面幾種策略：ALLD一直不合作：始終采取“背叛”策略ALLC一直合作：始終采取“合作”策略TFT針?shù)h相對(duì)：第一次合作；此后，如果對(duì)方上一輪合作，那么合作；反之GTFT廣義的針?shù)h相對(duì)：如果對(duì)方在上一輪合作，那么合作；但當(dāng)對(duì)方上一輪背叛的時(shí)候，也會(huì)以一定概率合作。WSLS如果得到了R或者T的支付，那么會(huì)繼續(xù)同樣的策略，如果我合作那么繼續(xù)合作，反之；如果得到了S或者P的支付，那么轉(zhuǎn)向另一種策略。重復(fù)性的兩人囚徒困境博弈NetLogo模型仿真簡(jiǎn)單的模型構(gòu)建CooperateDefectCooperate3,30,5Defect5,01,1PlayerBPlayerA重復(fù)性的兩人囚徒困境博弈NetLogo模型仿真策略集合ALLC:一直合作ALLD：一直背叛Tit-for-tat：針?shù)h相對(duì)Tit-for-two-tatsRandom：隨機(jī)Unforgiving：不原諒Win-stay-lose-shift重復(fù)性的兩人囚徒困境博弈Step1A和B兩個(gè)人分別一直采取ALLC和ALLD策略；Step2A一直采取ALLC策略；B可以采取其他任何一種策略；cooperatedefecttit-for-tatwin-stay-lost-shifttit-for-two-tatsunforgivingrandomStep3A和B都可以采取任何一種策略。多人囚徒困境博弈假設(shè)有一群人，其中有合作的人，也有不合作的人。假設(shè)其中合作的人所占的比例為x。對(duì)于一個(gè)合作的人來(lái)說(shuō)，他的期望收益為：Fc=Rx+S(1-x)對(duì)于一個(gè)不合作的人來(lái)說(shuō)，他的期望收益為：Fd=Tx+P(1-x)CooperateDefectCooperateR,RS,TDefectT,SP,PPlayerBPlayerAS<P<R<T;S+T<2R多人囚徒困境博弈假設(shè)進(jìn)行m輪的重復(fù)博弈：策略1：ALLD一直背叛策略2：GRIM第一次合作；此后只要對(duì)方合作就合作，一旦對(duì)方背叛，那么轉(zhuǎn)為不合作，永遠(yuǎn)背叛。期望支付如下：如果mR>T+(m-1)P，那么ALLD無(wú)法在GRIM的人群中擴(kuò)散。GRIMALLDGRIMmRS+(m-1)PALLDT+(m-1)PmP多人囚徒困境博弈目的：在多種個(gè)體共存的情況下，哪類(lèi)個(gè)體能夠獲得更高的平均支付？如何選擇進(jìn)行博弈的兩個(gè)人？隨機(jī)記憶性策略集合的設(shè)定cooperatedefecttit-for-tatrandomunforgiving多人囚徒困境博

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

Lecture4-合作演化1-囚徒困境博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

Lecture4-合作演化1-囚徒困境博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔