Lecture4-合作演化1-囚徒困境博弈_第1頁(yè)
Lecture4-合作演化1-囚徒困境博弈_第2頁(yè)
Lecture4-合作演化1-囚徒困境博弈_第3頁(yè)
Lecture4-合作演化1-囚徒困境博弈_第4頁(yè)
Lecture4-合作演化1-囚徒困境博弈_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四講合作演化1

——囚徒困境博弈

主要內(nèi)容引言兩人囚徒困境博弈多人囚徒困境博弈引言:從合作談起一些理由:廣義的社會(huì)科學(xué)中,最根本的單位是“人”人與人之間的關(guān)系構(gòu)成了社會(huì),而最根本的人與人之間的關(guān)系是“合作”經(jīng)濟(jì)學(xué)中,“合作-分工-專業(yè)化生產(chǎn)”是經(jīng)濟(jì)開(kāi)展的一條重要線索〔往往被主流忽略〕相比與更加復(fù)雜的經(jīng)濟(jì)系統(tǒng),“合作”這一問(wèn)題更容易模型化,也更容易仿真;社會(huì)仿真應(yīng)用在“合作”這個(gè)問(wèn)題上更加普遍〔相比于仿真在其他社會(huì)科學(xué)領(lǐng)域的應(yīng)用而言〕引言:從合作談起何為“合作”?Cooperationmeansthatadonorpaysacost,c,forarecipienttogetabenefit,b.為什么“合作”?〔Nowak&Sigmund,2007)Kinselection親緣選擇Directreciprocity直接互惠Indirectreciprocity間接互惠Graphselection圖選擇Groupselection群體選擇簡(jiǎn)單的兩人囚徒困境博弈兩個(gè)囚徒A,B被警察抓住,警察將其分別帶到不同的房間里,然后說(shuō):“我們知道是你倆做了這些,但是我們沒(méi)有足夠的證據(jù),如果你們都繼續(xù)保持沉默,將被判刑1年;如果你們成認(rèn)了罪刑,將被判刑3年;如果你的同伴成認(rèn)了而你沒(méi)有,你將被判刑5年;而如果你成認(rèn)了而你的同伴沒(méi)有,那我們將放你走。”簡(jiǎn)單的兩人囚徒困境博弈囚徒A面臨的選擇保持沉默承認(rèn)罪刑保持沉默1年5年承認(rèn)罪刑

0年3年BA簡(jiǎn)單的兩人囚徒困境博弈兩個(gè)囚徒面臨的選擇理性思考下-不合作個(gè)體理性-集體非理性合作如何發(fā)生?保持沉默承認(rèn)罪刑保持沉默1年,1年5年,0年承認(rèn)罪刑

0年,5年3年,3年BA重復(fù)性的兩人囚徒困境博弈一次性VS重復(fù)性:在一次性博弈中,你和你的同伴僅進(jìn)行一次博弈;在重復(fù)性的博弈中,你和你的同伴在一次博弈之后還很有可能再遇見(jiàn),再次進(jìn)行博弈。對(duì)于參與重復(fù)性博弈的個(gè)人來(lái)說(shuō),其采取的策略集合可能包括:一直合作ALLC〔alwayscooperate〕一直背叛ALLD〔alwaysdefect〕針?shù)h相對(duì)TFT〔tit-for-tat〕……重復(fù)性的兩人囚徒困境博弈囚徒困境博弈的一般性表達(dá)支付水平的上下決定了策略的優(yōu)劣CooperateDefectCooperateR,RS,TDefectT,SP,PPlayerBPlayerAS<P<R<T;S+T<2R重復(fù)性的兩人囚徒困境博弈在重復(fù)性的兩人囚徒困境博弈中,哪種策略是最好的?得到的支付水平最高考慮下面幾種策略:ALLD一直不合作:始終采取“背叛”策略ALLC一直合作:始終采取“合作”策略TFT針?shù)h相對(duì):第一次合作;此后,如果對(duì)方上一輪合作,那么合作;反之GTFT廣義的針?shù)h相對(duì):如果對(duì)方在上一輪合作,那么合作;但當(dāng)對(duì)方上一輪背叛的時(shí)候,也會(huì)以一定概率合作。WSLS如果得到了R或者T的支付,那么會(huì)繼續(xù)同樣的策略,如果我合作那么繼續(xù)合作,反之;如果得到了S或者P的支付,那么轉(zhuǎn)向另一種策略。重復(fù)性的兩人囚徒困境博弈NetLogo模型仿真簡(jiǎn)單的模型構(gòu)建CooperateDefectCooperate3,30,5Defect5,01,1PlayerBPlayerA重復(fù)性的兩人囚徒困境博弈NetLogo模型仿真策略集合ALLC:一直合作ALLD:一直背叛Tit-for-tat:針?shù)h相對(duì)Tit-for-two-tatsRandom:隨機(jī)Unforgiving:不原諒Win-stay-lose-shift重復(fù)性的兩人囚徒困境博弈Step1A和B兩個(gè)人分別一直采取ALLC和ALLD策略;Step2A一直采取ALLC策略;B可以采取其他任何一種策略;cooperatedefecttit-for-tatwin-stay-lost-shifttit-for-two-tatsunforgivingrandomStep3A和B都可以采取任何一種策略。多人囚徒困境博弈假設(shè)有一群人,其中有合作的人,也有不合作的人。假設(shè)其中合作的人所占的比例為x。對(duì)于一個(gè)合作的人來(lái)說(shuō),他的期望收益為:Fc=Rx+S(1-x)對(duì)于一個(gè)不合作的人來(lái)說(shuō),他的期望收益為:Fd=Tx+P(1-x)CooperateDefectCooperateR,RS,TDefectT,SP,PPlayerBPlayerAS<P<R<T;S+T<2R多人囚徒困境博弈假設(shè)進(jìn)行m輪的重復(fù)博弈:策略1:ALLD一直背叛策略2:GRIM第一次合作;此后只要對(duì)方合作就合作,一旦對(duì)方背叛,那么轉(zhuǎn)為不合作,永遠(yuǎn)背叛。期望支付如下:如果mR>T+(m-1)P,那么ALLD無(wú)法在GRIM的人群中擴(kuò)散。GRIMALLDGRIMmRS+(m-1)PALLDT+(m-1)PmP多人囚徒困境博弈目的:在多種個(gè)體共存的情況下,哪類(lèi)個(gè)體能夠獲得更高的平均支付?如何選擇進(jìn)行博弈的兩個(gè)人?隨機(jī)記憶性策略集合的設(shè)定cooperatedefecttit-for-tatrandomunforgiving多人囚徒困境博

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論