博弈與博弈信息成本和信息成本對(duì)博弈的影響_第1頁(yè)
博弈與博弈信息成本和信息成本對(duì)博弈的影響_第2頁(yè)
博弈與博弈信息成本和信息成本對(duì)博弈的影響_第3頁(yè)
博弈與博弈信息成本和信息成本對(duì)博弈的影響_第4頁(yè)
博弈與博弈信息成本和信息成本對(duì)博弈的影響_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈與博弈信息成本和信息成本對(duì)博弈的影響

經(jīng)濟(jì)研究往往忽視經(jīng)濟(jì)活動(dòng)的實(shí)踐。在風(fēng)險(xiǎn)資本市場(chǎng)中,風(fēng)險(xiǎn)資本家聲譽(yù)資本的存在及價(jià)值已經(jīng)被人們接受,并成為投資決策的依據(jù)。但聲譽(yù)的存在及價(jià)值在經(jīng)濟(jì)學(xué)中還未得到最終確認(rèn)。本文將對(duì)經(jīng)濟(jì)學(xué)理性人提出不確定性最小化的假定,建立一個(gè)考慮到時(shí)間和信息成本的博弈模型,分析聲譽(yù)及其價(jià)值存在的基礎(chǔ)和評(píng)價(jià)依據(jù)。該模型是對(duì)KMRW聲譽(yù)模型的一個(gè)改進(jìn)。1風(fēng)險(xiǎn)資本市場(chǎng)上的聲譽(yù)博弈在商業(yè)實(shí)踐中,聲譽(yù)及其價(jià)值的存在是毋庸置疑的。在資本市場(chǎng)上,企業(yè)的聲譽(yù)會(huì)影響股票和債券的價(jià)格。在風(fēng)險(xiǎn)資本市場(chǎng)上,風(fēng)險(xiǎn)資本家的聲譽(yù)會(huì)影響一般投資者的決策,但經(jīng)濟(jì)學(xué)在其發(fā)展過(guò)程中,直到博弈論方法出現(xiàn)后,才有對(duì)聲譽(yù)問(wèn)題的討論。如重復(fù)博弈模型和信息經(jīng)濟(jì)學(xué)的委托代理模型,都涉及到了聲譽(yù)問(wèn)題。但在博弈論中,所有有關(guān)聲譽(yù)問(wèn)題(諸如企業(yè)或個(gè)人是否會(huì)維護(hù)自己的聲譽(yù))的討論,都沒(méi)有給出一致的觀點(diǎn)。1.1合作的存在基礎(chǔ)在第二一階段博弈中人在囚徒困境模型中,聲譽(yù)因素完全不起作用,博弈局中人的最終選擇是不合作,而不是福利經(jīng)濟(jì)學(xué)所預(yù)期的通過(guò)合作實(shí)現(xiàn)帕累托優(yōu)化的結(jié)果。相反,同時(shí)代的無(wú)名氏定理(folktheorem)則注1說(shuō)明了聲譽(yù)存在的必要和可能。但實(shí)現(xiàn)合作需要局中人具有無(wú)限次博弈機(jī)會(huì)以及足夠的耐心,這意味著對(duì)局中人來(lái)說(shuō),博弈機(jī)會(huì)必須是無(wú)限的或無(wú)成本的。但事實(shí)上,對(duì)參與博弈的自然人來(lái)說(shuō),博弈機(jī)會(huì)注2從來(lái)都是有限資源,博弈次數(shù)不可能是無(wú)限的。此外,阿克斯羅德的實(shí)現(xiàn)結(jié)果表明,即使在有限次重復(fù)博弈中,合作行為也頻繁出現(xiàn)。這是無(wú)名氏定理所未能解答的。對(duì)于有限重復(fù)博弈的研究結(jié)果是,在完全信息下,根據(jù)連鎖店悖論,重復(fù)博弈只要次數(shù)有限,就不會(huì)有合作出現(xiàn)。而在不完全信息上,根據(jù)KMRW定理,只要重復(fù)的次數(shù)足夠大,就能產(chǎn)生合作的情況。KMRW聲譽(yù)模型是克瑞普斯等人于1982年提出的,用來(lái)解答有限次重復(fù)博弈中出現(xiàn)合作現(xiàn)象的問(wèn)題。其中,定理成立的前提是,要么是以大于零的概率存在肯定會(huì)在第一階段合作的非理性局中人,要么是理性局中人以大于零的概率呈現(xiàn)非理性狀態(tài),即必須有無(wú)法在事先用經(jīng)濟(jì)學(xué)假定解釋的非理性的局中人存在。KMRW定理的論證基礎(chǔ)是不牢固的,之所以被人們接受,是因?yàn)樗鼭M足且符合常識(shí)。1.2聲譽(yù)效應(yīng)的約束Fama認(rèn)為,激勵(lì)問(wèn)題在委托代理文獻(xiàn)中被夸大了,因?yàn)槁曌u(yù)效應(yīng)也在約束著代理人注3。在博弈論和委托代理理論中,凡是涉及到聲譽(yù)的地方,都要考慮到時(shí)間因素。Fama的觀點(diǎn)還意味著經(jīng)理人的聲譽(yù)在經(jīng)理市場(chǎng)中是有價(jià)值的。1.3聲譽(yù)的虛實(shí)在性Kreps認(rèn)為企業(yè)是“一種聲譽(yù)的載體”。他在有關(guān)不完全合同與產(chǎn)權(quán)問(wèn)題上認(rèn)為,企業(yè)內(nèi)的交易是通過(guò)不完全合同進(jìn)行的,企業(yè)作為一種組織結(jié)構(gòu),是用來(lái)適應(yīng)不可預(yù)見(jiàn)情形的。與企業(yè)締約的雇員承認(rèn)企業(yè)有權(quán)規(guī)定雇員在不可預(yù)見(jiàn)的情形出現(xiàn)時(shí)如何行事的權(quán)力。而雇員之所以認(rèn)可這種權(quán)力,是因?yàn)橄嘈牌髽I(yè)不會(huì)濫用它,即在不可預(yù)見(jiàn)情形出現(xiàn)時(shí)向雇員提出不合情理的要求。簡(jiǎn)要地說(shuō),聲譽(yù)究竟實(shí)在的還是虛在的,這就是聲譽(yù)問(wèn)題。在商業(yè)實(shí)踐中,聲譽(yù)是實(shí)在的,商人、投資者毫無(wú)疑問(wèn)地要考慮經(jīng)營(yíng)對(duì)手的聲譽(yù),并反映到商品的價(jià)格和成本、企業(yè)股票和債券的價(jià)格上。但在現(xiàn)有的經(jīng)濟(jì)學(xué)理論中,聲譽(yù)還是虛在的,在有關(guān)商品的價(jià)格、企業(yè)證券價(jià)格的理論模型中,聲譽(yù)是可有可無(wú)的。這就是經(jīng)濟(jì)學(xué)理論需要改進(jìn)的地方。2不確定性最小在經(jīng)濟(jì)學(xué)對(duì)人的假定中,通常將可以解釋的行為傾向定義為理性的,而將不能解釋的行為傾向定義為非理性的。進(jìn)而在模型中將人定義為理性的,將出現(xiàn)不可解釋行為的情況排除在外,并在此基礎(chǔ)上展開(kāi)分析。如果在對(duì)模型的分析中,為了獲得一個(gè)滿意的結(jié)果而引進(jìn)非理性因素,則意味著模型的設(shè)定和分析是不成功的。在對(duì)人的理性假定中,目前公認(rèn)的假定是,人在給定的條件下有最大化自己偏好的傾向。其偏好是可定義的,在廠商競(jìng)爭(zhēng)理論中為最大化利潤(rùn)或最小化成本,在消費(fèi)者行為理論中則為最大化效用。福利經(jīng)濟(jì)學(xué)的帕累托效率則考慮團(tuán)體最優(yōu)的可行方案。為了解決聲譽(yù)問(wèn)題,本文提出并強(qiáng)調(diào)另一個(gè)假定,即理性人有對(duì)事件未來(lái)結(jié)果的不確定性進(jìn)行最小化的傾向。這個(gè)假定在目前是被忽略的。所謂不確定性是指人們對(duì)所關(guān)注事件的未來(lái)的無(wú)知或無(wú)法控制,表現(xiàn)為對(duì)事件的結(jié)果僅有有限的信息,或是獲取信息所需的成本超出經(jīng)濟(jì)上的可行性,或是無(wú)法控制預(yù)期結(jié)果與實(shí)際產(chǎn)生的差距。不確定性最小化不是簡(jiǎn)單的風(fēng)險(xiǎn)規(guī)避概念,按照Frandk·Knight的定義,風(fēng)險(xiǎn)是指經(jīng)濟(jì)活動(dòng)中可度量的不確定性,狀態(tài)的概率分布是可知的,因而有風(fēng)險(xiǎn)規(guī)避的理性人,同時(shí)也有風(fēng)險(xiǎn)中性的理性人,后者具有控制風(fēng)險(xiǎn)的能力。個(gè)人追求不確定性最小化的內(nèi)在動(dòng)因是,使自己對(duì)事件未來(lái)的結(jié)果有最大可能準(zhǔn)確的預(yù)測(cè)或控制。也就是說(shuō),是控制而不是躲避(廣義的)風(fēng)險(xiǎn)。在囚徒困境問(wèn)題中,博弈論的解決方案之所以不能實(shí)現(xiàn)帕累托有效,一個(gè)明顯的理由是,博弈論和福利經(jīng)濟(jì)學(xué)采用了不同的目標(biāo)函數(shù)。即按照博弈論的個(gè)人理性,不合作是均衡結(jié)果,而按照帕累托標(biāo)準(zhǔn),合作應(yīng)是均衡結(jié)果。古典經(jīng)濟(jì)學(xué)對(duì)個(gè)人理性與集體理性是不加區(qū)別的,因?yàn)榘凑諄啴?dāng)·斯密的理想,市場(chǎng)通過(guò)“看不見(jiàn)的手”使個(gè)人在最大化自身利益的同時(shí),也在客觀上造成帕累托優(yōu)化的效果。這在新古典理論框架下是容易實(shí)現(xiàn)的,但在囚徒困境模型中卻遇到了障礙,個(gè)人理性不能實(shí)現(xiàn)集體理性。注意到,所有得到合作結(jié)果的模型,在論證過(guò)程中,都必須對(duì)博弈局中人使用期望效用最大化的假定,無(wú)名氏定理的KMRW聲譽(yù)模型都是如此。而與此形成明顯對(duì)比的是,在從囚徒困境模型推導(dǎo)出納什均衡的過(guò)程中,則沒(méi)有使用這個(gè)假定。雖然現(xiàn)有文獻(xiàn)中沒(méi)有明確說(shuō)明,這里使用了何種不同于期望效用最大化的假定,或許是認(rèn)為沒(méi)有必要說(shuō)明,但可以認(rèn)為,囚徒困境模型所使用的,是理性人追求不確定性最小化的假定。因?yàn)椴缓献鞯牟呗?是囚徒在無(wú)法控制對(duì)方行為的情況下,惟一可以獲得確定性后果的策略,這在事實(shí)上實(shí)現(xiàn)了不確定性最小化。綜上所述,目前經(jīng)濟(jì)學(xué)在關(guān)于人的假定上存在兩個(gè)方面的沖突:①集體理性不能通過(guò)個(gè)人理性實(shí)現(xiàn),因而對(duì)集體理性的假定與對(duì)個(gè)人理性的假定分離;②個(gè)人理性實(shí)際上是關(guān)于期望效用最大化和不確定性最小化的雙目標(biāo)規(guī)劃,不確定性最小化甚至是更重要的目標(biāo)。需要注意的是,期望效用最大化本是用來(lái)解決風(fēng)險(xiǎn)和收益的多目標(biāo)規(guī)劃問(wèn)題的,但不確定性不能用概率統(tǒng)計(jì)模型來(lái)表達(dá)。按照奈特的觀點(diǎn),確定性、風(fēng)險(xiǎn)和哈姆·勒威提到的非確定性都是在不同程度上退化了的不確定性,因?yàn)槟硞€(gè)不確定性一旦可以用模型來(lái)表達(dá),就說(shuō)明它已經(jīng)在某種程度上不成其為不確定性了。正是由于不確定性在模型化上的困難,使不確定性最小化這一理性目標(biāo)在各種規(guī)劃模型中被有意或無(wú)意地忽略了。在不完全合同和產(chǎn)權(quán)理論中,對(duì)理性人假定的修正是:人是有限理性的。有限理性說(shuō)明,經(jīng)濟(jì)人處理信息的能力有限,但實(shí)際上是應(yīng)理論發(fā)展的需要而對(duì)原有理性假定的某種否定。擔(dān)心的是,在原有的已經(jīng)有些混亂的理性假定上所作的修補(bǔ)會(huì)在將來(lái)造成混沌。換個(gè)角度來(lái)理解有限理性概念,可以發(fā)現(xiàn),新的經(jīng)濟(jì)學(xué)理論所討論的正是理性人不能回避的不確定性問(wèn)題。3局中人的標(biāo)識(shí)能力根據(jù)經(jīng)濟(jì)學(xué)理性人假定的兩個(gè)內(nèi)涵(即期望效用最大化和不確定性最小化)來(lái)建立模型,這樣做的目的之一是排除非理性人的存在或?qū)⑵浼{入理性人的范疇,使新模型有一個(gè)較為牢固的理論基礎(chǔ)。首先假定,存在一個(gè)人數(shù)有限的博弈市場(chǎng)ΜΚΤ={1,2,?,m},m≥2?t∈MKT={1,2,?,m},m≥2?t∈其中:m為市場(chǎng)中人數(shù);t為市場(chǎng)時(shí)鐘的指針,市場(chǎng)存在的總時(shí)間標(biāo)準(zhǔn)化為1;i為市場(chǎng)中的博弈局中人,i=1,2,…,m。博弈在市場(chǎng)中任意兩個(gè)人之間發(fā)生,其順序和次數(shù)是不確定的,但在任意時(shí)刻t最多只能有一次博弈發(fā)生。假定,在任意兩人之間,至少能發(fā)生T≥1次博弈。這樣設(shè)定的理由是,聲譽(yù)效應(yīng)是伴隨著機(jī)會(huì)主義問(wèn)題產(chǎn)生的,如哈特所言,如果沒(méi)有機(jī)會(huì)主義問(wèn)題,聲譽(yù)就沒(méi)有存在的必要。博弈論已有的研究成果表明,參與博弈的人數(shù)越多,機(jī)會(huì)主義問(wèn)題就越嚴(yán)重。所以,有必要設(shè)定成多人博弈模型。其次,時(shí)間和信息都是存在成本的。這是因?yàn)槿耸怯邢蘩硇缘?存在無(wú)法知道或無(wú)法控制的時(shí)間因素和信息因素,也就是說(shuō),存在不確定性,解釋如下:(1)信息成本反映在兩個(gè)方面。不失一般性,為了使問(wèn)題簡(jiǎn)化,假定低信息成本等價(jià)于一個(gè)任意小的正數(shù),而高信息成本等價(jià)于正的無(wú)窮大:①博弈局中人標(biāo)識(shí)對(duì)手是需要成本的:假定局中人i在與局中人j進(jìn)行第一次博弈后,局中人i將與其他局中人進(jìn)行若干次博弈,然后再與局中人j博弈,中間的間隔次數(shù)是不確定的。如果局中人i是低信息成本的,他就可以知道對(duì)方是局中人j并加以標(biāo)識(shí),并在再次與局中人j博弈時(shí)進(jìn)入KMRW聲譽(yù)模型的重復(fù)博弈模式。相反,如果他是高信息成本的,則會(huì)不知道對(duì)手是局中人j或不能加以標(biāo)識(shí),這樣,由于他不能將已經(jīng)博弈過(guò)的對(duì)手和未博弈過(guò)的對(duì)手區(qū)分開(kāi)來(lái),在再次與局中人j博弈時(shí)就不能進(jìn)入重復(fù)博弈模式。所以,對(duì)高成本的局中人i來(lái)說(shuō),實(shí)際上所面臨的是對(duì)手不確定的一次性博弈。這樣,由于局中人處理信息的能力不同,就存在兩類(lèi)不同的局中人。一類(lèi)是有標(biāo)識(shí)能力的局中人,由于有條件進(jìn)入重復(fù)博弈模式,而可能有建立聲譽(yù)以便合作的傾向;另一類(lèi)不具有標(biāo)識(shí)能力,因而不能進(jìn)入重復(fù)博弈,所以固守納什均衡策略,定義為“囚徒”。②博弈局中人了解或控制博弈的次數(shù)是需要成本的:令Tij(i≠j)為局中人i對(duì)與局人j進(jìn)行博弈總次數(shù)的主觀判斷,Tij∧為局中人i與局中人j進(jìn)行博弈的實(shí)際總次數(shù)。在本文中,令上標(biāo)“∧”表示相應(yīng)變量的實(shí)際數(shù)值?!ウ砊ˉˉˉij(t)為在時(shí)刻t上局中人i對(duì)與j已經(jīng)進(jìn)行過(guò)的博弈次數(shù)的主觀判斷。對(duì)于囚徒k來(lái)說(shuō),由于無(wú)法標(biāo)識(shí)對(duì)手j,所以始終有Τkj≡1,ˉΤkj(t)≡0,k≠jTkj≡1,Tˉˉˉkj(t)≡0,k≠j。如果局中人l是非囚徒,且由于其信息成本低而可以了解或有意愿且能夠控制博弈的次數(shù),即Τlj=Τlj∧?ˉΤlj(t)=ˉΤlj∧(t),l≠jTlj=Tlj∧?Tˉˉˉlj(t)=Tˉˉˉlj∧(t),l≠j,稱(chēng)之為“學(xué)習(xí)人”。學(xué)習(xí)人具有最強(qiáng)的信息處理能力,掌握的信息最多。相對(duì)地,如果局中人n是非囚徒,但在了解或控制博弈次數(shù)上具有高的信息成本,或是無(wú)意愿使博弈次數(shù)有限注4,即Τnj=+∞,ˉΤnj(t)=ˉΤnj∧(t),n≠jTnj=+∞,Tˉˉˉnj(t)=Tˉˉˉnj∧(t),n≠j,定義為“聲譽(yù)人”。顯然,如果某次博弈雙方都是聲譽(yù)人,則該博弈就變成無(wú)名氏定理問(wèn)題,完全合作的情況就會(huì)出現(xiàn)。(2)時(shí)間成本反映在3個(gè)方面:①任何博弈人i參與博弈的總次數(shù)是有限的,即存在充分大的正數(shù)M>0,使Τi?∧=m∑j=1,j≠iΤij∧<ΜTi?∧=∑j=1,j≠imTij∧<M②局中人改變自己的行為模式是需要成本的,假定局中人i在與j進(jìn)行第ˉΤTˉˉˉij∧(t)次博弈時(shí)合作,而在與j進(jìn)行第ˉΤij∧(t)+1Tˉˉˉij∧(t)+1次博弈時(shí)繼續(xù)合作,則不需為此付出成本,但若改變行為模式不合作,則需付出成本。反之亦然,從不合作轉(zhuǎn)向合作也需付出代價(jià)。這樣設(shè)定的理由是:改變行為模式需要付出作決策的時(shí)間成本;要求局中人采取盡可能簡(jiǎn)單的有效策略;可排除大多數(shù)采用頻繁改變行為模式的策略所導(dǎo)致的均衡。特別地,假定對(duì)聲譽(yù)人來(lái)說(shuō),改變行為模式是高成本的。③新博弈發(fā)生的概率p(ˉΤij∧(t)+1)p(Tˉˉˉij∧(t)+1)是舊博弈的函數(shù),即Ρ{Τij>ˉΤij∧(t)}=f(ˉΤij∧(t)),fP{Tij>Tˉˉˉij∧(t)}=f(Tˉˉˉij∧(t)),f為定義在上的函數(shù)。最后,在市場(chǎng)中得到3種不同類(lèi)型的理性局中人:①囚徒k?Τkj≡1,ˉΤkj(t)≡0,k≠j;k?Tkj≡1,Tˉˉˉkj(t)≡0,k≠j;②聲譽(yù)人n,Τnj=+∞,ˉΤnj(t)=ˉΤnj∧(t),n≠j;n,Tnj=+∞,Tˉˉˉnj(t)=Tˉˉˉnj∧(t),n≠j;③學(xué)習(xí)人l:Τlj=ˉΤlj∧,ˉΤlj(t)=ˉΤlj∧(t),l≠jTlj=Tˉˉˉlj∧,Tˉˉˉlj(t)=Tˉˉˉlj∧(t),l≠j?,F(xiàn)在來(lái)考慮這3種理性人在市場(chǎng)中采用的策略。假定所有的局中人事先都不知道對(duì)方的類(lèi)型,但知道自己的類(lèi)型。局中人有足夠的耐心,即貼現(xiàn)因子δ充分大,接近于1??巳鹌账刮谋镜那敉嚼Ь持Ц毒仃嚾绫?所示。令sij(t)為局中人i在時(shí)刻t與局中人j博弈時(shí)采用的策略,sij(t)=D表示合作,sij(t)=C表示不合作。(1)囚徒k的策略。由于Τkj≡1,ˉΤkj(t)≡0Tkj≡1,Tˉˉˉkj(t)≡0,囚徒k每一次博弈都和其他博弈相互獨(dú)立,因而與靜態(tài)博弈沒(méi)有差別。不合作是唯一的均衡策略。由于不能通過(guò)期望效用最大化估算收益,最大化期望收益的假定對(duì)囚徒是不適用的。需要集體理性的帕累托標(biāo)準(zhǔn)也不適用。最小化不確定性是唯一適用囚徒的理性人假設(shè)?,F(xiàn)在要說(shuō)明,不合作策略是滿足最小化不確定性標(biāo)準(zhǔn)的。由于囚徒k不能標(biāo)識(shí)對(duì)手,假定時(shí)間成本因素只允許囚徒有限次改變行為模式,比如說(shuō),只允許改變1次,囚徒的策略實(shí)際上只有{始終合作:skj(t)≡D,j≠k,t∈}或{始終不合作:skj(t)≡C,j≠k,t∈},或其他等價(jià)策略。如果采用{始終合作},則不能排除這種可能性,即存在學(xué)習(xí)人l在時(shí)刻t0標(biāo)識(shí)出囚徒后,采用機(jī)會(huì)主義的不合作策略{slk(t)≡C,t∈[t0,1]}以對(duì)囚徒進(jìn)行掠奪。對(duì)囚徒來(lái)說(shuō),這是不滿足不確定性最小化要求的。假定學(xué)習(xí)人改變行為模式的成本低,因而可以在標(biāo)識(shí)出采用{始終合作}囚徒后采用機(jī)會(huì)主義策略,而聲譽(yù)人由于改變行為模式的成本高,即使標(biāo)識(shí)出合作囚徒,也不會(huì)進(jìn)行機(jī)會(huì)主義性的掠奪。命題1在有限人數(shù)的重復(fù)囚徒博弈中,只要存在學(xué)習(xí)人型的局中人,則對(duì)囚徒型局中人來(lái)說(shuō),{始終合作}就不能成為囚徒的均衡策略,而{始終不合作}是其惟一的均衡策略。囚徒的{始終合作}和{始終不合作}策略的優(yōu)點(diǎn)是不需要付出信息和決策成本,在不存在機(jī)會(huì)主義的最佳情況下,囚徒可適用無(wú)名氏定理選用{始終合作}為優(yōu)化的均衡策略。但只要有機(jī)會(huì)主義的存在,囚徒就不能用{始終合作}策略“免費(fèi)搭車(chē)”。囚徒k采用{始終不合作}策略的結(jié)果是,與所有其他局中人博弈結(jié)果都收斂于不合作(C,C),這是個(gè)確定性最大的終極結(jié)果,對(duì)囚徒來(lái)說(shuō),實(shí)現(xiàn)了不確定性的最小化。此外,將看到在本模型中,每個(gè)囚徒的總報(bào)酬為8(m-k0),k0為囚徒總?cè)藬?shù),這也是個(gè)確定性的結(jié)果。(2)聲譽(yù)人n的策略。設(shè)uij(t)=(sij(t),sji(t))為在時(shí)刻t上i與j博弈的結(jié)果。相對(duì)于“針?shù)h相對(duì)”策略注5,聲譽(yù)人n更喜歡“冷酷策略”注6,即{snj(t1)=D,t1∈[0,t0);sjn(t0)=C,t0∈;snj(t2)=C,t2∈(t0,1]}。理由如下:適用KMRW定理,選擇“針?shù)h相對(duì)”還是“冷酷策略”不影響博弈結(jié)果。但“冷酷策略”只要求聲譽(yù)人在發(fā)現(xiàn)對(duì)手的背叛行為后一次性地改變行為模式,這樣在博弈市場(chǎng)中,聲譽(yù)人最多只需改變m-1次行為模式。而采用“針?shù)h相對(duì)”則要求聲譽(yù)人被動(dòng)地應(yīng)付對(duì)方行為模式的變化,實(shí)際上將行為模式控制權(quán)交于對(duì)方之手。由于聲譽(yù)人無(wú)法知曉或控制對(duì)方行為模式的變化,因而無(wú)法控制自己在改變行為模式上的總成本,這種不確定性不是聲譽(yù)人所想要的。也就是說(shuō),“針?shù)h相對(duì)”策略不能滿足聲譽(yù)人對(duì)不確定性最小化的要求,而“冷酷策略”可以滿足這個(gè)要求。顯然,聲譽(yù)人與囚徒的博弈結(jié)果是UΚ={(D,C),(C,C),?,(C,C)}UK={(D,C),(C,C),?,(C,C)}聲譽(yù)人之間的博弈結(jié)果是始終合作UΝ={(D,D),(D,D),?,(D,D)}UN={(D,D),(D,D),?,(D,D)}聲譽(yù)人在KMRW定理中相當(dāng)于非理性人,因而聲譽(yù)人與學(xué)習(xí)人的博弈適用KMRW定理。其中,學(xué)習(xí)人l會(huì)背叛聲譽(yù)人n,而聲譽(yù)人不會(huì)先行背叛的理由是:Tnl=+∞,而Tln=Tln∧。也就是說(shuō),聲譽(yù)人沒(méi)有能力效仿學(xué)習(xí)人,在重復(fù)博弈的最后階段濫用自己的聲譽(yù)。命題2(合作信號(hào)和信息成本)在有限人數(shù)的重復(fù)囚徒博弈中,學(xué)習(xí)人型的局中人或聲譽(yù)人型的局中人在和未曾博弈過(guò)的對(duì)手進(jìn)行首次博弈時(shí),傾向于無(wú)條件選擇合作的策略。根據(jù)KMRW定理和表1的支付矩陣計(jì)算,非囚徒型的局中人i只要有概率p>3/8注7與聲譽(yù)人n博弈,或Tin∧>(11-3p)/5p注8,首次合作策略就優(yōu)于首次不合作策略。不失一般性,假定p是屬于自然的私人信息,或局中人要知道p就必須支付一個(gè)很大的信息成本MP>0。在本模型全過(guò)程的博弈中,學(xué)習(xí)人或聲譽(yù)人采用首次合作的“冷酷策略”所受的最大可能損失為3(m-1)。顯然,只要3(m-1)<MP,學(xué)習(xí)人或聲譽(yù)人就沒(méi)有必要在知道p后再選擇首次合作策略。這樣,首次合作策略的意義在于:①發(fā)出愿意合作的信號(hào);②節(jié)約標(biāo)識(shí)對(duì)手和獲得對(duì)方信息的成本。(3)學(xué)習(xí)人l的策略。由于學(xué)習(xí)人在改變行為模式上是低成本的,假定“針?shù)h相對(duì)策略”和“冷酷策略”對(duì)學(xué)習(xí)人是無(wú)差別的。因?yàn)橹阑蛴幸庠缚刂婆c具體對(duì)手博弈的次數(shù),學(xué)習(xí)人可以運(yùn)用機(jī)會(huì)主義策略最大化自己的期望報(bào)酬。如果囚徒是充分理性的,那么學(xué)習(xí)人針對(duì)囚徒的機(jī)會(huì)主義策略就僅僅是一種可置信的威脅,學(xué)習(xí)人與囚徒的博弈結(jié)果同樣是UΚ={(D,C),(C,C),?,(C,C)}UK={(D,C),(C,C),?,(C,C)}考慮學(xué)習(xí)人l在與局中人j進(jìn)行重復(fù)博弈時(shí)采用末期機(jī)會(huì)主義策略:即從重復(fù)博弈一開(kāi)始就堅(jiān)持“冷酷策略”,直到倒數(shù)第2次博弈,最后一次博弈時(shí)不合作。要說(shuō)明這是學(xué)習(xí)人的一個(gè)均衡策略。命題3(不合作信號(hào)和聲譽(yù)濫用)在有限人數(shù)的重復(fù)囚徒博弈中,學(xué)習(xí)人型的局中人在與其他非囚徒型局中人進(jìn)行博弈時(shí),傾向于僅在預(yù)期的最后一次博弈時(shí)主動(dòng)選擇不合作的策略。適用KMRW定理,學(xué)習(xí)人l與其他非囚徒型局中人j重復(fù)博弈的結(jié)果是UL={(D,D),…,(D,D),(C,D),(C,C),…,(C,C)}。其中,合作次數(shù)為T(mén)0-1,不合作的博弈次數(shù)為T(mén)lj∧-T0,背叛的次數(shù)為1。l在與j的重復(fù)博弈中的總報(bào)酬為5(Τ0-1)+8,Τ0≤Τlj∧若由兩個(gè)學(xué)習(xí)人進(jìn)行博弈,則總有一方先于對(duì)方或與對(duì)方同時(shí)采用背叛策略,因而T0實(shí)際上由首先背叛的一方控制,稱(chēng)首先背叛的一方為控制方。顯然,在與聲譽(yù)人博弈時(shí),學(xué)習(xí)人總是控制方,而在與囚徒博弈時(shí),囚徒總是控制方。當(dāng)學(xué)習(xí)人為控制方時(shí),解下述簡(jiǎn)單規(guī)劃:maxΤ05(Τ0-1)+8s.t.Τ0≤Τlj∧得T*0=Tlj∧,這就是說(shuō)控制方的最優(yōu)策略是在最后一次博弈時(shí)背叛。此外,在本模型中,學(xué)習(xí)人率先背叛的邊際收益是(8-5)-5=-2注9,得不償失,所以沒(méi)有提前背叛的動(dòng)機(jī)。末期機(jī)會(huì)主義策略的意義是:①發(fā)出終止合作的信號(hào);②獲得機(jī)會(huì)主義利益或防止對(duì)方機(jī)會(huì)主義帶來(lái)的損失。推論(1)要使重復(fù)博弈中出現(xiàn)合作,不必要求有非理性人存在。在總?cè)藬?shù)為m的有限人數(shù)重復(fù)博弈中,只要囚徒型局中人數(shù)不超過(guò)m-2,則穩(wěn)定的合作就可能出現(xiàn)。(2)只要囚徒型局中人和學(xué)習(xí)人同時(shí)存在,就不能在重復(fù)博弈中排除囚徒型局中人以堅(jiān)持不合作為均衡策略的現(xiàn)象。(3)囚徒、聲譽(yù)人和學(xué)習(xí)人在均衡策略上的差異,不是來(lái)自于理性上的差異,而是來(lái)自于信息和時(shí)間成本上的差異。4評(píng)估聲譽(yù)價(jià)值4.1局中人在假設(shè)不被重視的情況下,只在每次博弈中,局中人在預(yù)期到對(duì)方可能合作后,可以采用機(jī)會(huì)主義的背叛策略獲得當(dāng)時(shí)的最大利益,也可以繼續(xù)合作以維護(hù)未來(lái)的合作關(guān)系,但要放棄機(jī)會(huì)主義利益。后一種作法是維護(hù)自己聲譽(yù)的行為。因?yàn)榭紤]到失去聲譽(yù),就失去了未來(lái)合作帶來(lái)的收益,所以聲譽(yù)的(主觀)價(jià)值等價(jià)于局中人對(duì)未來(lái)合作收益的預(yù)期。出現(xiàn)維護(hù)聲譽(yù)行為的前提是,必須有局中人在事實(shí)上為將來(lái)的利益放棄了當(dāng)前的機(jī)會(huì)主義利益的情況存在。因此,出現(xiàn)聲譽(yù)行為在模型中至少必須有兩個(gè)階段,也就是說(shuō),必須讓“時(shí)間”因素起作用。單階段模型是不存在“當(dāng)前”和“未來(lái)”之間的區(qū)別的。4.2學(xué)習(xí)人對(duì)未來(lái)的預(yù)期的主觀價(jià)值博弈局中人i對(duì)自己信譽(yù)價(jià)值的判斷,稱(chēng)為i聲譽(yù)的主觀價(jià)值,而局中人j對(duì)i的聲譽(yù)價(jià)值的判斷,稱(chēng)為i聲譽(yù)(對(duì)于j)的客觀價(jià)值。主觀價(jià)值是i的私人信息,客觀價(jià)值是j的私人信息。聲譽(yù)價(jià)值具有向量的性質(zhì)。在重復(fù)博弈模型中,聲譽(yù)人對(duì)未來(lái)的預(yù)期是無(wú)限的,其聲譽(yù)的主觀價(jià)值為正無(wú)窮大。學(xué)習(xí)人對(duì)未來(lái)的預(yù)期隨時(shí)間的延伸而減少,其聲譽(yù)的主觀價(jià)值與時(shí)間因素負(fù)相關(guān)。囚徒?jīng)]有對(duì)未來(lái)的預(yù)期,所以其聲譽(yù)的主觀價(jià)值為零??陀^價(jià)值受兩方面因素影響:①在以往的博弈中i的實(shí)際行為,如有背叛則價(jià)值為零;②j對(duì)i的主觀價(jià)值的推測(cè),在沒(méi)有背判行為出現(xiàn)的前提下,對(duì)主觀價(jià)值的推測(cè)值越高,則客觀價(jià)值越高??紤]聲譽(yù)人n與學(xué)習(xí)人l的博弈,聲譽(yù)人n對(duì)自己聲譽(yù)價(jià)值的主觀判斷是無(wú)窮大,Tnl=+∞,但對(duì)學(xué)習(xí)人l來(lái)說(shuō),由于Tln=Tln∧=Tnl∧<M,l對(duì)i的主觀價(jià)值的推測(cè)值是隨時(shí)間延伸而遞減的。所以在博弈的最后階段,即使i在前面的博弈中始終堅(jiān)持合作,l也沒(méi)有理由認(rèn)為i會(huì)在最后階段合作。4.3k聲譽(yù)的客觀價(jià)值決定機(jī)制作為無(wú)形資產(chǎn)的聲譽(yù)的價(jià)值,實(shí)際上是聲譽(yù)的市場(chǎng)價(jià)值。注意到,在資本市場(chǎng)和經(jīng)理市場(chǎng)以及其他聲譽(yù)發(fā)揮作用的場(chǎng)合中,直接決定聲譽(yù)市場(chǎng)價(jià)值的是客觀價(jià)值。比如說(shuō),經(jīng)理市場(chǎng)中的經(jīng)理人,他對(duì)自己聲譽(yù)價(jià)值的主觀判斷只能決定他在前期博弈中堅(jiān)持合作,但其收入則由市場(chǎng)的判斷決定。這就是說(shuō),一旦主觀價(jià)值和客觀價(jià)值發(fā)生沖突,雖然前者是產(chǎn)生維護(hù)聲譽(yù)行為的基礎(chǔ),但后者對(duì)聲譽(yù)的市場(chǎng)價(jià)值起決定作用。這種客觀價(jià)值決定機(jī)制是否合理呢?現(xiàn)在來(lái)看一下囚徒k與學(xué)習(xí)人l的博弈,對(duì)于囚徒k,其聲譽(yù)的主觀價(jià)值始終為零,在博弈的一開(kāi)始,由于Tlk=Tlk∧=Tkl∧,在沒(méi)有出現(xiàn)背叛的歷史記錄的情況下,k聲譽(yù)的客觀價(jià)值是一非零正數(shù)。這一客觀價(jià)值要后來(lái)出現(xiàn)背叛行為之后才變?yōu)榱恪K?對(duì)于單階段決策模型來(lái)說(shuō),客觀價(jià)值決策機(jī)制是危險(xiǎn)的,因?yàn)樗荒鼙苊飧吖缆曌u(yù)價(jià)值的情況。這種機(jī)制只有在多階段模型中才有效。4.4不受自然人的生命約束聲譽(yù)具有人力資本的特點(diǎn),它不能從一個(gè)載體轉(zhuǎn)移到另一個(gè)載體上。所以,以自然人作為聲譽(yù)的載體,在現(xiàn)有技術(shù)條件下,由于人的生命有限,加上市場(chǎng)中客觀價(jià)值決定機(jī)制,聲譽(yù)的價(jià)值是有限的,且隨著承載人生命的喪失而喪失。使得聲譽(yù)人的聲譽(yù)無(wú)法轉(zhuǎn)化為社會(huì)財(cái)富而積累起來(lái)。企業(yè)作為聲譽(yù)載體的條件是,企業(yè)必須堅(jiān)持像理性聲譽(yù)人那樣行動(dòng)。這要求有成熟的資本市場(chǎng)和經(jīng)理市場(chǎng)作為企業(yè)環(huán)境,同時(shí)企業(yè)必須是產(chǎn)權(quán)可轉(zhuǎn)移的股份制企業(yè)。股份制企業(yè)可以在這兩個(gè)市場(chǎng)中補(bǔ)充稱(chēng)職的所有人和經(jīng)營(yíng)人,從其他要素市場(chǎng)中補(bǔ)充生產(chǎn)、經(jīng)營(yíng)和創(chuàng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論