版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1,管理決策分析,裴 鳳 合肥工業(yè)大學(xué)管理學(xué)院,2,第二章 隨機(jī)型決策,第二節(jié) 風(fēng)險型決策,第一節(jié) 不確定型決策,主要內(nèi)容:,第三節(jié) 貝葉斯決策*,第四節(jié) 效用決策,3,不確定型決策問題的基本條件:,存在一個明確的目標(biāo); 存在兩種或者兩種以上的自然狀態(tài); 存在兩個或兩個以上可供選擇的行動方案; 可以計算或估計各方案在不同狀態(tài)下的益損值。,第一節(jié) 不確定型決策,問題特征:每一種狀態(tài)發(fā)生的概率未知 常用準(zhǔn)則:樂觀準(zhǔn)則;悲觀準(zhǔn)則;折衷準(zhǔn)則;后悔值準(zhǔn)則; 等可能準(zhǔn)則.,4,例1 某公司欲購進(jìn)一種新產(chǎn)品,有三種采購方案:大量、中量、小量。市場狀況有三種:暢銷、一般、滯銷,但決策者不知道每種市場狀況的可能
2、性。每種狀況下的獲利情況如下表,試建立決策數(shù)學(xué)模型。,第一節(jié) 不確定型決策,5,1.樂觀準(zhǔn)則: 從最樂觀的角度出發(fā),對每個方案按最有利的 狀態(tài)來考慮,從中選取最大收益值,其對應(yīng)的方案即為最 優(yōu)方案。,2.悲觀準(zhǔn)則: 對每個方案按最不利的狀態(tài)來考慮,從這些最 壞的情況中選取最大收益值,相應(yīng)的方案即為最優(yōu)方案。,第一節(jié) 不確定型決策,6,3.折衷準(zhǔn)則(Harwicz準(zhǔn)則),主觀設(shè)定一個0,1之間的樂觀系數(shù)。當(dāng)系數(shù)為0時,為悲觀法,為1時,就是樂觀法。,第一節(jié) 不確定型決策,7,4.后悔值準(zhǔn)則(Savage準(zhǔn)則),后悔值:在某自然狀態(tài)下沒有選擇最優(yōu)方案所帶來的損失,用RV(a,)表示,即:,后悔值準(zhǔn)
3、則:在所有方案的最大后悔值中選取最小值所對應(yīng)的方案,即:,第一節(jié) 不確定型決策,8,第一節(jié) 不確定型決策,9,5.等可能性準(zhǔn)則(Laplace準(zhǔn)則 ),假定各種自然狀態(tài)都以相同的機(jī)會發(fā)生,選擇期望收益最大的方案為最優(yōu)方案。,第一節(jié) 不確定型決策,10,第二節(jié) 風(fēng)險型決策,一、風(fēng)險型決策問題的基本條件和準(zhǔn)則,1.風(fēng)險型決策問題的基本條件,存在一個明確的目標(biāo); 有兩種或者兩種以上的自然狀態(tài); 可以確定每一種自然狀態(tài)發(fā)生的概率; 存在不同的方案可供選擇; 可以計算或估計各方案在不同狀態(tài)下的益損值。,11,2.風(fēng)險型決策問題的常用準(zhǔn)則,(1)最大可能準(zhǔn)則,在發(fā)生概率最大的狀態(tài)發(fā)生的前提下,選擇最優(yōu)方案
4、。,例2 某農(nóng)場要決定在一塊地中種植什么作物,條件如下, 如何決策?,第二節(jié) 風(fēng)險型決策,12,(2) 期望值準(zhǔn)則,選擇期望收益值最大的方案作為最優(yōu)方案,10000.2+40000.7+70000.1 = 3700,第二節(jié) 風(fēng)險型決策,13,注意: 同一個決策問題,使用不同的方法可能會選擇不同的方案。 一般,當(dāng)不同狀態(tài)的發(fā)生概率有很大的區(qū)別,而不同的方案在各種狀態(tài)下的報酬差別不大的情況下,可使用最大可能法,否則使用期望值法。,第二節(jié) 風(fēng)險型決策,14,二、決策樹,例:某農(nóng)場要決定一塊地中選擇什么作物,條件如下,如何決策?,決策樹是求解風(fēng)險型決策問題的重要工具,它是一種將決策問題模型化的樹形圖。
5、決策樹由決策點、方案枝、狀態(tài)點(機(jī)會點)、概率枝(狀態(tài)枝)和結(jié)果點組成。,第二節(jié) 風(fēng)險型決策,15,1,2,決策點,方案枝,狀態(tài)點,概率枝,結(jié)果點,a1,a2,a3,第二節(jié) 風(fēng)險型決策,16,步驟:(1)繪制決策樹 (2)計算各狀態(tài)點的益損期望值 (3)對益損期望值進(jìn)行比較,三、利用決策樹進(jìn)行風(fēng)險型決策,利用決策樹對方案進(jìn)行比較和選擇,一般采用逆向分析法,即先計算出樹形結(jié)構(gòu)的末端的條件結(jié)果,然后由此開始,從后向前逐步分析。 與收益矩陣表相比,決策樹的適應(yīng)面更廣,它并不要求所有的方案具有相同的狀態(tài)空間和概率分布。 它特別適用于求解復(fù)雜的多階段決策問題。,第二節(jié) 風(fēng)險型決策,17,各狀態(tài)點的益損期
6、望值為 :10000.240000.770000.13700 :20000.250000.730000.14200 :30000.260000.720000.15000,3700,4200,5000,故選擇方案a3,收益期望值為5000.,5000,第二節(jié) 風(fēng)險型決策,18,為了適應(yīng)市場需要,某地提出了擴(kuò)大生產(chǎn)的三個方案。 (1)投資600萬元建大工廠, (2)投資280萬元建小工廠, (3)先建小工廠,如銷路好,三年以后擴(kuò)建,追加投資400萬元,每年盈利190萬元。 方案使用期都是十年。試應(yīng)用決策樹評選出合理的決策方案。,例3 利用決策樹法求解下面的決策問題。,第二節(jié) 風(fēng)險型決策,19,建大
7、廠,建小廠,銷路好(0.7),銷路差(0.3),擴(kuò)建,不擴(kuò)建,銷路好(1.0),銷路好(1.0),680萬,719萬,930萬,930萬,560萬,前三年 第一次決策,后七年 第二次決策,2000.710+ (-40)0.310-600=680,19017-400=930,8017=560,800.73+9300.7+600.3(3+7)-280=719,決策方案為:前三年建小廠,如銷路好進(jìn)行擴(kuò)建;總收益為719萬元.,719萬,20,第三節(jié) 貝葉斯決策,管理決策的兩種偏向:(1)缺少調(diào)查,(2)調(diào)查費用過高。 在實際工作中,總希望通過調(diào)查、分析,以獲得有一定可靠度的情報資料。對這類問題的決策
8、分析,要應(yīng)用條件概率和貝葉斯定理,因此,也稱為貝葉斯決策。 貝葉斯決策:為了提高決策質(zhì)量,需要通過市場調(diào)查,收集有關(guān)狀態(tài)變量的補(bǔ)充信息,對先驗分布進(jìn)行修正,用后驗狀態(tài)分布進(jìn)行決策。 貝葉斯決策的意義 貝葉斯決策可以做到少花錢多辦事,提高決策分析的科學(xué)性和效益性。,21,第三節(jié) 貝葉斯決策,一、先驗概率和后驗概率,先驗概率P() :根據(jù)歷史資料或主觀判斷,未經(jīng)實驗證實所確定的概率。,后驗概率P(/ H) :利用補(bǔ)充信息修訂的概率。,利用市場調(diào)查獲取的補(bǔ)充信息值H去修正狀態(tài)變量的先驗分布,即依據(jù)似然分布矩陣所提供的充分信息,用貝葉斯公式求出在信息值H發(fā)生的條件下,狀態(tài)變量的條件分布P(/ H)。,
9、22,二、貝葉斯定理,設(shè)A1、B表示在一個樣本空間中的兩個事件,在事件B發(fā)生條件下事件A1發(fā)生的概率稱為條件概率,記為P(A1|B),且,A1和B的聯(lián)合概率公式為:,若A1和A2構(gòu)成互斥和完整的兩個事件, A1和A2中的一個出現(xiàn)是事件B發(fā)生的必要條件,那么事件B全概率公式為:,第三節(jié) 貝葉斯決策,23,兩個事件的貝葉斯定理:,若A1和A2構(gòu)成互斥和完整的兩個事件, A1和A2中的一個出現(xiàn)是事件B發(fā)生的必要條件,那么兩個事件的貝葉斯公式為:,假定存在一個完整的和互斥的事件A1,A2,An,Ai中的某一個出現(xiàn)是事件B發(fā)生的必要條件,那么n個事件的貝葉斯公式為:,n個事件的貝葉斯定理:,第三節(jié) 貝葉
10、斯決策,24,解:用 H 表示放回摸球摸出4白8黑這一事件;1表示所取為A壇,2表示所取為B壇。則,例1 設(shè)有A和B兩個外形相同、裝有足夠數(shù)量黑白小球的 不透明壇子。A壇中裝有白球30,黑球70;B壇白球70,黑球30。從中任取一壇,作放回摸球12次,觀察的記錄是摸出白球4次,黑球8次,求所取為A壇的概率。,第三節(jié) 貝葉斯決策,25,說明:在進(jìn)行隨機(jī)試驗之前,只能設(shè)定取到A壇的可能性是50,即先驗概率為0.5;在通過隨機(jī)試驗獲得觀察值H后,所取為A壇的可能性增加到96.7,即后驗概率為0.967。,第三節(jié) 貝葉斯決策,26,所謂貝葉斯決策,就是利用補(bǔ)充信息,根據(jù)概率計算中的貝葉斯公式來估計后驗
11、概率,并在此基礎(chǔ)上對備選方案進(jìn)行評價和選擇的一種決策方法。,三、貝葉斯決策,1.貝葉斯決策過程的步驟,(1)先驗分析:指決策者詳細(xì)列出各種自然狀態(tài)及其概率、各種備選行動方案與自然狀態(tài)的損益值,并根據(jù)這些信息對備選方案做出抉擇的過程。,第三節(jié) 貝葉斯決策,依據(jù)數(shù)據(jù)和資料以及經(jīng)驗和判斷,去測算和估計狀態(tài)變量的先驗分布P() ; 計算各可行方案在不同下的條件結(jié)果值; 根據(jù)某種決策準(zhǔn)則評價選擇,找出最滿意方案。,27,三、貝葉斯決策,1.貝葉斯決策過程的步驟,(2)預(yù)驗分析:對補(bǔ)充信息的價值和成本加以比較和分析,以確定是否需要獲取補(bǔ)充信息。,第三節(jié) 貝葉斯決策,判斷:如果信息的價值高于其成本,則補(bǔ)充信
12、息給企業(yè)帶來正效益,應(yīng)該補(bǔ)充信息;反之,補(bǔ)充信息大可不必。 注:如果獲取補(bǔ)充信息的費用很小,甚至可以忽略不計,本步驟可以省略,直接進(jìn)行調(diào)查和收集信息,并依據(jù)獲取的補(bǔ)充信息轉(zhuǎn)入下一步驟。,28,三、貝葉斯決策,1.貝葉斯決策過程的步驟,第三節(jié) 貝葉斯決策,(3)后驗分析:根據(jù)預(yù)驗分析,如果認(rèn)為采集信息和進(jìn)行調(diào)查研究是值得的,那么就應(yīng)該決定去做這項工作,一旦取得了新的信息,決策者就結(jié)合這些新信息進(jìn)行決策分析。結(jié)合運用這些信息并修正先驗概率,稱為后驗分析。,利用補(bǔ)充信息修正先驗分布,得到更加符合實際的后驗分布; 再利用后驗分布進(jìn)行決策分析,選出最滿意的可行方案; 對信息的價值和成本作對比分析,對決策
13、分析的經(jīng)濟(jì)效益情況作出合理的說明。,29,(4)序貫分析: (主要針對多階段決策)是包括有多階段的信息搜集和數(shù)值計算的情況。它包括一系列的先驗分析和預(yù)驗分析、采集新的信息和作出后驗分析和決策。,注:預(yù)驗分析與后驗分析十分相似,只是在預(yù)驗分析階段從未進(jìn)行調(diào)查研究,只是分析采集信息和調(diào)查研究是不是值得。后驗分析是進(jìn)行過調(diào)查研究以后取得新信息以后分析的過程。,第三節(jié) 貝葉斯決策,三、貝葉斯決策,1.貝葉斯決策過程的步驟,30,例2 某企業(yè)為開發(fā)某種新產(chǎn)品需要更新設(shè)備,有三種方案可供選擇:引進(jìn)大型設(shè)備(a1)、引進(jìn)中型設(shè)備(a2)、引進(jìn)小型設(shè)備(a3)。市場對該新產(chǎn)品的需求狀態(tài)也有三種:需求量大(1)
14、、需求量一般(2) 、需求量小(3) 。根據(jù)市場預(yù)測,企業(yè)的收益矩陣如下(單位:萬元),根據(jù)歷年資料,該產(chǎn)品各需求狀態(tài)的概率分別為p(1)=0.3,p(2)=0.4,p(3)=0.3。,第三節(jié) 貝葉斯決策,試對該企業(yè)新產(chǎn)品開發(fā)方案進(jìn)行決策。,31,為使新產(chǎn)品開發(fā)產(chǎn)銷對路,擬試銷作市場調(diào)查,試銷結(jié)果可能有三種:需求量大(H1)、需求量一般(H2)、需求量小(H3)。調(diào)查結(jié)果值的可靠性如下表所示:,32,(1)先驗分析,第三節(jié) 貝葉斯決策,E1maxE(a1),E(a2),E(a3) =17 因此先驗分析后的決策為引進(jìn)大型設(shè)備,期望收益為17 萬元。,33,(2)預(yù)驗分析,第三節(jié) 貝葉斯決策,34
15、,由貝葉斯公式,可得,第三節(jié) 貝葉斯決策,后驗分布矩陣為,35,當(dāng)市場調(diào)查值為H1 (需求量大)時,用H1發(fā)生的后驗分布代替先驗分布,計算各方案的期望收益值。,第三節(jié) 貝葉斯決策,aopt (H1) a1 E (aopt | H1) = 29.2 即:試銷為產(chǎn)品需求量大時,最優(yōu)方案是引進(jìn)大型設(shè)備,期望收益值為29.2。,用后驗分布代替先驗分布,計算各方案的期望收益值。,36,當(dāng)市場調(diào)查值為H2 (需求量一般)時,用H2發(fā)生的后驗分布代替先驗分布,計算各方案的期望收益值。,第三節(jié) 貝葉斯決策,aopt (H2) a1 E (aopt | H2) = 21 即:試銷為產(chǎn)品需求量一般時,最優(yōu)方案也是
16、引進(jìn)大型設(shè)備,期望收益值為21。,37,當(dāng)市場調(diào)查值為H3 (需求量小)時,用H3發(fā)生的后驗分布代替先驗分布,計算各方案的期望收益值。,第三節(jié) 貝葉斯決策,aopt (H3) = a3 E (aopt | H3) = 10 即:試銷為H3產(chǎn)品需求量小時,最優(yōu)方案是引進(jìn)小型設(shè)備,期望收益值為10。,38,第三節(jié) 貝葉斯決策,(3)后驗分析 通過試銷,該企業(yè)可獲得的收益期望值為:,企業(yè)收益期望值增加:,只要試銷所需費用不超過2.99萬元,就應(yīng)該進(jìn)行市場調(diào)查;否則,則不應(yīng)進(jìn)行試銷。,39,(3)后驗分析 在試銷費用不超過2.99萬元的情況下,進(jìn)行試銷,能使該企業(yè)新產(chǎn)品開發(fā)決策取得較好的經(jīng)濟(jì)效益;若試
17、銷費用超過2.99萬元,則不應(yīng)進(jìn)行試銷。 若試銷結(jié)果是該產(chǎn)品需求量大或一般,則應(yīng)該選擇方案a1,即引進(jìn)大型設(shè)備; 若調(diào)查結(jié)果是該產(chǎn)品需求量小,則應(yīng)該選擇方案a3,即引進(jìn)小型設(shè)備。,40,例3 按某工程項目的合同,計劃三個月完工,其施工費與工程完工期有關(guān)。假定天氣是影響工程能否按期完工的決定因素。如果天氣好,工程能按時完工,施工單位可獲利5萬元;如果天氣不好,不能按時完工,施工單位就被罰款1萬元;若不施工,就要損失窩工費2干元。根據(jù)過去的經(jīng)驗,在計劃施工期內(nèi)。天氣好的可能性為30%。為了更好地掌握天氣情況,施工單位擬從氣象臺獲得該地區(qū)過去同一時期的天氣預(yù)報資料。假定氣象臺對于好天氣的預(yù)報正確率為
18、80,對于壞天氣的預(yù)報正確率為90。問應(yīng)如何決策?,第三節(jié) 貝葉斯決策,41,(1)先驗分析,設(shè)1表示天氣好、2表示天氣壞,H1表示預(yù)報天氣好、H2表示預(yù)報天氣壞。,第三節(jié) 貝葉斯決策,42,(2)預(yù)驗分析,第三節(jié) 貝葉斯決策,43,第三節(jié) 貝葉斯決策,44,不要預(yù)報資料,要預(yù)報資料,預(yù)報天氣好H1,預(yù)報天氣壞H2,施工,不施工,天氣好1,8000,36200,36200,-2000,天氣壞2,施工,不施工,天氣好1,-4600,-2000,天氣壞2,施工,不施工,天氣好1,8000,-2000,天氣壞2,-2000,9842,0.3,0.7,0.77,0.23,0.09,0.91,0.31,
19、0.69,45,第三節(jié) 貝葉斯決策,(3)后驗分析 若獲得天氣預(yù)報資料,該施工單位可獲得的收益期望值為:,企業(yè)收益期望值增加:,只要獲取天氣預(yù)報的費用不超過1842元,就應(yīng)該獲取天氣預(yù)報;否則,則不必獲取天氣預(yù)報。,46,(3)后驗分析 在獲取天氣預(yù)報費用不超過1842元的情況下,獲取天氣預(yù)報,能使該施工單位決策取得較好的經(jīng)濟(jì)效益;若獲取天氣預(yù)報費用超過1842元,則不應(yīng)獲取天氣預(yù)報。 若預(yù)報天氣好,則應(yīng)該選擇方案a1,即施工; 若預(yù)報天氣壞,則應(yīng)該選擇方案a2,即不施工。,47,2.貝葉斯決策的優(yōu)點及其局限性,優(yōu)點: (1)貝葉斯決策能對信息的價值或是否需要采集新的信息做出科學(xué)的判斷。 (2
20、)它能對調(diào)查結(jié)果的可能性加以數(shù)量化的評價,而不是像一般的決策方法那樣,對調(diào)查結(jié)果或者是完全相信,或者是完全不相信。 (3)如果說任何調(diào)查結(jié)果都不可能完全準(zhǔn)確,先驗知識或 主觀概率也不是完全可以相信的,那么貝葉斯決策則巧妙地將這兩種信息有機(jī)地結(jié)合起來了。 (4)它可以在決策過程中根據(jù)具體情況不斷地使用,使決策逐步完善和更加科學(xué)。,第三節(jié) 貝葉斯決策,48,局限性: (1)它需要的數(shù)據(jù)多,分析計算比較復(fù)雜,特別在解決復(fù)雜問題時,這個矛盾就更為突出。 (2)有些數(shù)據(jù)必須使用主觀概率,有些人不太相信,這也妨礙了貝葉斯決策方法的推廣使用。,第三節(jié) 貝葉斯決策,49,四、信息的價值,第三節(jié) 貝葉斯決策,從
21、前面的分析看出,利用補(bǔ)充信息來修正先驗概率,可以使決策的準(zhǔn)確度提高,從而提高決策的科學(xué)性和效益性。因此,信息本身是有價值的能帶來收益。 但獲得的情報越多,花費也更多。 因此有一個獲取補(bǔ)充信息是否有利的問題:收益與成本的比較。 問題:如何衡量信息的價值?,50,1.完全信息的價值(EVPI),四、信息的價值,完全信息:能夠提供狀態(tài)變量真實情況的補(bǔ)充信息。 即在獲得補(bǔ)充情報后就完全消除了風(fēng)險情況,風(fēng)險決策就轉(zhuǎn)化為確定型決策。,完全信息值Hi : 設(shè)Hi 為補(bǔ)充信息值,若存在狀態(tài)值0,使得條件概率P(0/ Hi)=1 ,或者當(dāng)狀態(tài)值 0時,總有P(/ Hi)=0 。則稱信息值Hi為完全信息值。(補(bǔ)充
22、信息可靠性100%),第三節(jié) 貝葉斯決策,51,完全信息值Hi的價值:掌握完全信息值Hi前后收益值的增加量。,四、信息的價值,第三節(jié) 貝葉斯決策,設(shè)決策問題的收益函數(shù)為Q=Q(a,),其中a為行動方案,為狀態(tài)變量。 若Hi為完全信息值,掌握了Hi的最滿意的行動方案為a(Hi) ,其收益值為 Q(a(Hi),)maxQ(a,) 驗前最滿意行動方案為aopt ,其收益值為Q(aopt ,),則稱掌握了完全信息值Hi前后的收益值增量: maxQ(a,)-Q(aopt ,) 為在狀態(tài)變量為時的完全信息值Hi的價值。,52,完全信息價值 如果補(bǔ)充信息值 Hi對每一個狀態(tài)值都是完全信息值,則完全信息值Hi
23、 對狀態(tài)的期望收益值稱為完全信息價值的期望值(expected value of perfect information),簡稱完全信息價值,記做EVPI。,第三節(jié) 貝葉斯決策,四、信息的價值,53,在例2中 如果補(bǔ)充信息(試銷市場調(diào)查)的準(zhǔn)確度很高,試銷需求量大,則100%需求量大;試銷需求量一般,則100%需求量一般;試銷需求量小,則100%需求量小;這時: P(1| H1)=1, P(2| H1)= 0 , P(3| H1)= 0 P(1| H2)=0, P(2| H2)= 1 , P(3| H2)= 0 P(1| H3)=0, P(2| H3)= 0 , P(3| H3)= 1 則H1
24、(試銷需求量大)、H2(試銷需求量一般) 、H3(試銷需求量小)都是完全信息值(完全情報)。,第三節(jié) 貝葉斯決策,四、信息的價值,54,第三節(jié) 貝葉斯決策,在例2中,若H1、H2 、H3都是完全信息值 驗前最滿意行動方案為a1 (引進(jìn)大型設(shè)備) 完全信息值H1的價值 = 50-50 = 0 完全信息值H2的價值 = 25-20 = 5 完全信息值H3的價值 = 10-(-20) = 30 完全信息價值為: EVPI=00.3+50.4+300.3=11(萬元),55,2.補(bǔ)充信息的價值(EVAI),四、信息的價值,實際工作中取得完全情報是非常困難的。,補(bǔ)充信息值Hi 的價值: 決策者掌握了補(bǔ)充
25、信息值 Hi前后期望收益值的增加量(或期望損失值的減少量)。 補(bǔ)充信息價值:全部補(bǔ)充信息值Hi 價值的期望值,稱為補(bǔ)充信息價值的期望值。簡稱補(bǔ)充信息價值,記做EVAI(Expected Value of Additional Information)。,第三節(jié) 貝葉斯決策,56,在例2中:驗前最滿意行動方案為a1 (引進(jìn)大型設(shè)備),E1=E(aopt,)=E(a1,)=17(萬元) a(H1)=a1, a(H2)=a1 , a(H3)=a3,第三節(jié) 貝葉斯決策,EVAI=E2-E1=19.99-17=2.99(萬元),57,3.補(bǔ)充信息價值與完全信息價值的關(guān)系,第三節(jié) 貝葉斯決策,任何補(bǔ)充信息
26、價值都是非負(fù)的,且不超過完全信息的價值。,信息價值對管理決策的意義 任何補(bǔ)充信息決不會降低決策方案的經(jīng)濟(jì)效益。 完全信息是一類特殊的補(bǔ)充信息,是最有價值的信息。,四、信息的價值,58,引例 某稀有金屬礦為支援國家四化建設(shè),準(zhǔn)備在近期增加礦產(chǎn)量,今制訂了兩個增產(chǎn)方案,一是新建一批礦井(“新建”),一是對原有老礦井進(jìn)行技術(shù)改造(“改舊”)。根據(jù)該礦現(xiàn)有技術(shù)力量和以往生產(chǎn)經(jīng)驗,“改舊”把握極大,5年內(nèi)可穩(wěn)獲利潤250萬元;而“新建”則把握不大,如能成功,5年內(nèi)將獲利2000萬元,反之,若失敗,則要虧損1000萬元,據(jù)以往經(jīng)驗,開發(fā)成功的概率為0.5,問采用何種方案?,第四節(jié) 效用決策,59,若按益損
27、期望值的大小作為決策準(zhǔn)則,將采用“新建”方案,計算如下:,新建,改舊,成功(0.5),成功(1.0),500,500,250,失敗(0.5),第四節(jié) 效用決策,60,效用反映決策者對某種利益和損失所獨有的感覺和反應(yīng),效用值:用效用概念衡量人們對同一期望值在主觀上的價值,效用函數(shù)(曲線)反映決策者的效用值與益損值的對應(yīng)關(guān)系.,效用決策:將結(jié)果用效用值代替,以期望效用最大為決策準(zhǔn)則.,一、效用的定義和公理體系,基數(shù)效用:用諸如1,2,3,這種確定的數(shù)量來測量和區(qū)分人們行為中的滿足程度,由此形成了大小關(guān)系 序數(shù)效用:用次序或優(yōu)先關(guān)系來描述人們滿足程度的一種分析方法,它認(rèn)為人們的效用是無法測量的,但可
28、以根據(jù)偏好來排序,1.基本概念,第四節(jié) 效用決策,61,事態(tài)體:各種后果(n種,n2)及后果出現(xiàn)的概率的組合,記為 T=( p1,o1;p2,o2; ; pn,on ),效用函數(shù)的定義: 在集合T上的實值函數(shù)u, 若它和T上的優(yōu)先關(guān)系一致,即 則稱u為效用函數(shù)。,第四節(jié) 效用決策,62,2.效用存在性公理(理性行為公理),公理1(連通性)若T1,T2T,則或者T1 T2,或者T1 T2, 或者T1T2.,公理2(傳遞性)若T1,T2,T3T,且T1 T2,T2 T3,則 T1 T3,若T1T2, T2T3,則T1T3.,公理3(復(fù)合保序性)若T1,T2,QT,且01,則T1 T2當(dāng)且僅當(dāng) .,
29、公理4(相對有序性)若T1,T2,T3T,且T1 T2 T3 ,則存在數(shù)p,q(0p1,0q1),使得,第四節(jié) 效用決策,63,二、效用曲線的作法,U=U(x) ,U 效用值 0,1,x 益損值。 對特定問題,0和1分別對應(yīng)于最壞和最好情況。,第四節(jié) 效用決策,64,假如決策者面臨兩種可選方案A1和A2: 若選A1,則將以概率P獲得收益o1,以概率1-P獲得收益o2;若選A2,則可穩(wěn)得收益o3,(o1o3o2). 此時若方案A1與A2相當(dāng),則效用值相等,表達(dá)式為: PU(o1)+(1-P)U(o2)=U(o3) (1),(1)概率當(dāng)量法 調(diào)整概率P的值使A1, A2相當(dāng),則由(1)式可得o3的
30、效用。,(2)確定當(dāng)量法 取P=0.5(或介于01之間的其他給定值),調(diào)整o3的值使A1, A2相當(dāng)。,第四節(jié) 效用決策,65,例如:對于引例中的問題 方案A1:以0.5的概率得到2000萬元收益,以0.5的概率遭受 1000萬元損失。 方案A2:以1的概率得到250萬元收益。,最大益損值2000萬元的效用值為1,最小益損值-1000萬元的效用值為0。則得到兩個點 (2000,1), (-1000,0),第四節(jié) 效用決策,66,通過逐步辨優(yōu)獲得效用值 方案A1 方案A2 0.5 2000 0.5 -1000 穩(wěn)得250 選方案A2 0.5 2000 0.5 -1000 穩(wěn)得100 選方案A2 0.5 2000 0.5 -1000
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)康培訓(xùn)生管理制度
- 放療三基培訓(xùn)與考核制度
- 員工輪崗培訓(xùn)制度
- 庫管員培訓(xùn)制度
- 教師外出培訓(xùn)財務(wù)制度
- 崗位風(fēng)險預(yù)控培訓(xùn)制度
- 化驗員培訓(xùn)制度
- 加油站培訓(xùn)制度
- 舞蹈培訓(xùn)機(jī)構(gòu)激勵制度
- 在職護(hù)士分層培訓(xùn)制度
- 2026天津市津南創(chuàng)騰經(jīng)濟(jì)開發(fā)有限公司招聘8人筆試參考題庫及答案解析
- 特種作業(yè)培訓(xùn)課件模板
- 2025年時事政治知識考試試題題庫試題附答案完整版
- 高校宿舍管理員培訓(xùn)課件
- 河南省開封市2026屆高三年級第一次質(zhì)量檢測歷史試題卷+答案
- 員工通勤安全培訓(xùn)課件
- 歲末年初安全知識培訓(xùn)課件
- 全國秸稈綜合利用重點縣秸稈還田監(jiān)測工作方案
- 吞咽障礙患者誤吸的預(yù)防與管理方案
- 中小企業(yè)人才流失問題及對策分析
- 2026年湖南鐵路科技職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫含答案
評論
0/150
提交評論