第四章決策理論與方法羅黨動態(tài)決策(下)

上傳人：g*** IP屬地：湖北上傳時間：2023-07-06 格式：PPT 頁數(shù)：15 大小：345KB 積分：0 舉報 版權(quán)申訴

已閱讀5頁，還剩10頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

決策理論與方法

（DecisionMakingTheoryandMethods）

《決策理論與方法》編寫組教育部高等學(xué)校管理科學(xué)與工程類學(xué)科專業(yè)教學(xué)指導(dǎo)委員會推薦教材第四章動態(tài)決策分析學(xué)習(xí)目的了解多階段決策、序貫決策的概念及特點；掌握動態(tài)規(guī)劃與決策樹方法及其在多階段決策、序貫決策中的應(yīng)用。本講內(nèi)容4.3序貫決策

4.3.1序貫決策的基本概念

4.3.2序貫決策的決策方法4.3序貫決策4.3.1序貫決策的基本概念上面的多階段決策，階段數(shù)是確定的。除這種決策外，還有一些決策的階段數(shù)不是事先確定的，它依賴于執(zhí)行決策過程中出現(xiàn)的情況。這種決策問題稱為序貫決策（sequentialdecisionproblem）。序列決策在進行決策后又產(chǎn)生一些新的情況，需要進行新的決策，接著又有一些新的情況，又需要進行新的決策。這樣決策、情況、決策……，這就構(gòu)成一個序列。

4.3序貫決策4.3.1序貫決策的基本概念序貫決策是用于隨機性或不確態(tài)定性動態(tài)系統(tǒng)最優(yōu)化的決策方法。它的特點是：

1）所研究的系統(tǒng)是動態(tài)的，即系統(tǒng)所處的狀態(tài)與時間有關(guān)，可周期（或連續(xù)）地對它觀察；

2）決策是序貫地進行的，即每個時刻根據(jù)所觀察到的狀態(tài)和以前狀態(tài)的記錄，從一組可行方案中選用一個最優(yōu)方案（即作最優(yōu)決策），使取決于狀態(tài)的某個目標(biāo)函數(shù)取最優(yōu)值（極大或極小值）；

3）系統(tǒng)下一步(或未來)可能出現(xiàn)的狀態(tài)是隨機的或不確定的。4.3序貫決策4.3.1序貫決策的基本概念

系統(tǒng)在每次作出決策后下一步可能出現(xiàn)的狀態(tài)是不能確切預(yù)知的，存在兩種情況：

1）系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布是已知的，可用客觀概率的條件分布來描述。對于這類系統(tǒng)的序貫決策研究得較完滿的是狀態(tài)轉(zhuǎn)移律具有無后效性的系統(tǒng)，相應(yīng)的序貫決策稱為馬爾可夫決策過程，它是將馬爾可夫過程理論與決定性動態(tài)規(guī)劃相結(jié)合的產(chǎn)物。

2）系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布不知道，只能用主觀概率的條件分布來描述。用于這類系統(tǒng)的序貫決策屬于決策分析的內(nèi)容。4.3序貫決策4.3.2序貫決策的決策方法

序貫決策的過程是：從初始狀態(tài)開始，每個時刻做出最優(yōu)決策后，接著觀察下一步實際出現(xiàn)的狀態(tài)，即收集新的信息，然后再做出新的最優(yōu)決策，反復(fù)進行直至最后。解決序貫決策問題的有效辦法仍然是決策樹，解決序貫決策的關(guān)鍵是確定一個決策序列終止的原則。在下例中，這個原則就是：不管到?jīng)Q策的哪個階段，只要有一個非經(jīng)抽樣的后悔期望值小于進行一次抽樣的費用，決策序列便可終止。4.3序貫決策4.3.2序貫決策的決策方法

例4-3-1某工廠的產(chǎn)品每1000件裝成一箱出售。每箱中產(chǎn)品的次品率有0.01，0.40，0.90三種可能，其概率分別為0.2，0.6，0.2?，F(xiàn)在的問題是：出廠前是否要對產(chǎn)品進行嚴(yán)格檢驗，將次品挑出?？梢赃x擇的行動有兩個：①整箱檢驗，檢驗費為每箱100元；②整箱不檢驗，但如果顧客在使用中發(fā)現(xiàn)次品，每件次品除條換為合格品外還要賠償0.25元損失費。為了更好地做出決定可以先從一箱中隨機抽取1件作為樣本檢驗它，然后根據(jù)這件產(chǎn)品是都次品再決定該箱是否要檢驗，抽樣成本為4.2元。進行第一次抽樣后，除選擇檢驗還是不檢驗外，還可以根據(jù)前面抽樣的結(jié)果，考慮再進行一次抽樣檢驗如此形成一個決策序列。該廠應(yīng)該如何決策。4.3序貫決策4.3.2序貫決策的決策方法

解（1）假設(shè)為整箱檢驗；為整箱不檢驗；而表示次品率分別0.01，0.40，0.90的三種自然狀態(tài)；表示抽取一件樣品的行動，表示抽取第二件樣品的行動；，為抽樣時次品和合格品的兩個結(jié)果。

4.3序貫決策4.3.2序貫決策的決策方法

（2）計算益損值和后悔值矩陣。

產(chǎn)品檢驗問題的收益矩陣見表4-3-1。由表4-3-1的收益矩陣可得到各行動方案的后悔值矩陣，見表4-3-2。

表4-3-1：收益矩陣表

表4-3-2：后悔矩陣表

（0.2）（0.6）（0.2）-100-100-100-100-2.5-100-100-105（0.2）（0.6）（0.2）97.500001254.3序貫決策4.3.2序貫決策的決策方法

（3）抽取一件樣品的抽樣分布見表4-3-3。計算各有關(guān)概率。

表4-3-3：抽樣結(jié)果條件概率分布表矩陣表

抽樣θ

（0.2）

（0.6）

（0.2）0.990.60.10.010.40.94.3序貫決策4.3.2序貫決策的決策方法

（4）畫出決策樹圖4-3-1，圖中表示決策階段，表示第一次抽樣、第二次抽樣

圖4-3-1：決策樹

4.3250.283733.300.71630.4220.5782519.503.731.177846.174.1091.9092.9660.7660.60382.21.17782.20.46212.22.20.462153.312.2本章小結(jié)

本章介紹了動態(tài)決策的基

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第四章決策理論與方法羅黨動態(tài)決策(下)

文檔簡介

溫馨提示

最新文檔

評論

第四章決策理論與方法羅黨動態(tài)決策(下)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔