第4章動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt

上傳人：n*** IP屬地：河南上傳時(shí)間：2020-07-10 格式：PPT 頁(yè)數(shù)：42 大?。?93KB 積分：20 舉報(bào) 版權(quán)申訴

第4章動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt_第2頁(yè)

第4章動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt_第3頁(yè)

第4章動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt_第4頁(yè)

第4章動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt_第5頁(yè)

已閱讀5頁(yè)，還剩37頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第4章動(dòng)態(tài)規(guī)劃(Dynamic Programming),動(dòng)態(tài)規(guī)劃的基本概念和思想最短路徑問(wèn)題背包問(wèn)題投資分配問(wèn)題,例 5.1.1 管道設(shè)計(jì),最短路問(wèn)題就是從某地出發(fā)，途經(jīng)若干中間點(diǎn)最后到達(dá)目的地，要求找出路程或費(fèi)用最小的路線。一般的最短路問(wèn)題將在下一章討論，這里只討論分層的最短路問(wèn)題。下面的管道設(shè)計(jì)問(wèn)題(例5.1.1)就是其中之一。,從A點(diǎn)到E點(diǎn)要鋪設(shè)一條煤氣管道，中間必須經(jīng)過(guò)三個(gè)中間站，第一站可在B1、B2、B3中選擇，第二站可在C1、C2、C3中選擇，第三站可在D1、D2、D3中選擇，要求選擇一條由A 到E的鋪管路線，使總長(zhǎng)度最短。其中兩點(diǎn)連線上的數(shù)字表示兩點(diǎn)間管線的

2、長(zhǎng)度。,從A點(diǎn)到E點(diǎn)鋪設(shè)管道，可以按其地理特點(diǎn)自然地分成四個(gè)階段：（如下圖所示）從A到B是第一階段，從B到C是第二階段，從C到D是第三階段，從D到E是第四階段，,在階段2，從B3點(diǎn)出發(fā)，只有C1、C3兩種可選擇的點(diǎn)，如選C1,則C1就是階段2在B3點(diǎn)的決策結(jié)果； C1點(diǎn)既是階段2鋪設(shè)管道的終點(diǎn)，又是階段3鋪設(shè)管道的起點(diǎn)；,5,4,2,6,3,4,6,5,6,1,2,2,2,3,3,2,3,4,同樣的理由，可以遞推得其余階段的鋪設(shè)路線，如階段3在C1點(diǎn)的決策是D1，階段4在D1點(diǎn)的決策只有E點(diǎn)；由于到E點(diǎn)是整個(gè)鋪設(shè)管道的終點(diǎn)，至此，決策過(guò)程完成，鋪設(shè)一條A點(diǎn)到E點(diǎn)的管道是由四個(gè)階段的管道組

3、成的，如A-B3-C1-D1-E，它也稱(chēng)為一個(gè)策略。,5,4,2,6,3,4,6,5,6,1,2,2,2,3,3,2,3,4,可以看出，各個(gè)階段的決策不同，鋪設(shè)的管道也不同，并且當(dāng)某個(gè)階段的始點(diǎn)給定后，它直接影響著后面各階段的行進(jìn)路線和管道的長(zhǎng)短，而后面各階段的路線的選取不受這點(diǎn)以前各階段路線的影響。,5,4,2,6,3,4,6,5,6,1,2,2,2,3,3,2,3,4,因此，最短路線問(wèn)題可簡(jiǎn)化為四個(gè)階段的決策問(wèn)題，使由這四個(gè)階段決策組成決策序列，也稱(chēng)為策略所決定的一條路線的總長(zhǎng)度最短。,遞推關(guān)系式為:,例 5.1.2 多階段資源分配問(wèn)題,設(shè)有數(shù)量為x的某種資源，將它投入兩種生產(chǎn)方式A和B

4、中：以數(shù)量y投入生產(chǎn)方式A，剩下的量投入生產(chǎn)方式B，則可得到收入g(y)+h(x-y)，其中g(shù)(y)和h(y)是已知函數(shù)，并且g(0)=h(0)=0；同時(shí)假設(shè)以y與x-y分別投入兩種生產(chǎn)方式A，B后可以回收再生產(chǎn)，回收率分別為a與b。試求進(jìn)行n個(gè)階段后的最大總收入。,若以y與x-y分別投入生產(chǎn)方式A與B，在第一階段生產(chǎn)后回收的總資源為x1=ay+b(x-y)，再將x1 投入生產(chǎn)方式A和B，則可得到收入g(y1)+h(x1-y1)，繼續(xù)回收資源x2=ay1+b(x1-y1)，若上面的過(guò)程進(jìn)行n個(gè)階段，我們希望選擇n 個(gè)變量y,y1,y2,yn-1，使這n個(gè)階段的總收入最大。,因此，問(wèn)題就變

5、成：求y,y1,y2,yn-1，以使g(y)+h(x-y)+ g(y1)+h(x1-y1)+ +g(yn-1)+h(xn-1-yn-1) 達(dá)到最大，且滿足條件 x1=ay+b(x-y) x2=ay1+b(x1-y1) xn-1=ayn-2+b(xn-2-yn-2) yi與xi均非負(fù),i=1,2, ,n-1,開(kāi)始有資源x,再進(jìn)行k階段生產(chǎn)并采取最優(yōu)分配策略后得到的最大總收入,當(dāng)k=1時(shí)，有當(dāng)k=2時(shí)，有,x,A,B,y,x-y,第一階段,回收,x1=ay+b(x-y),A,B,第二階段,y1,x1-y1,遞推關(guān)系式為:,例 5.1.3 生產(chǎn)和存儲(chǔ)控制問(wèn)題,某工廠生產(chǎn)某種季節(jié)性商品，需要作下一

6、年度的生產(chǎn)計(jì)劃，假定這種商品的生產(chǎn)周期需要兩個(gè)月，全年共有6個(gè)生產(chǎn)周期，需要作出各個(gè)周期中的生產(chǎn)計(jì)劃。,設(shè)已知各周期對(duì)該商品的需要量如下表所示：,假設(shè)這個(gè)工廠根據(jù)需要可以日夜兩班生產(chǎn)或只是日班生產(chǎn)，當(dāng)開(kāi)足日班時(shí)，每一個(gè)生產(chǎn)周期能生產(chǎn)商品15個(gè)單位，每生產(chǎn)一個(gè)單位商品的成本為100元。當(dāng)開(kāi)足夜班時(shí)，每一生產(chǎn)周期能生產(chǎn)的商品也是15個(gè)，但是由于增加了輔助性生產(chǎn)設(shè)備和生產(chǎn)輔助費(fèi)用，每生產(chǎn)一單位商品的成本為120元。由于生產(chǎn)能力的限制，可以在需求淡季多生產(chǎn)一些商品儲(chǔ)存起來(lái)以備需求旺季使用，但存儲(chǔ)商品是需要存儲(chǔ)費(fèi)用的，假設(shè)每單位商品存儲(chǔ)一周期需要16元，問(wèn)應(yīng)該如何作生產(chǎn)和存儲(chǔ)計(jì)劃，才能使總的生產(chǎn)和

7、存儲(chǔ)費(fèi)用最小？,設(shè)第i個(gè)周期的生產(chǎn)量為xi，周期末的存儲(chǔ)量為uj，那么這個(gè)問(wèn)題用式子寫(xiě)出來(lái)就是：求x1, x2,x6， u1, u2, u3, u4, u5,（ u0, u6 已知）,滿足條件：,Sk是這個(gè)周期的商品的需要量。,x1+u0=5+u1 x2+u1=5+u2 x3+u2=10+u3 x4+u3=30+u4 x5+u4=50+u5 x6+u5=8+u6,即,1500,3300,15,30,其中,其生產(chǎn)和庫(kù)存費(fèi)用為,用表示開(kāi)始的庫(kù)存量為u0, 第k個(gè)周期末庫(kù)存量為uk的前k個(gè)周期的最優(yōu)生產(chǎn)和庫(kù)存費(fèi) 用, 遞推關(guān)系式為:,多階段決策問(wèn)題,一.簡(jiǎn)介 1.研究對(duì)象:用來(lái)解決多階段決策過(guò)

8、程最優(yōu)化的一種數(shù)量方法。 2.方法:把一個(gè)n 維決策問(wèn)題變換為幾個(gè)一維最優(yōu)化問(wèn)題，從而一個(gè)一個(gè)地去解決。 3.劃分:系統(tǒng)的動(dòng)態(tài)過(guò)程可以按照時(shí)間或空間進(jìn)程分為狀態(tài)相互聯(lián)系而又相互區(qū)別的各個(gè)階段；每個(gè)階段都要進(jìn)行決策, 4.目的:在多階段決策過(guò)程中目的是使整個(gè)過(guò)程的決策達(dá)到最優(yōu)效果。,例如生產(chǎn)庫(kù)存問(wèn)題,產(chǎn)品倉(cāng)庫(kù)容量H=9。期初庫(kù)存量為2，要求期末（七月底）庫(kù)存量為0。每個(gè)月生產(chǎn)的產(chǎn)品在月末入庫(kù)。求最優(yōu)生產(chǎn)計(jì)劃xk,分析處理方法,靜態(tài)處理線性(整數(shù))規(guī)劃動(dòng)態(tài)處理動(dòng)態(tài)規(guī)劃,生產(chǎn)庫(kù)存問(wèn)題的動(dòng)態(tài)結(jié)構(gòu),按月分7個(gè)階段,8個(gè)狀態(tài),一般多階段決策問(wèn)題的結(jié)構(gòu),二、基本概念 1、階段：把一個(gè)問(wèn)題的過(guò)程，恰當(dāng)

9、地分為若干個(gè)相互聯(lián)系的階段，以便于按一定的次序去求解。描述階段的變量稱(chēng)為階段變量，常用自然數(shù)k表示。階段的劃分，一般是根據(jù)時(shí)間和空間的自然特征來(lái)進(jìn)行的，但要便于問(wèn)題轉(zhuǎn)化為多階段決策。,2、狀態(tài)：表示每個(gè)階段開(kāi)始所處的自然狀況或客觀條件。通常一個(gè)階段有若干個(gè)狀態(tài)，描述過(guò)程狀態(tài)的變量稱(chēng)為狀態(tài)變量，常用sk表示第k階段的狀態(tài)變量。,狀態(tài)變量的取值有一定的允許集合或范圍，此集合稱(chēng)為狀態(tài)允許集合，用表示表示第k階段的狀態(tài)。,1,2,3,4,例如,狀態(tài)變量,狀態(tài),分為四個(gè)階段，五個(gè)狀態(tài),S1=A, S2=B1,B2,B3,S3=C1,C2,C3 S4=E1, E2, E3,S5=F.,S1,S2,S3,

10、S4,S5,3、決策：(從一個(gè)階段的狀態(tài)到下一個(gè)階段狀態(tài) 的選擇),描述決策的變量，稱(chēng)為決策變量。決策變量是狀態(tài)變量的函數(shù)用xk(sk)表示。在實(shí)際問(wèn)題中決策變量的取值往往在某一范圍之內(nèi)，此范圍稱(chēng)為允許決策集合, 用表示。,S3,可以在各個(gè)階段進(jìn)行決策，去控制過(guò)程發(fā)展的多階段過(guò)程；其發(fā)展是通過(guò)一系列的狀態(tài)轉(zhuǎn)移來(lái)實(shí)現(xiàn)的。,4、多階段決策過(guò)程,5. 狀態(tài)轉(zhuǎn)移方程：是確定過(guò)程由一個(gè)狀態(tài)到另一個(gè)狀態(tài)的演變過(guò)程，描述了狀態(tài)轉(zhuǎn)移規(guī)律。,圖示如下：,其狀態(tài)轉(zhuǎn)移方程如下（一般形式）,能用動(dòng)態(tài)規(guī)劃方法求解的多階段決策過(guò)程是一類(lèi)特殊的多階段決策過(guò)程，即具有無(wú)后效性的多階段決策過(guò)程。,動(dòng)態(tài)規(guī)劃中能處理的狀態(tài)

11、轉(zhuǎn)移方程的形式。,狀態(tài)具有無(wú)后效性的多階段決策過(guò)程的狀態(tài)轉(zhuǎn)移方程如下,無(wú)后效性(馬爾可夫性),如果某階段狀態(tài)給定后，則在這個(gè)階段以后過(guò)程的發(fā)展不受這個(gè)階段以前各段狀態(tài)和決策（歷史）的影響；,狀態(tài)轉(zhuǎn)移方程是確定過(guò)程由一個(gè)狀態(tài)到另一個(gè)狀態(tài)的演變過(guò)程。如果已知第k階段狀態(tài)變量sk的值、該階段的決策變量一經(jīng)確定，第k+1階段狀態(tài)變量sk+1的值也就確定。,6.策略：從初始階段到最終階段，每一階段的決策所形成的序列,子策略：從k階段到最終階段n，每一階段的決策所形成的序列,最優(yōu)子策略：最優(yōu)效果的子策略，記為,7. 指標(biāo)函數(shù):分為階段指標(biāo)函數(shù)和過(guò)程指標(biāo)函數(shù)。階段指標(biāo)函數(shù)是指第k階段，從狀態(tài)sk出發(fā)，采用決策xk時(shí)的效益值，用rk(sk,xk)表示。過(guò)程指標(biāo)函數(shù)是指過(guò)程所包含的各階段的狀態(tài)和決策所產(chǎn)生的總的效益值.記為 Rk,nRk,n(sk,xk,sk+1,xk+1,sn,xn),最優(yōu)指標(biāo)函數(shù)：對(duì)應(yīng)于從狀態(tài) sk 出發(fā)的最優(yōu)子策略,的效益。記為,k,n,即從k到最終階段n過(guò)程指標(biāo)函數(shù)的最優(yōu)值。,Bellman(1951提出)最優(yōu)性原理,“作為整個(gè)過(guò)程的最優(yōu)策略具有這樣的性質(zhì)：無(wú)論過(guò)去的狀態(tài)和決策如何，余下的決策必然形成最優(yōu)子策略”,即若某一全過(guò)程最優(yōu)策略為,則對(duì)上述策略中所隱含的任意狀態(tài)

人人文庫(kù)> 全部分類(lèi)> 生活休閑 > 科普知識(shí)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第4章動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第4章 動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第4章動(dòng)態(tài)規(guī)劃1 引例和基本概念.ppt