版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
動態(tài)規(guī)劃(Dynamicprogramming)動態(tài)規(guī)劃的基本思想最短路徑問題投資分配問題背包問題
動態(tài)規(guī)劃是解決多階段決策過程最優(yōu)化問題的一種方法。由美國數(shù)學(xué)家貝爾曼(Ballman)等人在20世紀(jì)50年代提出。他們針對多階段決策問題的特點,提出了解決這類問題的“最優(yōu)化原理”,并成功地解決了生產(chǎn)管理、工程技術(shù)等方面的許多實際問題。動態(tài)規(guī)劃是現(xiàn)代企業(yè)管理中的一種重要決策方法,可用于最優(yōu)路徑問題、資源分配問題、生產(chǎn)計劃和庫存問題、投資問題、裝載問題、排序問題及生產(chǎn)過程的最優(yōu)控制等。動態(tài)規(guī)劃模型的分類:以“時間”角度可分成:
離散型和連續(xù)型。從信息確定與否可分成:
確定型和隨機型。從目標(biāo)函數(shù)的個數(shù)可分成:
單目標(biāo)型和多目標(biāo)型。7-1動態(tài)規(guī)劃的基本原理多階段決策過程最優(yōu)化多階段決策過程是指這樣一類特殊的活動過程,他們可以按時間順序分解成若干相互聯(lián)系的階段,在每個階段都要做出決策,全部過程的決策是一個決策序列,所以多階段決策問題也稱為序貫決策問題。例7-1生產(chǎn)與存儲問題某工廠每月需供應(yīng)市場一定數(shù)量的產(chǎn)品。供應(yīng)需求所剩余產(chǎn)品應(yīng)存入倉庫,一般地說,某月適當(dāng)增加產(chǎn)量可降低生產(chǎn)成本,但超產(chǎn)部分存入倉庫會增加庫存費用,要確定一個每月的生產(chǎn)計劃,在滿足需求條件下,使一年的生產(chǎn)與存儲費用之和最小。例7-2投資決策問題某公司現(xiàn)有資金Q億元,在今后5年內(nèi)考慮給A、B、C、D四個項目投資,這些項目的投資期限、回報率均不相同,問應(yīng)如何確定這些項目每年的投資額,使到第五年末擁有資金的本利總額最大。例7-3設(shè)備更新問題企業(yè)在使用設(shè)備時都要考慮設(shè)備的更新問題,因為設(shè)備越陳舊所需的維修費用越多,但購買新設(shè)備則要一次性支出較大的費用?,F(xiàn)在某企業(yè)要決定一臺設(shè)備未來8年的更新計劃,已預(yù)測到第j年購買設(shè)備的價格為Kj,Gj為設(shè)備經(jīng)過j年后的殘值,Cj為設(shè)備連續(xù)使用j-1年后在第j年的維修費用(j=1,2…8),問應(yīng)在哪年更新設(shè)備可使總費用最小。動態(tài)規(guī)劃的基本概念階段;狀態(tài);決策和策略;狀態(tài)轉(zhuǎn)移;指標(biāo)函數(shù)。例7-4(不定階段最短路線問題)如圖是一個五座城市的及其相連道路的交通圖,線上的數(shù)字是對應(yīng)的路長。問:應(yīng)如何選擇行駛路線,才能使從A、B、C、D各城市到E城市的行駛路程最短?AEDCB252755610.53從圖中可以看出,任意兩座城市之間都有道路相通。我們把從一座城市直達(dá)另一座城市作為一個階段。例從A城市到E城市的階段數(shù),少則一個(例從A城市直達(dá)E城市),多則無限(例從A城市通過其他B、C、D三城市循環(huán)到E城市)。為避免循環(huán),加上約束條件:每個城市至多經(jīng)過一次。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形:1.從A城市直達(dá)E城市,一個階段。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形:1.從A城市直達(dá)E城市,一個階段。2.從A城市通過其他B、C、D三城市之一到E城市,二個階段。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形:3.從A城市通過其他B、C、D三城市之二到E城市,三個階段。于是從A城市到達(dá)E城市的階段數(shù)有下列四種情形:3.從A城市通過其他B、C、D三城市之二到E城市,三個階段。4.從A城市通過其他B、C、D三城市各一次到E城市,四個階段。例7-5(一定階段最短路問題)
W先生每天駕車去公司上班。如圖,W先生的住所位于A,公司位于F,圖中的直線段代表公路,交叉點代表路口,直線段上的數(shù)字代表兩路口之間的平均行駛時間。現(xiàn)在W先生的問題是要確定一條最省時的上班路線。A3B14C13D14532B22C23D2E11234C34D35E22FAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF1階段(Stage)
將所給問題的過程,按時間或空間特征分解成若干個相互聯(lián)系的階段,以便按次序去求每階段的解,常用k表示階段變量。我們把從A到F看成一個五階段問題。2狀態(tài)(State)
各階段開始時的客觀條件叫做狀態(tài)。描述各階段狀態(tài)的變量稱為狀態(tài)變量,常用sk表示第k階段的狀態(tài)變量,狀態(tài)變量的取值集合稱為狀態(tài)集合,用Sk表示。
動態(tài)規(guī)劃中的狀態(tài)具有如下性質(zhì):
當(dāng)某階段狀態(tài)給定以后,在這階段以后的過程的發(fā)展不受這段以前各段狀態(tài)的影響。即:過程的過去歷史只能通過當(dāng)前狀態(tài)去影響它未來的發(fā)展,這稱為無后效性。如果所選定的變量不具備無后效性,就不能作為狀態(tài)變量來構(gòu)造動態(tài)規(guī)劃模型。3決策和策略(DecisionandPolicy)
當(dāng)各段的狀態(tài)確定以后,就可以做出不同的決定(或選擇),從而確定下一階段的狀態(tài),這種決定稱為決策。決策變量用dk(Sk)表示,允許決策集合用Dk(Sk)表示。
各個階段決策確定后,整個問題的決策序列就構(gòu)成一個策略,用p1,n(d1,d2,…dn)表示。對每個實際問題,可供選擇的策略有一定的范圍,稱為允許策略集合,用P表示。使整個問題達(dá)到最優(yōu)效果的策略就是最優(yōu)策略。4狀態(tài)轉(zhuǎn)移方程
動態(tài)規(guī)劃中本階段的狀態(tài)往往是上一階段的決策結(jié)果。如果給定了第k段的狀態(tài)Sk,本階段決策為dk(Sk),則第k+1段的狀態(tài)Sk+1由公式:Sk+1=Tk(
Sk,dk)確定,稱為狀態(tài)轉(zhuǎn)移方程。5指標(biāo)函數(shù)
用于衡量所選定策略優(yōu)劣的數(shù)量指標(biāo)稱為指標(biāo)函數(shù)。最優(yōu)指標(biāo)函數(shù)記為fk(Sk)。
動態(tài)規(guī)劃的基本思想:
從過程的最后一段開始,用逆序遞推方法求解,逐步求出各段各點到終點E最短路線,最后求出A點到E點的最短路線。AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=5時,此時d5(S5)=F,其初始狀態(tài)E1或E2,故f5(E1)=4,f5(E2)=2用d5*(S5)表示最優(yōu)決策。AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=4時,有兩個階段,初始狀態(tài)S4可以是D1、D2或D3。如果S4=D1,則下一步只能取E1,故f4(D1)=r(D1,E1)+f5(E1)=2+4=6最短路線:D1——E1——F最優(yōu)解:d4*(D1)=E1AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S4=D2,則下一步能取E1或E2,故f4(D2)=Minr(D2,E1)+f5(E1)
r(D2,E2)+f5(E2)=Min(4+4,3+2)=5最短路線:D2——E2——F最優(yōu)解:d4*(D2)=E2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S4=D3,則下一步只能取E2,故f4(D3)=r(D3,E2)+f5(E2)=5+2=7最短路線:D3——E2——F最優(yōu)解:d4*(D3)=E2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=3時,還有三個階段,初始狀態(tài)S3可以是C1、C2或C3。如果S3=C1,則下一步能取D1或D2,故f3(C1)=Minr(C1,D1)+f4(D1)
r(C1,D2)+f4(D2)=Min(3+6,3+5)=8最短路線:C1——D2——E2——F最優(yōu)解:d3*(C1)=D2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S3=C2,則下一步能取D2或D3,故f3(C2)=Minr(C2,D2)+f4(D2)r(C2,D3)+f4(D3)=Min(3+5,2+7)=8最短路線:C2——D2——E2——F最優(yōu)解:d3*(C2)=D2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S3=C3,則下一步只能取D3,故f3(C3)=r(C3,D3)+f4(D3)=(4+7)=11最短路線:C3——D3——E2——F最優(yōu)解:d3*(C3)=D3AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=2時,還有四個階段,初始狀態(tài)S2可以是B1或B2。如果S2=B1,則下一步能取C1或C2,故f2(B1)=Minr(B1,C1)+f3(C1)
r(B1,C2)+f3(C2)=Min(4+8,5+8)=12最短路線:B1——C1——D2——E2——F最優(yōu)解:d2*(B1)=C1AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF如果S2=B2,則下一步能取C2或C3,故f2(B2)=Minr(B2,C2)+f3(C2)
r(B2,C3)+f3(C3)=Min(2+8,1+11)=10最短路線:B2——C2——D2——E2——F最優(yōu)解:d2*(B2)=C2AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF當(dāng)K=1時,五個階段的原問題,初始狀態(tài)S1是A。則下一步能取B1或B2,故f1(A)=Minr(A,B1)+f2(B1)
r(A,B2)+f2(B2)=Min(3+12,4+10)=14最短路線:A——B2——C2——D2——E2——F最優(yōu)解:d1*(A)=B2,最短用時14.AB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEFAB1B2C1C2C3D1D2D3E1E2F41544445333332222ABCDEF動態(tài)規(guī)劃的函數(shù)方程(DP)
建立DP函數(shù)方程是指確定過程的階段及階段數(shù),規(guī)定狀態(tài)變量和決策變量的取法,給出各階段的狀態(tài)集合,允許決策集合,狀態(tài)轉(zhuǎn)移方程和指標(biāo)函數(shù)等。在上面的計算過程中,利用了第k階段與第k+1階段的關(guān)系:fk(Sk)=Minr(Sk,dk(Sk))+fk+1(Sk+1)
dk(Sk)k=1,2,3,4,5f6(S6)=0
這種遞推關(guān)系稱為動態(tài)規(guī)劃的函數(shù)基本方程。貝爾曼(Ballman)最優(yōu)化原理
作為整個過程的最優(yōu)策略具有這樣的性質(zhì),即無論過去的狀態(tài)和決策如何,對前面的決策所形成的狀態(tài)而言,余下的諸決策必須構(gòu)成最優(yōu)策略。這就是說,不管引導(dǎo)到這個現(xiàn)時狀態(tài)的頭一個狀態(tài)和決策是什么,所有的未來決策應(yīng)是最優(yōu)的。動態(tài)規(guī)劃的優(yōu)點:可把一個N維優(yōu)化問題化成N個一維優(yōu)化問題求解。動態(tài)規(guī)劃的優(yōu)點:可把一個N維優(yōu)化問題化成N個一維優(yōu)化問題求解。DP方程中附加某些約束條件,可使求解更加容易。動態(tài)規(guī)劃的優(yōu)點:可把一個N維優(yōu)化問題化成N個一維優(yōu)化問題求解。DP方程中附加某些約束條件,可使求解更加容易。求得最優(yōu)解以后,可得所有子問題的最優(yōu)解。動態(tài)規(guī)劃的缺點:“一個”問題,“一個”模型,“一個”求解方法。且求解技巧要求比較高,沒有統(tǒng)一處理方法。動態(tài)規(guī)劃的缺點:“一個”問題,“一個”模型,“一個”求解方法。且求解技巧要求比較高,沒有統(tǒng)一處理方法。狀態(tài)變量維數(shù)不能太高,一般要求小于6。
謝謝大家!9、春去春又回,新桃換舊符。在那桃花盛開的地方,在這醉人芬芳的季節(jié),愿你生活像春天一樣陽光,心情像桃花一樣美麗,日子像桃子一樣甜蜜。3月-253月-25Sunday,March9,2025
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年滁州市第一人民醫(yī)院公開招聘工作人員備考題庫及參考答案詳解1套
- 2025年西安市浐灞第一幼兒園招聘備考題庫及答案詳解一套
- 通遼市開魯縣事業(yè)單位2026年第一批次人才引進(jìn)30人備考題庫及答案詳解1套
- 2025年上海市浦東新區(qū)肺科醫(yī)院非編人員招聘備考題庫及1套完整答案詳解
- 2025年興安盟關(guān)于開展區(qū)外引才專場招聘會引進(jìn)高層次人才2513人的備考題庫有答案詳解
- 2025年福建省農(nóng)業(yè)科學(xué)院資環(huán)所芽胞桿菌中心公開招聘科研助理備考題庫及答案詳解一套
- 2025年順昌縣第九屆“人才·南平校園行”緊缺急需教師招聘14人備考題庫及參考答案詳解
- 2025年北京老年醫(yī)院應(yīng)屆畢業(yè)生公開招聘43人備考題庫及1套參考答案詳解
- 2025年網(wǎng)聯(lián)清算有限公司校園招聘26人備考題庫及參考答案詳解1套
- 2025年杭州市丁橋醫(yī)院公開招聘高層次人才7人備考題庫(預(yù)報名)及1套完整答案詳解
- DB3205∕T 1139-2024 巡游出租汽車營運管理規(guī)范
- 醫(yī)藥KA經(jīng)理工作總結(jié)
- 四害消殺員工安全培訓(xùn)課件
- 南京市煙草公司2025秋招市場分析崗位面試模擬題及答案
- 貿(mào)易跟單專業(yè)知識培訓(xùn)課件
- 冠脈痙攣診療新進(jìn)展
- 舞蹈培訓(xùn)機構(gòu)薪酬制度設(shè)計方案
- 乙肝抗病毒治療禁忌癥
- 中職電動機正反轉(zhuǎn)教學(xué)教案示范
- 2025年網(wǎng)安民警考試題庫
- 2025年煤礦礦長招聘考試題庫
評論
0/150
提交評論