概念
一個(gè)最優(yōu)決策應(yīng)具有這樣的性質(zhì),不管初始狀態(tài)和初始決策如何,剩下的決策(整個(gè)最優(yōu)決策中的一部分)對(duì)于從這一級(jí)開(kāi)始的后續(xù)多級(jí)過(guò)程,仍然是一個(gè)最優(yōu)決策。應(yīng)用最優(yōu)性原理,可以把多級(jí)決策問(wèn)題的求解過(guò)程看作是一個(gè)連續(xù)遞推過(guò)程,由后向前逐級(jí)推算。在求解過(guò)程中,前一級(jí)的決策和輸出狀態(tài)只是后一級(jí)的初始條件(初始狀態(tài)),并不影響后續(xù)子過(guò)程的最優(yōu)決策。1
基本原理設(shè)維離散系統(tǒng)為
要求確定最優(yōu)控制,使性能指標(biāo)
最小。式中,是固定的;不受限制(或)。
記為達(dá)到終端狀態(tài)的末級(jí)性能指標(biāo),即有
當(dāng)時(shí),得到
由于控制變量對(duì)當(dāng)前狀態(tài)無(wú)作用,只能改變后續(xù)狀態(tài)變量的值,而且控制變量必然是當(dāng)前狀態(tài)的函數(shù),記最優(yōu)控制得到的性能指標(biāo)為
采用同樣的方法,得到遞推公式
上式稱(chēng)為貝爾曼遞推方程,它是動(dòng)態(tài)規(guī)劃的基本遞推關(guān)系式。由已知的級(jí)過(guò)程的最優(yōu)性能指標(biāo),根據(jù)遞推公式確定最優(yōu)控制,就可得到級(jí)過(guò)程的最優(yōu)性能指標(biāo)。動(dòng)態(tài)規(guī)劃的尋優(yōu)算法是從末級(jí)過(guò)程開(kāi)始的,然后,根據(jù)式子逐級(jí)倒推,最終得到多級(jí)過(guò)程的最優(yōu)決策和最優(yōu)性能指標(biāo)。遞推公式明確指出,每一步倒推時(shí),并不是孤立地考慮當(dāng)前級(jí)的過(guò)程,而是從該級(jí)到最后一級(jí)所有過(guò)程的整體的最優(yōu)決策,使“整體”的性能指標(biāo)最優(yōu)。
動(dòng)態(tài)規(guī)劃的遞推公式再一次重申了一個(gè)重要概念——嵌入原理原理,就是說(shuō),既然表示初始狀態(tài)為的一個(gè)級(jí)過(guò)程中,從第級(jí)開(kāi)始的最后級(jí)過(guò)程的最優(yōu)性能指標(biāo),又表示初始狀態(tài)為的級(jí)的最優(yōu)性能指標(biāo)。嵌入原理的內(nèi)容是,當(dāng)時(shí),一個(gè)級(jí)過(guò)程的最優(yōu)決策和最優(yōu)性能指標(biāo)是被嵌入在一個(gè)級(jí)過(guò)程的最優(yōu)決策過(guò)程之中的。1