Реферат: Метод динамічного програмування
Вважатимемо, що функція неперервна на будь-якому відрізку і для будь-якої точки фазового простору і будь-якого моменту часу існує оптимальна траєкторія, а функція неперервно диференційована за своїми аргументами. Тоді необхідна умова оптимальності у вигляді рівняння Беллмана (17), (18) для даної задачі матиме вигляд:
,
або
за заданих крайових умов .
Очевидно, що якщо процес – оптимальний, то, будучи підставленим у рівняння Беллмана, він дасть тотожність
.
Зауваження. Оскільки функція Беллмана дорівнює мінімальному значенню цільового функціонала, що характеризує перехід системи в кінцевий стан зі стану , то в задачі оптимальної швидкодії ця функція показує оптимальний час переходу зі стану у фіксований стан .
7 Зв'язок методу динамічного програмування із принципом максимуму
Розглянемо задачу оптимального керування з фіксованими кінцями та вільним часом (6) з цільовим функціоналом , і крайовими умовами , . Вважатимемо, що час невідомий.
Оптимальне керування будемо вибирати серед кусково-неперервних вектор-функцій . За принципом динамічного програмування для оптимального процесу існує такий розв’язок рівняння Беллмана
,(19)
що – значення, на якому досягається мінімум у лівій частині рівняння (19).
Доведемо, що з рівняння (19) випливає існування деякого вектора , який задовольняє співвідношенням принципу максимуму. Нехай – функція Беллмана, що відповідає оптимальному процесу . Розглянемо нову змінну
і нову функцію
,
де .
Використовуючи ці позначення, перетворимо рівняння Беллмана. Очевидно, що
, , ,
тому
Оскільки , то останнє співвідношення можна привести до вигляду:
.(20)
Позначимо
, .
Тоді формула (20) стає аналогом функції Понтрягіна
,
де .