Реферат: Метод динамічного програмування
Вважатимемо, що функція неперервна на будь-якому відрізку
і для будь-якої точки фазового простору
і будь-якого моменту часу
існує оптимальна траєкторія, а функція
неперервно диференційована за своїми аргументами. Тоді необхідна умова оптимальності у вигляді рівняння Беллмана (17), (18) для даної задачі матиме вигляд:
,
або
за заданих крайових умов .
Очевидно, що якщо процес – оптимальний, то, будучи підставленим у рівняння Беллмана, він дасть тотожність
.
Зауваження. Оскільки функція Беллмана дорівнює мінімальному значенню цільового функціонала, що характеризує перехід системи в кінцевий стан зі стану
, то в задачі оптимальної швидкодії ця функція показує оптимальний час переходу
зі стану
у фіксований стан
.
7 Зв'язок методу динамічного програмування із принципом максимуму
Розглянемо задачу оптимального керування з фіксованими кінцями та вільним часом (6) з цільовим функціоналом , і крайовими умовами
,
. Вважатимемо, що час
невідомий.
Оптимальне керування будемо вибирати серед кусково-неперервних вектор-функцій . За принципом динамічного програмування для оптимального процесу
існує такий розв’язок
рівняння Беллмана
,(19)
що – значення, на якому досягається мінімум у лівій частині рівняння (19).
Доведемо, що з рівняння (19) випливає існування деякого вектора , який задовольняє співвідношенням принципу максимуму. Нехай
– функція Беллмана, що відповідає оптимальному процесу
. Розглянемо нову змінну
і нову функцію
,
де .
Використовуючи ці позначення, перетворимо рівняння Беллмана. Очевидно, що
,
,
,
тому
Оскільки , то останнє співвідношення можна привести до вигляду:
.(20)
Позначимо
,
.
Тоді формула (20) стає аналогом функції Понтрягіна
,
де .