Реферат: Метод динамічного програмування

Вважатимемо, що функція неперервна на будь-якому відрізку і для будь-якої точки фазового простору і будь-якого моменту часу існує оптимальна траєкторія, а функція неперервно диференційована за своїми аргументами. Тоді необхідна умова оптимальності у вигляді рівняння Беллмана (17), (18) для даної задачі матиме вигляд:

,

або

за заданих крайових умов .

Очевидно, що якщо процес – оптимальний, то, будучи підставленим у рівняння Беллмана, він дасть тотожність

.

Зауваження. Оскільки функція Беллмана дорівнює мінімальному значенню цільового функціонала, що характеризує перехід системи в кінцевий стан зі стану , то в задачі оптимальної швидкодії ця функція показує оптимальний час переходу зі стану у фіксований стан .


7 Зв'язок методу динамічного програмування із принципом максимуму

Розглянемо задачу оптимального керування з фіксованими кінцями та вільним часом (6) з цільовим функціоналом , і крайовими умовами , . Вважатимемо, що час невідомий.

Оптимальне керування будемо вибирати серед кусково-неперервних вектор-функцій . За принципом динамічного програмування для оптимального процесу існує такий розв’язок рівняння Беллмана

,(19)

що – значення, на якому досягається мінімум у лівій частині рівняння (19).

Доведемо, що з рівняння (19) випливає існування деякого вектора , який задовольняє співвідношенням принципу максимуму. Нехай – функція Беллмана, що відповідає оптимальному процесу . Розглянемо нову змінну

і нову функцію

,


де .

Використовуючи ці позначення, перетворимо рівняння Беллмана. Очевидно, що

, , ,

тому

Оскільки , то останнє співвідношення можна привести до вигляду:

.(20)

Позначимо

, .

Тоді формула (20) стає аналогом функції Понтрягіна

,


де .

К-во Просмотров: 234
Бесплатно скачать Реферат: Метод динамічного програмування