Реферат: Метод динамічного програмування
Доведемо, що спряжені змінні задовольняють спряженій системі
,
.(21)
Для цього припустимо, що функція Беллмана має неперервні частинні похідні другого порядку. Позначимо
.(22)
Оскільки оптимальне керування однозначно визначає оптимальну траєкторію
, то функція
досягає на кожному фіксованому
по змінній
максимального значення, рівного 0, у точці
, що відповідає оптимальному керуванню
в цій точці. У цьому випадку для функції
в будь-який момент часу для процесу
буде виконана умова
,
,
.(23)
Продиференціюємо співвідношення (22):
,
.
Тоді відповідно до (23) для оптимального процесу дістанемо
,
.(24)
Оскільки
,
то співвідношення (24) можна переписати у вигляді:
,
або, з урахуванням позначень (21),
,
.
Оскільки , то
,
а це, у свою чергу означає, що
,
.
Отже, встановлено теоретичний зв'язок принципу максимуму з методом динамічного програмування. Але на практиці виконати подібну операцію не завжди можливо. Так наприклад, рівняння (21) було отримано в припущенні, що функція Беллмана має неперервні похідні другого порядку, що не завжди виконується.
Обидва методи придатні для задач, у яких відсутні обмеження на керування, і всі функції гладкі. Кожний з цих методів може бути застосований там, де не працює інший. Рівняння Беллмана вимагає більше припущень для застосування (неперервність і диференційованість функцій), а принцип максимуму складніше використовувати для розв’язання дискретних задач.