Реферат: Метод динамічного програмування

Доведемо, що спряжені змінні задовольняють спряженій системі

, .(21)

Для цього припустимо, що функція Беллмана має неперервні частинні похідні другого порядку. Позначимо

.(22)

Оскільки оптимальне керування однозначно визначає оптимальну траєкторію , то функція досягає на кожному фіксованому по змінній максимального значення, рівного 0, у точці , що відповідає оптимальному керуванню в цій точці. У цьому випадку для функції в будь-який момент часу для процесу буде виконана умова

, , .(23)

Продиференціюємо співвідношення (22):

, .

Тоді відповідно до (23) для оптимального процесу дістанемо

, .(24)

Оскільки

,

то співвідношення (24) можна переписати у вигляді:

,

або, з урахуванням позначень (21),

, .

Оскільки , то

,

а це, у свою чергу означає, що

, .

Отже, встановлено теоретичний зв'язок принципу максимуму з методом динамічного програмування. Але на практиці виконати подібну операцію не завжди можливо. Так наприклад, рівняння (21) було отримано в припущенні, що функція Беллмана має неперервні похідні другого порядку, що не завжди виконується.

Обидва методи придатні для задач, у яких відсутні обмеження на керування, і всі функції гладкі. Кожний з цих методів може бути застосований там, де не працює інший. Рівняння Беллмана вимагає більше припущень для застосування (неперервність і диференційованість функцій), а принцип максимуму складніше використовувати для розв’язання дискретних задач.

К-во Просмотров: 231
Бесплатно скачать Реферат: Метод динамічного програмування