Контрольная работа: Чисельне розвязання задач оптимального керування
Кінець алгоритму.
3. Оптимальне стохастичне керування: формулювання із зовнішнім інтегралом
Розглянемо відображення , що задане формулою
, (17)
за таких припущень:
параметр приймає значення з вимірного простору
. Для будь-якої фіксованої пари
задана ймовірнісна міра
на просторі
, а символ
у формулі (12) означає зовнішній інтеграл відносно цієї міри. Отже,
;
функції і
відображують множину
відповідно в множини
і
, тобто
,
;
скаляр додатний.
Формули (1), (6) є окремими випадками відображення з (12). Очевидно, що відображення (1) для детермінованої задачі випливає з (12), якщо множина
складається з єдиного елемента, а відображення (6) (для стохастичної задачі зі зліченним простором збурень) відповідає випадку, коли множина
зліченна, а
є
-алгеброю, складеною із всіх підмножин
.
Очевидно, що відображення з (12) задовольняє припущенню монотонності. Якщо на множини
,
і функції
,
і
накласти вимоги вимірності, то витрати за
кроків
можна визначити в термінах звичайного інтегрування для будь-якої стратегії
, для якої функції
,
вимірні.
Для початкового стану і стратегії
ймовірнісні міри
, ...,
у сукупності із системою рівнянь
,
(18)
визначають єдину міру на
-кратному прямому добутку
копій простору
. У випадку, якщо
,
, і виконується одна з умов
або
,
то функція витрат за кроків, що відповідає вимірній стратегії
, приводиться до звичайного вигляду
,
де стани ,
виражено як функції змінних
, ...,
за допомогою рівнянь (13) та початкового стану
.
Рекурентне співвідношення методу динамічного програмування для розв’язання багатоетапних задач оптимального стохастичного керування зі скінченним горизонтом можна записати так:
,
,
де – щільність розподілу величини
.
4 Оптимальне стохастичне керування:мультиплікативний функціонал витрат
Розглянемо відображення , що задане формулою
, (19)
за припущення, що параметр приймає значення зі зліченної множини
відповідно до заданого розподілу ймовірностей, що залежать від стану
і керування
. Вважатимемо також, що
,
,
,
. Тоді відображення
з формули (14) задовольняє припущенню монотонності.
Якщо ,
, то задача оптимального керування з мультиплікативним функціоналом витрат і скінченним горизонтом
матиме такий вигляд:
, (20)
. (21)