Контрольная работа: Чисельне розвязання задач оптимального керування
Кінець алгоритму.
3. Оптимальне стохастичне керування: формулювання із зовнішнім інтегралом
Розглянемо відображення , що задане формулою
, (17)
за таких припущень:
параметр приймає значення з вимірного простору . Для будь-якої фіксованої пари задана ймовірнісна міра на просторі , а символ у формулі (12) означає зовнішній інтеграл відносно цієї міри. Отже,
;
функції і відображують множину відповідно в множини і , тобто , ;
скаляр додатний.
Формули (1), (6) є окремими випадками відображення з (12). Очевидно, що відображення (1) для детермінованої задачі випливає з (12), якщо множина складається з єдиного елемента, а відображення (6) (для стохастичної задачі зі зліченним простором збурень) відповідає випадку, коли множина зліченна, а є -алгеброю, складеною із всіх підмножин .
Очевидно, що відображення з (12) задовольняє припущенню монотонності. Якщо на множини , і функції , і накласти вимоги вимірності, то витрати за кроків можна визначити в термінах звичайного інтегрування для будь-якої стратегії , для якої функції , вимірні.
Для початкового стану і стратегії ймовірнісні міри
, ...,
у сукупності із системою рівнянь
, (18)
визначають єдину міру на -кратному прямому добутку копій простору . У випадку, якщо, , і виконується одна з умов
або
,
то функція витрат за кроків, що відповідає вимірній стратегії , приводиться до звичайного вигляду
,
де стани , виражено як функції змінних , ..., за допомогою рівнянь (13) та початкового стану .
Рекурентне співвідношення методу динамічного програмування для розв’язання багатоетапних задач оптимального стохастичного керування зі скінченним горизонтом можна записати так:
, ,
де – щільність розподілу величини.
4 Оптимальне стохастичне керування:мультиплікативний функціонал витрат
Розглянемо відображення , що задане формулою
, (19)
за припущення, що параметр приймає значення зі зліченної множини відповідно до заданого розподілу ймовірностей, що залежать від стану і керування . Вважатимемо також, що , , , . Тоді відображення з формули (14) задовольняє припущенню монотонності.
Якщо , , то задача оптимального керування з мультиплікативним функціоналом витрат і скінченним горизонтом матиме такий вигляд:
, (20)
. (21)