Реферат: Динамическое программирование и вариационное исчисление

К описанию последнего состояния можно подойти двояким образом. Это состояние можно рассматривать или как преобразование начального состояния х(о)=с на интервале t2=t1+ τ: х(с, t2)= х(с, t1 + τ) или как преобразование состояния х(с, t1) на интервале τ: х(с, t2)= х[x(с, t1), τ].

Так как оба выражения описывают одно и то же со­стояние, то, приравнивая их, получаем соотношение: х(с, t1 + τ)=х[x(с, t1), τ].

1.2.2. Представление динамического процесса в виде последовательности преобразований

Предположим, что динамический процесс х(с, t) на интервале от 0 до tf может быть естественным или искусственным образом представлен как многошаговый, и найдем подходящий способ описания такого процесса. Для того чтобы получить многошаговый процесс, интервал от 0 до tf следует разбить на n последовательных шагов, длительности которых примем равными τ1,τ2,..., τn. Обозначим через tk(k=0,...,n) моменты окончания k-го шага так, что tk+1= tk+τk+1, а через xk - состояние объекта в момент tk: xk=x(c,tk).

Рассмотрим состояние xk+1=x(c,tk+1)=x(c,tk+τk+1). Это выражение в можно представить в виде: xk+1=x[x(c,tk),τk+1]=x(xk,τk+1).

Это соотношение представляет состояние объекта xk+1 как результат преобразования состояния xk на (k+1)-м шаге.

Введем в рассмотрение оператор Т, который будет означать преобразование состояния процесса за один шаг:

Т (xk) = x(xk, τk+1), k = 0,n-1. Тогда получим: xk+1=Т (xk).

Полагая k=0,n-1, можем описать весь динамический процесс в виде последовательности преобразований

x0=c , x1=Т (x0), …, xn=Т (xn-1).

1.2.3. Многошаговый процесс управления

Динамический процесс, описываемый преобразованием xk+1=Т(xk), является неуправляемым. Для получения управляемого многошагового процесса необходимо иметь возможность на каждом шаге осуществлять не одно преобразование Т(хk), а одно из множества преобразований Тi(хk).

Удобно считать, что конкретный вид преобразования будет зависеть от параметра uk, который на k-м шаге может принимать одно из множества значений Uk. Параметр uk будем называть управлением, а множество Uk - пространством допустимых управлений на k-м шаге. Преобразование, осуществляемое на k-м шаге, теперь можно записать в виде

xk+1=Т(xk, uk), ukUk.

Если в этом соотношении положить последовательно tk=0,n-1 и учесть начальное состояние х0, то получим описание всего управляемого многошагового процесса:

xk+1=Т(xk, uk), ukUk, tk=0,n-1, х0=x(0)=c.

Данное соотношение, называемое разностным уравнением объекта управления, аналогично дифференциальному уравнению, дающему описание непрерывного динамического процесса.


2. Оптимальное управление как вариационная задача

2.1. Математическая формулировка задачи оптимального управления

Характерной тенденцией в построении современных систем автоматического управления является стремление получать системы, которые в некотором смысле являются наилучшими. При управлении технологическими процессами это стремление выражается в том, чтобы улучать максимальное количество продукции высокого качества при ограниченном использовании ресурсов (сырья, энергии и т.п.). В системах управления кораблями, самолетами, ракетами стремятся минимизировать время, по истечении которого объект выходит в заданную точку или на заданную траекторию при ограничении угла отклонения рулей, количества расходуемого топлива и т. п. В следящих и стабилизирующих системах представляет интерес достижение максимальной точности при наличии всевозможных ограничений, накладываемых на координаты регулируемого объекта, исполнительные элементы и регулятор. Во всех этих примерах задачи управления сводятся к нахождению наилучшего в определенном смысле слова процесса из множества возможных процессов, т.е. относятся к классу динамических задач управления.

Как было показано ранее, математическая формулировка динамических задач оптимального управления сводится к следующему. Имеется объект управления, состояние которого характеризуется многомерной переменной х={х1,…,xn}. Характер процессов в объекте управления можно изменять, используя то или иное упвление u из пространства допустимых правлений U. В общем случае управление uU может быть также многомерной величиной u={u1,...,um}. Характер движения объекта управления описывается системой дифференциальных уравнений х=g (х, u), х (0)=с.

За критерий качества управления принимается интегральная оценка вида

J(u)= ,имеющая физический смысл потерь, где Т- время протекания процесса управления, aQ[x(t), u(t)]=q(t) - мгновенные потери в момент t при состоянии системы x(t) и управлении u(t). Добавочными ограничениями могут быть ограничения, накладываемые на количество ресурсов или пределы изменения некоторых параметров, выражающиеся математически соотношением

.

Как было установлено ранее, оптимальным называется такое управление u* из множества допустимых управлений U, при котором для объекта, описываемого дифференциальным уравнением, и заданных огра­ничениях на используемые ресурсы критерий качества управления принимает минимальное (максимальное) значение.

Сформулированная подобным образом задача оптимального управления относится к классу вариационных задач, решением которых занимается раздел математики, получивший название вариационного исчисления. Величина J(u) получила название функционала. В отличие от функции, например, f(x), численные значения которой задаются на множестве значений аргумента х, численные значения функционала J(u) задаются на множестве всевозможных управлений u(t). Задача нахождения оптимального управления сводится к тому, чтобы из множества допустимых управлений U выбрать такое, при котором функционал J(t) принимает минимальное численное значение.


2.2. Постановка вариационной задачи

Обычно задачи, требующие минимизации функционала, подчиненного дифференциальному соот­ношению, при наличии интегрального ограничения заменяются минимизацией нового функционала

J(u)= + λ,

подчиненного только дифференциальному соотношению. Параметр λ, в функционале, получивший название множителя Лагранжа, в задачах оптимизации управления играет роль «цены» ограниченных ресурсов. Его значение находится из граничных условий вариационной задачи.

Возможность упрощения вариационной задачи с интегральными ограничениями посредством введения множителей Лагранжа вытекает из следующей теоремы.

Теорема 1. Если u(t)-оптимальное управление, при котором функционал J(u)= достигает абсолютного минимума и выполняется ограничение , тогда при u(t) достигается абсолютный минимум функционала J(u)=, подчиненного ограничению.

Доказательство: следует от противного. Пусть v(t)-другое управление, отличное от u(t), причем такое, что <

и выполнено условие .

К-во Просмотров: 285
Бесплатно скачать Реферат: Динамическое программирование и вариационное исчисление