Реферат: Синтез оптимальных уравнений

Разумеется, невозможно решить систему дифференциальных уравнений (1.2) (т. е. найти закон движения объекта), не зная каким образом будут меняться с течением времени управляющие параметры u 1 , u 2 ,…, ur . Напротив, зная поведение величин u 1 , u 2 ,…,ur , т. е. зная управляющие функции u 1 (t), u 2 (t),…, ur (t) для t >t 0 мы сможем из системы уравнений

(1.4)

или, что то же самое, из векторного уравнения

(1.5)

однозначно определить движение объекта (при t >t 0 ), если нам известно начальное фазовое состояние объекта (в момент t=t 0 ). Иначе говоря, задание управления u(t) и начального фазового состояния x 0 однозначно определяет фазовую траекторию x(t) при t >t 0 , что согласуется со сделанными ранее (стр. 1) предположениями о свойствах объекта.

Тот факт, что задание начального фазового состояния (в момент t=t 0 ) позволяет из системы (1.4) однозначно определить фазовую траекторию x(t), t >t 0 , вытекает из теоремы о существовании и единственности решений системы дифференциальных уравнений. Предположим, что, зная начальное фазовое состояние x 0 и управление u(t)=(u 1 (t),…, ur (t)), мы определили фазовую траекторию x(t) (с помощью системы (1.4)). Если мы изменим управление u(t) (сохранив то же начальное состояние x 0 ), то получим некоторую другую траекторию, исходящую из той же точки x 0 ; вновь изменим управлениеu( t) – получим ещё одну траекторию и т. д. Таким образом, рассматривая различные управления u( t) , мы получим много траекторий, исходящих из точки x 0 (рис. 12). (Разумеется, это не противоречит теореме единственности в теории дифференциальных уравнений, так как, заменяя функции u 1 ( t),…, ur ( t) другими функциями, мы переходим от системы дифференциальных уравнений относительно фазовых координат x 1 ,…, xn . )

Напомним, что задача оптимального быстродействия заключается в отыскании такого управления u( t) , для которого фазовая траектория x( t) , соответствующая этому управлению в силу уравнения (1.5), проходит через точку x 1 и переход из x 0 вx 1 осуществляется за кратчайшее время. Такое управление u( t) будем называть оптимальным управлением (в смысле быстродействия) ; точно так же соответствующую траекторию x( t) буде называть оптимальной траекторией .

4. Допустимые управления. Обычно управляющие параметры u 1 ,…, ur не могут принимать совершенно произвольные значения, а подчинены некоторым ограничениям. Так, например, в случае объекта, описанного на стр. 4, естественно предположить, что сила u , развиваемая двигателем, не может быть как угодно большой по величине, а подчинена ограничениям αuβ , где α и β – некоторые постоянные, характеризующие двигатель. В частности, при α= ─1, β= 1 мы получаем ограничение ─1≤u ≤1, которое означает, что двигатель может развивать силу, направленную вдоль оси x 1 как в положительном, так и в отрицательном направлении, но не превосходящую единицы по абсолютной величине.

Для объектов, содержащих r управляющих параметров u 1 ,…, ur , в приложениях часто встречается случай, когда эти параметры могут произвольно меняться в следующих пределах:

α 1u 1 β 1 , α 2u 2β 2 ,…, α r ur βr .

Иначе говоря, каждая из величин u 1 , u 2 ,…, u r в уравнениях (1.2) представляет собой отдельный управляющий параметр, область изменения которого не зависит от значений остальных

управляющих параметров и задаётся неравенствами

α i ui β i , i= 1,…,r. (1.6)

Заметим, что при r =2 точки u= (u 1 , u 2 ), координаты которых подчинены неравенствам (1.6), заполняют прямоугольник; при r= 3 неравенства (1.6) определяют в пространстве переменных u 1 , u 2 , u 3 прямоугольный параллелепипед; в случае произвольного r говорят, что неравенства (1.6) определяют r-мерный параллелепипед.

В общем случае будем считать, что в соответствии с конструкцией объекта и условиями его эксплуатации задано в пространстве переменных u 1 ,…, ur некоторое множество U и управляющие параметры u 1 , u 2 ,…, ur должны в каждый момент времени принимать лишь такие значения, чтобы точка u= (u 1 , u 2 ,…, ur ) принадлежала множеству U . Иначе говоря, разрешается рассматривать лишь такие управления u( t) , что u( t) U для любого t . Множество U в дальнейшем будем называть областью управления . Область управления U не всегда будет параллелепипедом; она может иметь геометрически более или менее сложный характер, так как в силу конструкции объекта между управляющими параметрами u 1 , u 2 ,…, ur могут существовать связи, выражаемые, например, уравнениями вида φ(u 1 , u 2 ,…, ur )=0 или неравенствами ψ(u 1 , u 2 ,…, ur )≤0. Так, если параметры u 1 , u 2 характеризуют векторную величину на плоскости, модуль которой не превосходит единицы, а направление произвольно, то эти параметры подчинены только одному условию

(u 1 )2 +(u 2 )2 ─1≤0 (1.7)

и область управления U представляет собой круг. В дальнейшем будем предполагать, что указание области управления входит в математическое определение объекта, т. е. что для математического задания управляемого объекта надо указать закон его движения (1.2) и область управления U .

Наконец, сделаем ещё одно, весьма существенное предположение о характере управлений. Именно, будем предполагать, что «рули», положения которых характеризуются управляющими параметрами u 1 , u 2 ,…, ur , безынерционны, так что мы можем, если нужно, мгновенно переключать эти «рули» из одного положения в другое, т. е. менять скачком значения управляющих параметров u 1 , u 2 ,…, ur . В соответствии с этим будем рассматривать не только непрерывные, но и кусочно-непрерывные управления u( t) . Кроме того, будем предполагать, что каждое рассматриваемое управление u( t) непрерывно на концах отрезка t 0tt 1 , на котором оно задано, т. е. что все точки разрыва, если они есть, расположены на интервале t 0 <t <t 1 . Для удобства условимся называть допустимым управлением всякую кусочно-непрерывную функцию u (t ), t 0tt 1 , со значениями в области управления U , непрерывную справа в точках разрыва (для определённости нам так удобно предполагать) и непрерывную в концах отрезка [t 0 ; t 1 ], на котором она задана.

Задача об оптимальных быстродействиях уточняется теперь следующим образом:

Среди всех допустимых управлений u= u( t), под воздействием которых управляемый объект (1.3) переходит из заданного начального фазового состояния x 0 в предписанное конечное состояние x 1 , найти такое, для которого этот переход осуществляется за кратчайшее время

§ 2. Об основных направлениях в теории оптимальных процессов

5. Метод динамического программирования. Для управляемого объекта, описанного в предыдущем параграфе, мы рассмотрим задачу об оптимальном переходе ─ в смысле быстродействия ─ из фазового состояния x в фазовое состояние x 1 . При этом конечную фазовую точку x 1 будем считать фиксированной, а в качестве начальной точки x будем рассматривать различные точки фазового пространства. Мы будем предполагать в этом пункте, что для рассматриваемого управляемого объекта выполняется следующая гипотеза:

Г и п о т е з а 1. Какова бы ни была отличная от x 1 точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x 0 в точку x 1 (рис. 6).

Время, в течение которого осуществляется оптимальный переход из точки x 0 в точку x 1 , обозначим через T( x ). В дальнейших рассуждениях будет удобно вместо T( x ) ввести функцию ω (x ), отличающуюся от неё знаком

ω (x )= ─T(x ). (1.8)

Так как каждая точка x фазового пространства имеет координаты x 1 ,…, xn , то ω (x )= ─T( x ) является функцией от n переменных, т. е. ω (x )= ω (x 1 ,…, xn ). Поэтому имеет смысл говорить о непрерывности этой функции (по совокупности переменных x 1 ,…, xn ) и о дифференцируемости этой функции по каждой из переменных x 1 ,…, xn .

А также будем предполагать, что для рассматриваемого управляемого объекта выполняется следующая гипотеза:

Г и п о т е з а 2. Функция ω (x ) непрерывна и всюду, кроме точки x 1 , имеет непрерывные частные производные

Пусть теперь x 0 ─ произвольная отличная от x 1 точка фазового пространства, а u 0 ─ произвольная точка области U . Предположим, что объект находится в момент t 0 в фазовом состоянии x 0 и движется в течение некоторого времени под воздействием постоянного управления u= u 0 . Фазовую траекторию объекта при этом движении обозначим через y (t)=(y 1 ( t),…, yn ( t )). Таким образом, фазовая траектория y( t ) при t> t 0 удовлетворяет уравнениям

К-во Просмотров: 328
Бесплатно скачать Реферат: Синтез оптимальных уравнений