Математика / Реферат: Синтез оптимальных уравнений

Реферат: Синтез оптимальных уравнений

Разумеется, невозможно решить систему дифференциальных уравнений (1.2) (т. е. найти закон движения объекта), не зная каким образом будут меняться с течением времени управляющие параметры u ¹ , u ² ,…, u^r . Напротив, зная поведение величин u ¹ , u ² ,…,u^r , т. е. зная управляющие функции u ¹ (t), u ² (t),…, u^r (t) для t >t ₀ мы сможем из системы уравнений

(1.4)

или, что то же самое, из векторного уравнения

(1.5)

однозначно определить движение объекта (при t >t ₀ ), если нам известно начальное фазовое состояние объекта (в момент t=t ₀ ). Иначе говоря, задание управления u(t) и начального фазового состояния x ₀ однозначно определяет фазовую траекторию x(t) при t >t ₀ , что согласуется со сделанными ранее (стр. 1) предположениями о свойствах объекта.

Тот факт, что задание начального фазового состояния (в момент t=t ₀ ) позволяет из системы (1.4) однозначно определить фазовую траекторию x(t), t >t ₀ , вытекает из теоремы о существовании и единственности решений системы дифференциальных уравнений. Предположим, что, зная начальное фазовое состояние x ₀ и управление u(t)=(u ¹ (t),…, u^r (t)), мы определили фазовую траекторию x(t) (с помощью системы (1.4)). Если мы изменим управление u(t) (сохранив то же начальное состояние x ₀ ), то получим некоторую другую траекторию, исходящую из той же точки x ₀ ; вновь изменим управлениеu( t) – получим ещё одну траекторию и т. д. Таким образом, рассматривая различные управления u( t) , мы получим много траекторий, исходящих из точки x ₀ (рис. 12). (Разумеется, это не противоречит теореме единственности в теории дифференциальных уравнений, так как, заменяя функции u ¹ ( t),…, u^r ( t) другими функциями, мы переходим от системы дифференциальных уравнений относительно фазовых координат x ¹ ,…, xⁿ . )

Напомним, что задача оптимального быстродействия заключается в отыскании такого управления u( t) , для которого фазовая траектория x( t) , соответствующая этому управлению в силу уравнения (1.5), проходит через точку x ₁ и переход из x ₀ вx ₁ осуществляется за кратчайшее время. Такое управление u( t) будем называть оптимальным управлением (в смысле быстродействия) ; точно так же соответствующую траекторию x( t) буде называть оптимальной траекторией .

4. Допустимые управления. Обычно управляющие параметры u ¹ ,…, u^r не могут принимать совершенно произвольные значения, а подчинены некоторым ограничениям. Так, например, в случае объекта, описанного на стр. 4, естественно предположить, что сила u , развиваемая двигателем, не может быть как угодно большой по величине, а подчинена ограничениям α ≤u ≤β , где α и β – некоторые постоянные, характеризующие двигатель. В частности, при α= ─1, β= 1 мы получаем ограничение ─1≤u ≤1, которое означает, что двигатель может развивать силу, направленную вдоль оси x ¹ как в положительном, так и в отрицательном направлении, но не превосходящую единицы по абсолютной величине.

Для объектов, содержащих r управляющих параметров u ¹ ,…, u^r , в приложениях часто встречается случай, когда эти параметры могут произвольно меняться в следующих пределах:

α ¹ ≤u ¹ ≤ β ¹ , α ² ≤u ² ≤β ² ,…, α ^r ≤u^r ≤β^r .

Иначе говоря, каждая из величин u ¹ , u ² ,…, u ^r в уравнениях (1.2) представляет собой отдельный управляющий параметр, область изменения которого не зависит от значений остальных

управляющих параметров и задаётся неравенствами

α ⁱ ≤uⁱ ≤β ⁱ , i= 1,…,r. (1.6)

Заметим, что при r =2 точки u= (u ¹ , u ² ), координаты которых подчинены неравенствам (1.6), заполняют прямоугольник; при r= 3 неравенства (1.6) определяют в пространстве переменных u ¹ , u ² , u ³ прямоугольный параллелепипед; в случае произвольного r говорят, что неравенства (1.6) определяют r-мерный параллелепипед.

В общем случае будем считать, что в соответствии с конструкцией объекта и условиями его эксплуатации задано в пространстве переменных u ¹ ,…, u^r некоторое множество U и управляющие параметры u ¹ , u ² ,…, u^r должны в каждый момент времени принимать лишь такие значения, чтобы точка u= (u ¹ , u ² ,…, u^r ) принадлежала множеству U . Иначе говоря, разрешается рассматривать лишь такие управления u( t) , что u( t) U для любого t . Множество U в дальнейшем будем называть областью управления . Область управления U не всегда будет параллелепипедом; она может иметь геометрически более или менее сложный характер, так как в силу конструкции объекта между управляющими параметрами u ¹ , u ² ,…, u^r могут существовать связи, выражаемые, например, уравнениями вида φ(u ¹ , u ² ,…, u^r )=0 или неравенствами ψ(u ¹ , u ² ,…, u^r )≤0. Так, если параметры u ¹ , u ² характеризуют векторную величину на плоскости, модуль которой не превосходит единицы, а направление произвольно, то эти параметры подчинены только одному условию

(u ¹ )² +(u ² )² ─1≤0 (1.7)

и область управления U представляет собой круг. В дальнейшем будем предполагать, что указание области управления входит в математическое определение объекта, т. е. что для математического задания управляемого объекта надо указать закон его движения (1.2) и область управления U .

Наконец, сделаем ещё одно, весьма существенное предположение о характере управлений. Именно, будем предполагать, что «рули», положения которых характеризуются управляющими параметрами u ¹ , u ² ,…, u^r , безынерционны, так что мы можем, если нужно, мгновенно переключать эти «рули» из одного положения в другое, т. е. менять скачком значения управляющих параметров u ¹ , u ² ,…, u^r . В соответствии с этим будем рассматривать не только непрерывные, но и кусочно-непрерывные управления u( t) . Кроме того, будем предполагать, что каждое рассматриваемое управление u( t) непрерывно на концах отрезка t ₀ ≤t ≤t ₁ , на котором оно задано, т. е. что все точки разрыва, если они есть, расположены на интервале t ₀ <t <t ₁ . Для удобства условимся называть допустимым управлением всякую кусочно-непрерывную функцию u (t ), t ₀ ≤t ≤t ₁ , со значениями в области управления U , непрерывную справа в точках разрыва (для определённости нам так удобно предполагать) и непрерывную в концах отрезка [t ₀ ; t ₁ ], на котором она задана.

Задача об оптимальных быстродействиях уточняется теперь следующим образом:

Среди всех допустимых управлений u= u( t), под воздействием которых управляемый объект (1.3) переходит из заданного начального фазового состояния x ₀ в предписанное конечное состояние x ₁ , найти такое, для которого этот переход осуществляется за кратчайшее время

§ 2. Об основных направлениях в теории оптимальных процессов

5. Метод динамического программирования. Для управляемого объекта, описанного в предыдущем параграфе, мы рассмотрим задачу об оптимальном переходе ─ в смысле быстродействия ─ из фазового состояния x в фазовое состояние x ₁ . При этом конечную фазовую точку x ₁ будем считать фиксированной, а в качестве начальной точки x будем рассматривать различные точки фазового пространства. Мы будем предполагать в этом пункте, что для рассматриваемого управляемого объекта выполняется следующая гипотеза:

Г и п о т е з а 1. Какова бы ни была отличная от x ₁ точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x ₀ в точку x ₁ (рис. 6).

Время, в течение которого осуществляется оптимальный переход из точки x ₀ в точку x ₁ , обозначим через T( x ). В дальнейших рассуждениях будет удобно вместо T( x ) ввести функцию ω (x ), отличающуюся от неё знаком

ω (x )= ─T(x ). (1.8)

Так как каждая точка x фазового пространства имеет координаты x ¹ ,…, xⁿ , то ω (x )= ─T( x ) является функцией от n переменных, т. е. ω (x )= ω (x ¹ ,…, xⁿ ). Поэтому имеет смысл говорить о непрерывности этой функции (по совокупности переменных x ¹ ,…, xⁿ ) и о дифференцируемости этой функции по каждой из переменных x ¹ ,…, xⁿ .

А также будем предполагать, что для рассматриваемого управляемого объекта выполняется следующая гипотеза:

Г и п о т е з а 2. Функция ω (x ) непрерывна и всюду, кроме точки x ₁ , имеет непрерывные частные производные

Пусть теперь x ₀ ─ произвольная отличная от x ₁ точка фазового пространства, а u ₀ ─ произвольная точка области U . Предположим, что объект находится в момент t ₀ в фазовом состоянии x ₀ и движется в течение некоторого времени под воздействием постоянного управления u= u ₀ . Фазовую траекторию объекта при этом движении обозначим через y (t)=(y ¹ ( t),…, yⁿ ( t )). Таким образом, фазовая траектория y( t ) при t> t ₀ удовлетворяет уравнениям

К-во Просмотров: 373

Бесплатно скачать Реферат: Синтез оптимальных уравнений

>>> Скачать <<<