Книги по разным темам Pages:     | 1 |   ...   | 2 | 3 | 4 | 5 | 6 |   ...   | 10 |

Задача синтеза оптимального закона управления для системы (1) с критерием (4) и краевыми условиями (6) и (7), где для упрощения предполагается, что функции f0, f, h, g, от вектора а не зависят, формулируется следующим образом.

Среди всех допустимых законов управления v(x, t) найти такой, что для любых начальных условий (t0, x0) из (6) при подстановке этого закона в (1) и в (4) осуществляется заданный переход (7) и критерий качества J[u] принимает наименьшее (наибольшее) решение.

3.2 Оптимальные траектории Траектория системы (1), соответствующая оптимальному управлению u*(t) или оптимальному закону v*(x, t), называется оптимальной траекторией. Совокупность оптимальных траекторий x*(t) и оптимального управления u*(t) образует оптимальный управляемый процесс {x*(t), u*(t)}.

Установлено, что при отсутствии вектора а управляющих параметров в f0, f, h, g, задача программного и координатного управления эквивалентны.

Так как закон оптимального управления v*(x, t) имеет форму закона управления с обратной связью, то он остается оптимальным для любых значений начальных условий (x0, t0) и любых координат x.

В отличие от закона v*(x, t) программное оптимальное управление u*(t) является оптимальным лишь для тех начальных условий, для которых оно было вычислено. При изменении начальных условий будет меняться и функция u*(t). В этом состоит важное, с точки зрения практической реализации системы управления, отличие закона оптимального управления v*(x, t) от программного оптимального управления u*(t), поскольку выбор начальных условий на практике никогда не может быть сделан абсолютно точно.

3.3 Свойства оптимальных управлений и оптимальных траекторий 1 Всякая часть оптимальной траектории (оптимального управления) также в свою очередь является оптимальной траекторией (оптимальным управлением). Это свойство математически формулируется следующим образом.

Пусть u*(t), t0 t t1 - оптимальное управление для выбранного функционала J[u], соответствую(t0, x0) щее переходу из состояния в состояние (t1,x1) по оптимальной траектории x*(t). Числа t0, t1 и вектор x0 - фиксированные, а вектор x1, вообще говоря, свободен. На оптимальной траектории x*(t) выбираются точки x*(0 ) и x*(1), соответствующие моментам времени t = 0, t = 1, где t0 0 1 t1. Тогда управление u*(t) на отрезке [0, 1] является оптимальным, соответствующим переходу из состояния x*(0 ) в состояние x*(1), а дуга [x*(0), x*(1)] является оптимальной траекторией S.

Таким образом, если начальное состояние системы есть x*(0 ) и начальный момент времени t = 0, то независимо от того, каким образом пришла система к этому состоянию, ее оптимальным последующим движением будет дуга траектории x*(t), 0 t 1, являющейся частью оптимальной траектории между точками (t0, x0 ) и (t1, x1). Это условие является необходимым и достаточным свойством оптимальности процесса и служит основой динамического программирования.

Примечание. Приведенная краткая формулировка основного свойства оптимальных траекторий не должна толковаться слишком широко. Требование, чтобы начальная и конечная точки траекторий сравнения лежали на оптимальной траектории в те же моменты времени 0,1, что и точки оптимальной траектории, или чтобы свободный правый конец x1 траектории сравнения оканчивался в тот же момент t1, что и конец оптимальной траектории, являются существенными. Без их выполнения это свойство, вообще говоря, не имеет места. Так, если заданы только начальная точка x0 = x(t0) и моменты времени tи 0, а x(0) свободен, то отрезок траектории x*(t), t0 t 0 может и не быть оптимальным. В этом слу чае оптимальным может быть, вообще говоря, другой отрезок x (t) (рис. 5).

xn Jx*(0) x*(t) - оптимальная x'(t) траектория на [t0, t1] x(t0) = xJ'JJ'x'(0) x'(t) - траектория сравнения на [0, 1] x*(1) JJ'3 x* x1 = x*(t1) = xx'(t1) xРис. 5 Основное свойство оптимальных траекторий:

J2 > J2; J1, J1 (i = 1, 2, 3) - значения функционала на участках оптимальной траектории и на траекториях сравнения, соответственно 2 Автономные системы инвариантны относительно сдвига вдоль оси t. Это означает, что если u*(t), t0 t t1 совершает переход x0 x1 и сообщает функционалу J[u] значение J*, то при любом действительном управление u*(t + ), t0 - t t1 - также совершает переход x0 x1 и придает функционалу J[u] значение J*.

3.4 Геометрическая интерпретация основной задачи оптимального управления Основным задачам оптимального управления при закрепленных концах можно дать следующую эквивалентную геометрическую формулировку.

Пусть при t = t0 задано начальное состояние x0 = x(t0), а при t = t1 - конечное состояние x1 = x(t1), где t0, t1, x0, x1 - фиксированные значения. Тогда в функционале J[u] (4) слагаемое (t0, t1, x0, x1) является известным числом 0.

Введем новую переменную x0, закон изменения которой имеет вид dx= f0 (t, x, u, a) (10) dt с начальным условием x0(t0) = x00 = 0.

Присоединим эту переменную к системе (1). Тогда при t = t0 система находится в точке (x0 (t0 ), x1(t0 ),..., xn (t0 ))T, а при t = t1 - в точке (x0 (t1), x1(t1),..., xn (t1))T, где tx0 (t1) = 0 + f0(t, x, u, a)dt = J[u].

tТаким образом, если в (n + 1)-мерном пространстве точек (x0,x) провести через точку (0, x1) прямую П параллельно оси 0x0, то решение системы (1), (10) проходит при t = t1 через точку на прямой П с координатой x0(t1) = J.

Теперь основная задача оптимального программного управления формулируется геометрически как на рис. 6.

x0 П * x0 (t1) = J[u*] = J max J[u] u 3' 1' Xn x(t0) = Ф2' x(t1) = xxn x(t0) = xxРис. 6 Геометрическая формулировка основной задачи оптимального управления:

1 - оптимальная траектория; 1' - изменение критерия качества J вдоль оптимальной траектории; 2, 3 - неоптимальные траектории, проходящие через точки (x0, t0), (x1, t1); 2', 3' - изменение критерия качества J вдоль неоптимальных траекторий В (n + 1)-мерном фазовом пространстве (x0, x1,..., xn )T даны:

1) при t = t0 точка (0, x0 ) ;

2) прямая П, параллельная оси 0x0 и проходящая через точку (0, x1).

Среди всех допустимых программных управлений u = u(t), обладающих тем свойством, что соответствующее решение (x0 (t), x(t)) системы (1), (10) с начальным условием (0, x1(t0 ),..., xn (t0 ))T пересекает при t =t1 прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую (наибольшую) координату x0 (t1) = J.

Контрольные вопросы 1 Основная задача оптимального координатного управления.

2 Оптимальные траектории.

3 Основные свойства оптимальных управлений и оптимальных траекторий.

4 Геометрическая интерпретация основной задачи.

Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ ПРОГРАММНОГО УПРАВЛЕНИЯ.

ПРИНЦИП МАКСИМУМА 4.1 Краткая формулировка задачи Пусть даны:

Х система дифференциальных уравнений движения dx = f (t, x,u,a), (11) dt ~ n m где f (t,x,u,a) определены для всех x = (x1, x2,..., xn )T X Rn, t0 t t1, u U, a Ar, непрерывны по совокупности переменных (t, x, u, a) и непрерывно дифференцируемы по (x, a);

Х соотношения, которым удовлетворяют начальные (t0, x0 ) и конечные (t1, x1) фазы движения системы (11):

g (t0,t1, x0,x1,a) = 0 ( j = 1, 2,..., l < 2n + 2 + r), (12) j где функции g непрерывно дифференцируемы по всем своим аргументам;

j Х критерий качества управления (функционал) tJ[u(t),a] = (t0,t1,x0, x1,a) + f0 (t, x,u,a)dt, (13) tгде, f0 обладают всеми необходимыми производными.

m Множество U представляет собой замкнутую и ограниченную область евклидова m-мерного пространства Rm. Функция u(t) считается допустимой, если она кусочно-непрерывна и ее значения принадm m лежат множеству U : u(t) U, т.е. такие управления ui(t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функции ui (t) может терпеть разрывы первого рода. Во избежание недоразумений отметим, что, по определению разрывов первого рода, в точке разрыва предполагается существование конечных пределов u( - 0) = limu(t), u( + 0) = limu(t).

t t t< t> 4.2 Некоторые вспомогательные построения и терминология Вводятся:

Х зависящий от времени вектор сопряженных координат (вектор-функция множителей Лагранжа) (t) = (0 (t), 1(t),..., n (t))T ; (14) Х постоянный вектор :

= (1, 2,..., l )T ; (15) Х вспомогательные функции (гамильтониан задачи оптимизации и функция Лагранжа) n H (t,x,u,,a) = fi(t,x,u,a) + 0 f0(t,x,u,a) (16) i i=и l L(t0,t1,x0,x1,a,) = g (t0,t1,x0,x1,a) + 0(t0,t1,x0,x1,a) ; (17) j j j=Х система дифференциальных уравнений, сопряженная к (11) (13) и определяющая изменение вектора (t), n di H fk (t, x,u,a) = - = - (i = 0, n). (18) k dt xi k =0 xi & Замечание. Система линейных дифференциальных уравнений y = B(t)y называется сопряженной & для системы x = A(t)x + f(t), если B(t) = -AT (t) и размерность векторов x и y (а также матриц B(t) и A(t)) одинаковы. Таким образом, система (18) является фактически сопряженной к линеаризованной системе (11), (20):

f f & x = x + u(t), ) ) ) ) x u x((t), u(t) x(t), u(t) где x(t), (t) - некоторая опорная траектория и опорное управление, соответственно.

С помощью функции H исходная система уравнений (1) записывается в виде dxi H = = fi (t, x,u,a) (i = 0, n). (19) dt i Индексу i = 0 соответствует новая переменная x0(t), определяемая скалярным уравнением dx= f0 (t, x, u, a), (20) dt с начальным условием x0 (t0) = x00 = (t0, t1, x0, x1, a). (21) Система уравнений T H ~ & x = = f ;

(22) T ~ T H f & = - -, = ~ ~ x x ~ ~ ~ ~ ~ n+где H = T f, f x - матрица Якоби, x = (x0, x1,..., xn ), f = ( f0, f1,..., fn ) ; x X - называется канонической системой дифференциальных уравнений, связанной с основной задачей.

4.3 Принцип максимума Л.С. Понтрягина * * * * * Пусть u*(t) = (u1 (t),...,um (t))T, t [t0, t1] - такое допустимое управление, а a* = (a1, a2,..., ar )T - такое допустимое значение вектора параметров, что соответствующая им траектория x*(t) системы (11) удовлетворяет условиям (12) для концов.

Для оптимальности (в смысле минимума) критерия качества (13) управления u*(t), траектории x*(t) и вектора управляющих параметров а* необходимо существование такого ненулевого переменного вектора (t) = (0 (t), 1(t),..., n (t))T, 0 (t) = const 0 (обычно можно принимать 0 = 1, см. следствие 2, п. 4.4) и такого постоянного вектора = (1, 2,..., l )T, что выполняются следующие условия.

1 Вектор-функции x*(t), u*(t), (t) и вектор a* удовлетворяют системе * dx1 H (t, x*(t), u*(t), (t), a*) = ;

dt i di H (t, x*(t), u*(t), (t), a*) = - (23) dt xi (i = 0, n).

m 2 Функция H (t, x*(t), u, (t), a*) переменного u U при каждом t [t0, t1], т.е. при фиксированных x* и и при фиксированном векторе а* достигает при u = u*(t) минимума):

* H (t, x*(t), u*(t), (t), a*) = H (t, x*(t), (t), a*) = (24) = min H (t, x*(t), u, (t), a*).

m uU Случай максимума функционала J[u, a] сводится к задаче в данной постановке путем рассмотрения функционала J1[u,a] = -J[u,a].

Замечание. В отличие от классической формулировки принципа максимума Л.С. Понтрягина в данном случае операция max в (24) заменена на min. В соответствии с такой заменой необходимое условие (24) можно было бы назвать принципом минимума. Следует обратить внимание, что в данном случае 0 0, тогда как в классической формулировке 0 0.

Таким образом, оптимальное управление определяется как u*(t) = u*(t, x*(t), (t), a*) = arg min H (t, x*(t), u, (t), a*). (25) m uU Принцип максимума, следовательно, утверждает, что оптимальное управление u*(t) в каждый мо~ ~ & мент времени t минимизирует проекцию фазовой скорости x = f (t, x, u) управляемого процесса (т.е. про~ ~ n+екцию скорости изображающей точки x X ) на направление, задаваемое вектором (t) ; напомним, что n ~ & H = fi = T ~ = T f (t,x,u,a) - x i i=~ & скалярное произведение векторов (t) и x.

3 Сопряженные переменные i (t) и функция H (t, x*(t), u*(t), (t), a*) непрерывны вдоль оптимальной траектории (аналог условия Эрдмана-Вейерштрасса классического вариационного исчисления).

4 Условия трансверсальности. Для концевых точек (t0, x0 ), (t1, x1) и вектора параметров а* при произвольных вариациях концевых точек и параметров выполняются обобщенные условия трансверсальности ttn r H xi + dL + adt = 0. (26) Ht -i a i=t0 =1 tЗдесь dL - полная вариация функции L(t0, t1, x0, x1, , a) определяемой уравнением (17):

n L L L dL = t0 + t1 + xi (t0) + t0 t1 i=0 xi (t0) (27) n r L L + xi (t1) + a, xi (t1) a i=0 =где t0, t1, xi (t0 ), xi (t1), a - произвольные вариации концевых точек и параметров.

Обобщенные условия трансверсальности (26) с учетом выражения (27) приводят в силу независимости t0, t1, ti(t0), ti(t1), a к следующим 2n + 2 + r соотношениям:

L - H + t0 = 0 ; (28) t t L H + t1 = 0 ; (29) t1 t L xi (t0) = 0 (i = 1, n) ; (30) i + xi t L - i + xi (t1) = 0 (i = 1, n) ; (31) xi tt L H a + dt = 0 ( = 1, r). (32) a t0 a Если какое-либо конечное условие xi (t0 ), xi (t1) или параметр a закреплены (не варьируются), то соответствующая вариация равна нулю: z = 0 (z = t0, t1, xi (t0), xi (t1), a ). Если какое-либо конечное условие xi(t0), xi (t1) или управляющий параметр a свободны, то равен нулю коэффициент при свободной вариации z в (30) - (32).

Таким образом, совокупность условий, выражающих принцип максимума (23), (25), условий трансверсальности (26), дают необходимые условия оптимальности программного управления.

Условия принципа максимума позволяют среди множества всех траекторий и управлений, переводящих систему из (t0,x0) в (t1,x1), выделить те отдельные, вообще говоря, изолированные траектории и управления, которые могут быть оптимальными.

В формулировке принципа максимума участвует 2n + 2 + m + 1 неизвестных функций x0 (t), x1(t),..., xn (t) :0 (t), 1(t),..., n (t) ; u1(t),..., um (t), для определения которых имеется (n + 1) дифференциальных уравнений физической системы (11), (20), (n + 1) дифференциальных уравнений сопряженной системы (18) и m конечных соотношений для u, вытекающих из (24).

j Следовательно, для (2n + 2 + m) неизвестных функций имеется (2n + 2 + m) соотношений. Если известны все начальные условия ~ ~(t ) = (, x1(t0 ), x2(t0 ),..., xn (t0 ))T ;

x0 = x (33) 0 = (t0 ) = (0 (t0 ), 1(t0 ), 2 (t0),..., n (t0 ))T и фиксированное значение управляющего параметра а, то система (23) может быть проинтегрирована.

Pages:     | 1 |   ...   | 2 | 3 | 4 | 5 | 6 |   ...   | 10 |    Книги по разным темам