8.1 Краткая формулировка задачи Пусть эволюция системы S описывается векторным дифференциальным уравнением dx = f (t, x,u), (88) dt где x = (x1, x2,..., xn)T - n-мерный вектор состояния; u = (u1, u2,..., um)T - m-мерный вектор управления.
На значения управляющего вектора u наложены ограничения (t, x,u) 0, (89) где = (1, 2,..., v1 )T - v1-мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, не превосходит m.
m m m Область U допустимых значений u зависит от t, x: U = U (t,x) и задается уравнением (89). Предполагается, что вектор u явно входит в уравнение (89).
В начальный момент времени t = t0 задано состояние системы x(t0 ) = x0. (90) Необходимо перевести систему S из состояния x0 в некоторое конечное состояние, определяемое соотношениями q(t1, x(t1)) = 0, (91) где q = (q1, q2,..., ql2 ), l2 n +1.
Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционал tJ[u] = (t1,x(t1)) + f0(t,x,u)dt (92) tпринимает минимальное значение на решениях системы (88).
Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывными производными. Точки t, где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точками. Точки ts, в которых изменяется знак л> на л= (или наоборот) в одном или нескольких ограничениях (89), называются точками соединения.
8.2 Типы граничных условий Задача, в которой (t1,x(t1)) 0, а граничные условия (97) имеют вид xi (t1) - xi1 = 0 (i = 1, l2 n) (93) или xi (t1) - xi1 = 0 (i = 1, l2 -1 n), (94) t1 - tзад = 0, где xi1, tзад - заданные числа, называется иногда простейшей.
При l2 = n условия (93) приводят к задаче с закрепленным правым концом и свободным временем.
При l2 < n условия (93) приводят к задаче с частично свободным правым концом и свободным временем t1. Условия типа (94) относятся к задаче с закрепленным временем t1 = tзад и частично свободным правым концом траектории.
8.3 Необходимые условия оптимальности m m Если u*(t) U (x,t) [U определяется условиями (89)] является управлением, минимизирующим функционал J[u], то найдутся такие постоянные числа 0 = 1, = (1,..., l2 )T, не все равные нулю, и такие одновременно не обращающиеся в нуль переменные векторы (t) = 1(t),..., n(t))T (непрерывный на [t0, t1]) и (t) = (1(t),..., v1 (t))T (непрерывный на [t0, t1] всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- и левосторонние пределы), что на [t0, t1] имеют место соотношения T T T d H H = - - - ; (95) = dt x x x T T Hdx H = = ; (96) dt = 0 ( j = 1,v1), (97) j j где 0. (98) Для всех фиксированных (t, x, ) и u, удовлетворяющих (89), выполняется принцип максимума (см.
п. 4.3) H (t, x,,u*) H (t, x,,u), (99) т.е.
min H (t, x,,u) = H (t, x,,u*), m uU где гамильтониан H определяется, как и в п. 4.2, выражением H = 0 f0 + T f, (100) а H1 = H + T. (101) m Если минимум H достигается во внутренней точке области U, то T H1 H = +. (102) u u u В угловых точках t выполняются следующие условия:
а) сопряженный вектор (t) непрерывен, т.е.
(t + 0) = (t - 0) ; (103) б) функция H непрерывна, т.е.
H (t, x(t ), (t ),u*(t + 0)) = H (t, x(t ), (t ),u*(t - 0)) (104) (условие (99) соблюдается со знаком равенства);
в) уравнения (97) и (102) сохраняются.
Условия a) - в) являются аналогом условий ВейерштрассаЦЭрдмана.
В конечной точке (t1,x1) для любых значений dt1, dx(t1) выполняются условия трансверсальности T T q T q f0 + T f + + T dt1 + + - dx(t1) = 0 ;
t1 t1 t=t1 x x t=t (105) q(t1, x(t1)) = 0.
Из (105) следует, что q H (t1) = ( f0 + T f )t1 = - + T ; (106) t1 t1 t T q T (t1) = + . (107) x x t Для простейшей задачи условия (106) и (107) упрощаются. Так, например, в случае (93) они имеют вид H (t1) = 0;
i (t1) = i(i = 1, l2 ); (108) i (t1) = 0(i = l2 +1, n).
8.4 Аналог необходимого условия Клебша Обозначим через те компоненты вектора ограничений, которые в каждой точке минимизирующей кривой x*(t), u*(t) удовлетворяются в виде равенств. Пусть - соответствующий им вектор множителей. Тогда H1 = H + T (109) m и для внутренних точек области U на минимизирующем управлении u*(t) имеет место неравенство 2HT 0 (110) uдля всех = (1, 2,..., m )T 0, удовлетворяющих условию = 0. (111) u Здесь 2 H1 H, L, u1um H1 u = L L L.
u2 2 H H, L, umu1 um Условия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения H1 T - sE, u D(s) = det u2 = 0. (112) u Неравенство нулю определителя матрицы H1 T u u (113) u во всех точках x*(t), u*(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u*(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача называется невырожденной.
m Следствия. 1) Условия для открытого ядра области U (t,x) (условия (95) - (99)) означают, что во m всех точках траектории, в которых минимум H по u, u U (x,t) достигается при выполнении строгих неравенств i (t, x,u) > 0 (i = 1,v) (114) m (т.е. в так называемом открытом ядре области U (x,t) ) справедлив принцип максимума (см. п. 4.3), не учитывающий наличие связей (89). Здесь все i = 0 (i = 1,v1) и дифференциальные уравнения (95)Ц(96) при условии (99), дающем u = u(t,x,) имеют единственное решение:
xi = xi (t, t0, x0, i0 );
(115) i = i (t, t0, x0, i0 ).
В этом случае u = u(t, t0, x0, i0 ) (116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров (t, t0, xi0, i0 ) по крайней мере непрерывно.
Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференцируемо по (t, t0, xi0, i0 ).
2) Если i (t, x,u) не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п.
m m m 4.3, так как в этом случае U (x,t) зависит лишь от t: U = U (t).
m 3) Условия для границы области U (x,t) находятся следующим образом. Если при определении минимума H по u часть компонент вектора удовлетворяются в виде равенств, то недостающие множители могут быть найдены из условий (102). Если минимум H по u достигается во внутренней точке j m области U, то управление u и множители находятся из условий (102) и тех из (89), которые выj j полняются в виде равенств T H ~ + = 0;
(117) u u (t, x,u) = 0.
~ ~ ~ Из (117) находятся u и. При этом u = u(x, ), = (x, ) непрерывны в точке соединения, если только в ней нет разрыва в функции u(t).
Контрольные вопросы 1 Типы граничных условий.
2 Необходимые условия оптимальности.
3 Аналог необходимого условия Клебша.
Глава ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных уравнений первого порядка, разрешенных относительно производных)*, а управляющие функции u(t) явно не введены (и по каким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационного исчисления.
Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как именно для такой системы разработаны эффективные алгоритмы численного интегрирования.
9.1 Задачи Больца, Майера, Лагранжа Задача Больца. Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем.
Пусть класс траекторий определяется:
1) кривыми x(t) c координатами xi (t) (i = 1, n), t0 t t1 ;
2) параметрами a ( j = 1, r).
j Параметры a можно рассматривать как некоторые постоянные координаты кривой С: z(t) = (x(t), a)Y j в (n + r)-мерном пространстве, z = (x1, x2,..., xn, a1,..., ar )T.
Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида & Fj = (t, x, x,a) = 0 ( j = 1, m < n) (118) и условиям t& Ik = k (t0, x(t0 ),t1, x(t1),a) + fk (t, x, x,a)dt = 0 (k = 1, ), (119) tгде dx & & & x = = (x1,..., xn )T.
dt Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал t& J = (t0, x0, x1,t1,a) + f (t, x, x,a)dt. (120) tЗадача Майера. Эта задача формально получается из задачи Больца при f 0, fk 0 (k = 1, ). В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть = 2n + r + 2. Если фиксирован вектор параметров а, то число степеней свободы системы дифференциальных уравнений (118), равное разности между числом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно: = n - m.
Задача Лагранжа. Эта задача вытекает из задачи Больца при 0, fk 0, k = 1,.
tt & Виды связей и граничных условий. Связи вида (119) при k = k (a), т.е. при fk (t,x,x,a)dt = -k (a), tгде все или часть компонент вектора а фиксирована, называются изопериметрическими. Если fk 0, то связи типа (119) задают подвижные граничные условия. Если связи типа (119) имеют вид k1 xk1 (t0 ) - xk10 = 0 (k1 = 1, n);
k2 xk2 (t1) - xk21 = 0 (k2 = 1, n);
2n+1 t0 - t00 = 0, 2n+2 t1 - t10, где xk10,..., t10 - заданные числа, то граничные условия называются закрепленными.
Если k1 = 1, n; k2 = 1, n1 < n; t0 - t00 = 0; t1 - t10 = 0, то n1 концов закреплено, а остальные условия называются свободными граничными условиями.
Если граничные условия k (t0,t1,x0,x1) = 0 при ( fk = 0, k = 1, ) можно разбить на две группы k1 (t0, x0 ) = 0 ; k2 (t1, x1) = 0 ; k1 = 1, 1, k2 = 1 +1,...,, 1 < n и если q(t1,x1) - h(t0,x0), то задача называется задачей с разделенными условиями для концов.
Общие условия (119) называются смешанными граничными условиями.
9.2 Первое необходимое условие экстремума функционала в задаче Больца Первое необходимое условие экстремума состоит из:
Х правила множителей Лагранжа;
Х уравнений ЭйлераЦЛагранжа;
Х условий ЭрдманаЦВейерштрасса;
Х условий трансверсальности.
Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), ~(t), & & ~(t) & & так и по x(t) ) вариации x(t) = x(t) - x x(t) = x(t) - x по любым совместимым со связями (118) направn n лениям в пространстве X, x X и функции f, fk,, k обладают непрерывными производными до третьего порядка. Тогда необходимые условия экстремума формулируются следующим образом.
Правило множителей Лагранжа: существуют функции 0, k, (t) и функции j m & F = 0 f + fk + (t)Fj (t, x, x,a) ; (121) k j k =1 j= L = 0(t0,x(t0),t1,x(t1),a) + k (t0,x(t0),t1,x(t1),a) (122) k k=такие, что множители 0 0, k - постоянные и решение исходной задачи на условный экстремум лежит tсреди решений задачи на безусловный экстремум для вспомогательного функционала J = L +.
Fdt tВсегда можно считать 0 = 1, за исключением особых (анормальных) случаев.
Уравнения ЭйлераЦЛагранжа. Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполняются уравнения ЭйлераЦЛагранжа:
n d F - & Fxi = Ft ; (123) xi & dt i=d Fxi - Fxi = 0 (i = 1, n), (124) & dt где F F F Fxi = ; Fxi = ; Ft =.
& & xi xi t Замечание. Уравнение (123) является следствием остальных (при условии, что все xi (t) обладают вторыми производными) и для функций F, не содержащих явно t, приводит к первому интегралу.
n F - & Fxi = C (125) xi & i=в силу (127), (128), непрерывному при переходе через угловую точку.
Решения x(t) уравнения ЭйлераЦЛагранжа называются экстремалями независимо от того, являются ли они минимизирующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).
n Условия ЭрдманаЦВейерштрасса. Величины F - & Fxi и Fxi (i = 1, n) непрерывны вдоль кривой С:
xi & & i= {x = x(t), a}. В частности, если при t = t кривая С имеет угловую точку, т.е. хотя бы по одной компоненте xi (t) имеет место разрыв (первого рода) в производной:
dxi (t) dxi (t) & & xi = = xi+, (126) dt dt -t=t t=t +то справедливы соотношения F F Fxi = = = Fx+ (i = 1, n) (127) & & & & xi xi =xi xi xi =xi+ i & & & & и n n n n + F - & Fxi = F - & Fxi = F - & Fxi = F - &+ Fx+.
xi & & & & xi xi xi i i=1 i=1 & & & & xi =xi- i=1 xi =xi+ i=(128) Здесь - + & & F = F(t, x, x,a) ; F = F(t, x, x,a) ;
& & & & x=x- x=x+ & &+ &+ &+ & &- &- &x+ = (x1, x2,..., xn )T ; x- = (x1 = x2,..., xn )T.
Условие трансверсальности. Концевые точки 0 и 1 кривой С:
{x = x(t), a} таковы, что равенство tn n r F Fxi dt + dxi + dL + da dt = 0 (129) - & & & xi Fxi a j F j i=1 i= j= tвыполняется тождественно для dt0, dt1, dxi0 = dxi (t0 ), dxi1 = dxi (t1), da (т.е. для всех произвольных и незавиj симых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL - полный дифференциал функции L(t0, t1, x(t0 ), x(t1), a, k ) :
n n r L L L L L dL = dt0 + dxi0 + dt1 + dxi1 + da. (130) j t0 i=1 xi0 t1 i=1 xi1 j=1 a j r r t0(a) t1(a) Замечание. Если t0 = t0 (a), t1 = t1(a), то dt0 = da, dt1 = da. В силу независимости ве j j a a j j j=1 j=личин dt0, dt1, dxi0, dxi1 условие (129) эквивалентно 2n + 2 + r равенствам вида n L L F - & Fxi + dt1 = 0,..., Fxi + dxi1 = 0 (i = 1, n) ; (131) xi & & t xi t =t i=1 t =tn L L F - & Fxi + dt0,..., Fxi + dxi0 = 0 (i = 1, n) ; (132) xi & & t xi t =t i=1 t =tt L F da + dt = 0 (i = 1, n) (133) j a a j j t число которых достаточно для того, чтобы совместно с уравнениями (118), (119), (124) определить недостающие значения 0,k (k = 1,), (t) ( j = 1, m), xi (t) (i = 1, n), a ( j = 1,r).
j j 9.3 Второе необходимое условие минимума функционала в задаче Больца (условие Вейерштрасса) для случая f 0, fk Для допустимой кривой С: {x = x(t), a}, реализующей минимум в задаче Больца, всегда существует такая система множителей k (k = 0,), (t) ( j = 1,m), что для кривой С с этими множителями выполняется j & правило множителей (см. п. 9.2), а для всякого элемента (t,x,x,,) (в том числе и в угловых точках) & & кривой С функция Вейерштрасса E(t,x,x,,X) :
n & & & & & & & E(t, x, x,, X) = F(t, x, X, ) - F(t, x, x, ) - - xi )Fxi (t, x, x, ) (134) (Xi & i=удовлетворяет неравенству & & Е(t, x, x,, X) 0. (135) & Неравенство (135) имеет место при всех возможных допустимых элементах (t,x, X,), не совпадаю& щих с элементами (t,x,x,) кривой С, но удовлетворяющих условиям & Fj (t, x, x,a) = 0 ( j = 1, m).
Pages: | 1 | ... | 6 | 7 | 8 | 9 | 10 | Книги по разным темам