Московский международный институт эконометрики, информатики, финансов и права Балюкевич Э.Л.
Романников А.Н.
Алгебра и теория чисел Москва, 2004 УДК 51 ББК 22.143 А 535 Балюкевич Э.Л. Романников А.Н. Алгебра и теория чисел // Московский международный институт эконометрики, информатики, финансов и права. - М., 2004. - 136 с.
й Балюкевич Э.Л., 2004 г.
й Романников А.Н., 2004 г.
й Московский международный институт эконометрики, информатики, финансов и права, 2004 г.
2 Оглавление ГЛАВА I. АЛГЕБРА МАТРИЦ..................................................................... 5 1.1. Матрицы. Основные определения...................................................... 5 1.2. Действия над матрицами...................................................................... 6 1.3. Задания для самостоятельной работы по главе 1.............................. 9 ГЛАВА 2. ОПРЕДЕЛИТЕЛИ....................................................................... 2.1. Перестановки и подстановки............................................................. 2.2. Определители и их свойства.............................................................. 2.3. Миноры и алгебраические дополнения............................................ 2.4. Вычисление определителей n-го порядка........................................ 2.5. Задания для самостоятельной работы по главе 2............................ ГЛАВА 3. АЛГЕБРА МАТРИ - (ПРОДОЛЖЕНИЕ)................................ 3.1. Обратная матрица............................................................................... 3.2. Ранг матрицы....................................................................................... 3.3. Линейная зависимость и независимость строк матрицы............... 3.4. Многочленные матрицы.................................................................... 3.5. Задания для самостоятельной работы по главе 3............................ ГЛАВА 4. РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ............ 4.1. Система линейных уравнений........................................................... 4.2. Методы решения системы n линейных уравнений с n неизвестными............................................................................................. 4.3. Теорема Кронекера-Карелли............................................................. 4.4. Метод Жордана-Гаусса...................................................................... 4.5. Однородные системы линейных уравнений.................................... 4.6 Задания для самостоятельной работы по главе 4............................. ГЛАВА 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА............................................. 5.1. Понятие векторного пространства.................................................... 5.2. Линейная зависимость и независимость векторов.......................... 5.3. Базис векторного пространства......................................................... 5.4. Изоморфизм векторных пространств............................................... 5.5. Преобразование координат при изменении базиса......................... 5.6. Евклидово пространство.................................................................... 5.7. Ортогональные преобразования........................................................ 5.8. Выпуклые множества......................................................................... 5.9. Задания для самостоятельной работы по главе 5............................ ГЛАВА 6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ...................................................... 6.1. Определение линейного оператора................................................... 6.2. Характеристический многочлен и характеристическое уравнение.................................................................................................... 6.3. Собственный вектор и собственное число линейного оператора. 6.4. Задания для самостоятельной работы по главе 6............................ ГЛАВА 7. КВАДРАТИЧНЫЕ ФОРМЫ................................................... 7.1. Определение квадратичной формы................................................ 7.2. Линейное преобразование переменных в квадратичной форме.. 7.3. Ортогональное преобразование квадратичной формы к каноническому виду................................................................................ 7.4. Положительно определенные квадратичные формы.................... 7.5. Задания для самостоятельной работы по главе 7.......................... ГЛАВА 8. ЭЛЕМЕНТЫ ОБЩЕЙ АЛГЕБРЫ........................................... 8.1. Алгебраические операции................................................................ 8.2. Полугруппы и моноиды................................................................... 8.3. Группы: определение и примеры.................................................... 8.4. Циклические группы. Группы подстановок.................................. 8.5. Кольца: определение, свойства, примеры...................................... 8.6. Поле.................................................................................................... 8.7. Задания для самостоятельной работы по главе 8.......................... ГЛАВА 9. ЭЛЕМЕНТЫ ТЕОРИИ ЧИСЕЛ.............................................. 9.1. Наибольший общий делитель.......................................................... 9.2. Наибольшее общее кратное............................................................. 9.3. Простые числа................................................................................... 9.4. Сравнения и классы вычетов........................................................... 9.5. Функция Эйлера................................................................................ 9.6. Функция Мебиуса............................................................................. 9.7. Задания для самостоятельной работы по главе 9......................... Список литературы..................................................................................... ГЛАВА I. АЛГЕБРА МАТРИ - 1.1. Матрицы. Основные определения Матрицей А=( аij ) называется прямоугольная таблица чисел, m,n содержащая m строк и n столбцов:
a11 a12... a1n a21 a22... a2n A =............
a am2... amn m Числа aij (i = 1,m ;
j =1,n ), составляющие данную матрицу, называются её элементами;
i - номер строки матрицы, j - номер столбца.
Если m=n, то матрица называется квадратной порядка n.
1 4 Например, A = 2 5 8 - квадратная матрица третьего порядка. Про 3 6 элементы aii такой матрицы говорят, что они стоят на главной диагонали.
Треугольная матрица - квадратная матрица, у которой все элементы, стоящие по одну из сторон главной диагонали, равны нулю:
a11 a12... a1n 1 8 0 a22... a2n A =, например, A = 5 6 - треугольная............
0 0 0 0... amn матрица третьего порядка Квадратная матрица вида 1 0 0... 0 2 0... A = 0 0 3..................
0 0 0... n называется диагональной матрицей. Диагональные матрицы, в которых все диагональные элементы равны, т.е. i = k (i =1,n), k = const, называются скалярными матрицами.
Если i =1 (i =1, n), то скалярная матрица называется единичной и обозначается буквой Е, т.е.:
1 0 0... 0 1 0... E = 0 0 1... 0.
...............
0 0 0... Например, матрицы А, B, E являются соответственно диагональной, скалярной и единичной третьего порядка.
1 0 0 5 0 0 1 0 A = 5 0, B = 5 0, E = 1 0.
0 0 0 0 9 0 0 5 0 0 Симметрической называется квадратная матрица, у которой элементы, расположенные симметрично относительно главной диагонали, равны, т.е. aij = a (i = 1,n;
j = 1,n).
ji 1 2 3 2 2 6 Например, A = - симметрическая матрица четвертого 3 6 6 4 8 9 порядка.
Матрица, состоящая из одной строки, называется вектором строкой, а матрица, состоящая из одного столбца, - вектором-столбцом.
Матрица, все элементы которой равны нулю, называется нулевой 0 0 матрицей и обозначается О. Например, О = - нулевая матрица 2, 0 0 размера два на три.
1.2. Действия над матрицами Две матрицы A = (aij )m,n и B = (bij ) называются равными, А=В, m,n если их соответствующие элементы равны, т.е. аij =bij,(i =1,m;
j =1,n).
Суммой двух матриц A = (aij )m,n и = (bij )m,n называется матрица C=A+B, элементы которой сij равны сумме соответствующих элементов aij и bij матриц A и B, т.е. cij = aij + bij. Например, 1 3 1 6 2 A = 2 2, B = 8, C = A + B = 4 10.
7 3 1 4 Для суммы матриц справедливы следующие свойства:
1. A+B=B+A - коммутативность;
2. A+(B+C)=(A+B)+C - ассоциативность;
3. A+О=A.
Произведением матрицы A = (aij) на число называется матрица m,n B = (bij), элементы которой равны произведению соответствующих m,n элементов матрицы A на число, т.е. bij = aij. Например, если = 3, а 1 3 3 матрица A =, то B = A =.
2 4 6 Пусть A, B, C - матрицы,, - числа. Из определения произведения матрицы на число вытекают следующие свойства:
1. A = A, 4. ( )= ( ), 2. 1 A = A, 5. ( + ) = +, 3. 0 A = О, 6. ( + )= +.
Матрица (- A)= (-1) A называется противоположной матрице A.
Если матрицы A и B одинаковых размеров, то их разность равна A - B = A + (-1) B.
Произведением матрицы A = (aij) порядка m k на матрицу B = (bij ) порядка k n называется матрица C = A B порядка m n, элементы которой с равны:
ij cij = ai1b1 j + ai2b2 j +...+ aikbkj, (i =1,m ;
j =1,n ).
Из определения произведения матриц следует: чтобы получить элемент, стоящий на пересечении i-ой строки и j-го столбца матрицы С, необходимо элементы i-ой строки матрицы А умножить на соответствующие элементы j-го столбца матрицы В и полученные произведения сложить.
Произведение АВ имеет смысл тогда и только тогда, когда число столбцов матрицы А равно числу строк матрицы В.
В результате получится матрица, у которой число строк совпадает с числом строк первого сомножителя, а число столбцов - с числом столбцов второго сомножителя.
Для произведения матриц справедливы следующие свойства:
1. A(BC) = (AB)C 3. (A + B)C = AC + BC 2. (AB) = ( A)B 4. C(A+B) = CA + CB Эти свойства легко доказываются на основе соответствующих определений.
Произведение двух матриц некоммутативно, т.е. в общем случае АВ ВА. В случае прямоугольных матриц легко подобрать примеры, когда одно из этих произведений не будет существовать из-за невыполнения условия равенства числа столбцов сомножителя, стоящего первым, числу строк второго сомножителя. Очевидно, что для квадратных матриц порядка n существуют АВ и ВА. Однако для всех n, начиная с n=2, можно привести примеры некоммутативных (неперестановочных) матриц.
Пример. Найти произведение АВ и ВА матриц:
0 1 0 А =, В =.
0 0 1 Решение.
0 1 0 0 00 +11 00 +10 1 A B = = ;
0 0 1 0 00 + 01 00 + 00 = 0 0 0 1 00 + 00 01+ 00 0 B A = = 1 0 0 0 10 + 00 11+ 00 = Пример. Найти произведение матриц А и В.
0 2 -1 A = 1, B =.
1 3 5 - 1 Решение:
0 2 -1 AB = 1 5 = 3 5 -1 1 0 2 + 31 03 + 33 0(-1) + 35 00 + 3 4 3 9 15 = 1 2 + 51 13 + 53 1(-1) + 55 10 + 5 4 = 7 18 24 (-1) 2 +11 (-1)3 +11 (-1)(-1) +15 (-1)0 +1 -1 0 6 Если АВ=ВА, то матрицы А и В называются коммутативными.
Так, например, единичная матрица Е коммутативна с любой квадратной матрицей того же порядка, причем АЕ=ЕА=А.
Скалярная матрица может быть представлена в виде произведения элемента матрицы, стоящего на ее главной диагонали, на единичную матрицу того же порядка:
А= Е.
Легко видеть, что произведение любой квадратной матрицы на скалярную матрицу того же порядка коммутативно.
Квадратную матрицу А можно возвести в степень n, для чего ее надо умножить на саму себя n раз, т.е. An = A A... A.
Транспонирование матрицы - это такое преобразование, при котором строки заменяются соответствующими столбцами:
a11 a21... am a a22... am a13 a23... am A = AT = a14 a24... am............
a a2n... amn 1n Транспонированная матрица обладает следующими свойствами, которые следуют из определения:
/ / 1. (А ) =А;
/ / / 2. (А+В) =А +B ;
/ / / 3. (AB) =B A.
/ Если матрица А - симметрическая, то А =А, т.е. симметрическая матрица совпадает со своей транспонированной.
/ Очевидно, что произведение С=АА представляет собой симметрическую матрицу. Действительно, / / / / / / / С =(АА ) =(А ) А =АА =С.
При этом А может быть и прямоугольной матрицей произвольного порядка, С же будет квадратной, порядка, соответствующего числу строк матрицы А.
В различных приложениях используется понятие нормы матрицы.
Под нормой матрицы А=(aij) понимается действительное число m,n ||A||, удовлетворяющее условиям:
а) ||A|| 0, причем ||A|| = 0 тогда и только тогда, когда А=О;
б) || A||=| |Х ||A||, ( - число) и, в частности ||-A||=||A||;
в) ||A+B|| ||A||+||B||;
г) ||AB|| ||A||Х ||B||, где А и В - матрицы, для которых соответствующие операции имеют смысл.
Для матрицы А=(а ) произвольного типа рассматриваются ij m,n главным образом три вида норм:
1) ||A|| = max aij | (m - норма);
m | i j 2) ||A||l = max aij | (l - норма);
| j i (k - норма).
3) ||A|| = k | aij | i j Все они удовлетворяют перечисленным выше условиям.
1.3. Задания для самостоятельной работы по главе 5 - 2 - 3 2 2 2 6 4 - 3 -1 - 5 3 1.1.
9 2 - 3 4 16 24 8 - 7 6 - 4 7 8 16 0 - 1 1 1 -1 7 - 2 3 - 5 - 3 - 4 4 11 0 3 1.2. 5 1 4 - 3 5 4 3 22 2 9 -16 -11 -15 14 n 2 - 1.3. 3 - n cos - sin 1.4. sin cos n 1 0... 0 2... 1.5., все элементы матрицы, стоящие вне главной............
0 0... n диагонали, равны нулю.
n 1.6. 1.7. Как изменится произведение АВ матриц А и В, если:
а) переставить i-ую и j-ую строки матрицы А?
б) к i-ой строке матрицы А прибавить j-ую строку, умноженную на число с?
в) переставить i-ый и j-ый столбцы матрицы В?
г) к i-му столбцу матрицы В прибавить j-ый столбец, умноженный на число с?
1.8. Следом квадратной матрицы называется сумма элементов, стоящих на главной диагонали. Доказать, что след АВ равен следу ВА.
1.9. Доказать, что если А - диагональная матрица и все элементы ее главной диагонали различны между собой, то любая матрица, перестановочная с А, также диагональна.
1.10. Доказать, что умножение матрицы А слева на диагональную 1 0... 0 2... матрицу B = вызывает умножение строк А............
0 0... n соответственно на 1,2,...,n, а умножение А на В справа вызывает аналогичное изменение столбцов.
ГЛАВА 2. ОПРЕДЕЛИТЕЛИ 2.1. Перестановки и подстановки Для определения и изучения определителей порядка n рассмотрим некоторые понятия, относящиеся к конечным множествам.
Пусть дано некоторое конечное множество N, состоящее из n элементов. Эти элементы пронумеруем с помощью первых n натуральных чисел 1, 2, Е, n. Числа 1, 2, Е, n можно помимо их естественного порядка упорядочить многими другими способами.
Определение. Всякое расположение чисел 1, 2,Е, n в некотором определенном порядке называется перестановкой из n чисел (символов).
Число различных перестановок из n символов равно произведению 1 2... n = n! (читается n - факториал). Если в некоторой перестановке поменять местами какие-либо два символа, не обязательно стоящие рядом, а все остальные символы оставить на месте, то получим новую перестановку. Такое преобразование называется транспозицией.
Пусть 1, 2, Е, n - некоторая перестановка чисел 1, 2,Е, n.
Говорят, что в данной перестановке числа i и образуют инверсию j (беспорядок), если i > и i Перестановка называется четной, если inv(1, 2,Е, n ) - четное число или ноль и нечетной в противоположном случае. Пример. Определить четность перестановки 5, 3, 1, 6, 4, 2. Решение. Число 5 образует четыре инверсии с числами 3, 1, 4, 2. Число 3 образует две инверсии с числами 1 и 2. Число 1 не образует инверсий. Число 6 образует 2 инверсии с числами 4 и 2. Число образует одну инверсию с числом 2. Общее число инверсий inv(5, 3, 1, 6, 4, 2)=9, следовательно, данная перестановка является нечетной. Очевидно, что перестановка 1, 2,Е, n четна при любом n, так как общее число инверсий inv(1, 2, Е.., n)=0. Теорема. Всякая транспозиция меняет четность перестановки. Определение. Всякое взаимно однозначное отображение множества первых n натуральных чисел на себя называется подстановкой nЦой степени. Всякая подстановка может быть записана при помощи двух перестановок i1, i2,..., in, i, i,..., i 1 2 n где i - это то число, в которое при подстановке переходит число k i, k =1,n. k Существуют различные формы записи подстановок, которые получают транспозицией нескольких столбцов. Всякая подстановка nЦой степени может быть записана в виде 1, 2,..., n,, 2,..., n т.е. с естественным расположением чисел в верхней строке. Очевидно, что при такой форме записи подстановки отличаются друг от друга перестановками, стоящими в нижней строке. Поэтому число различных подстановок nЦой степени равно числу перестановок из n символов, т.е. равно n!. Определение. Подстановка называется четной, если общее число инверсий в двух строках любой ее записи четно, и нечетной - в противоположном случае. Покажем, что четность подстановки не зависит от формы ее записи. Рассмотрим произвольную запись некоторой подстановки i1, i2,..., in. i, i,..., i 1 2 n Перестановки, составляющие верхнюю и нижнюю строки этой записи, могут иметь или одинаковые или противоположные четности. Переход к любой другой записи подстановки можно осуществить с помощью нескольких транспозиций столбцов, причем каждая транспозиция меняет четность обеих перестановок и, следовательно, сохраняет совпадение или противоположность четностей. 2.2. Определители и их свойства Свяжем с каждой квадратной матрицей А=( aij ) определенную n,m численную характеристику, называемую определителем, соответствующим этой матрице, и обозначим его |A|. Если n=1, т.е. А=(a11), то определитель первого порядка, соответствующий этой матрице, равен величине элемента a11, т.е. |A|= a11. Если n=2, то матрица А имеет вид a11 a A = (2.2.1) a21 a Определителем второго порядка, соответствующим этой матрице, назовем число A = a11a22 - a12a (2.2.2) Формула (2.2.2.) представляет собой правило вычисления определителя второго порядка по элементам соответствующей ему матрицы. Перейдем теперь к понятию определителя, соответствующего матрице А порядка n>2, и установим общий закон, по которому определитель любого порядка будет выражаться через элементы соответствующей ему матрицы. Всякий член определителя второго порядка есть произведение двух элементов, стоящих как в разных строках, так и в разных столбцах матрицы А, причем в качестве членов определителя использованы все произведения такого вида, какие только можно составить из элементов матрицы второго порядка (их всего два). Пусть дана квадратная матрица А порядка n: a11 a12... a1n a a22... a2n A = (2.2.3)............ an1 an2... ann Рассмотрим всевозможные произведения по n элементов этой матрицы, расположенных в разных строках и в разных столбцах, т.е. произведения вида a1 a2... an, (2.2.4) 1 2 n где индексы 1, 2, Е, n составляют некоторую перестановку из чисел 1, 2,Е, n. Число таких произведений равно числу различных перестановок из n символов, т.е. равно n!. Будем считать все эти произведения членами определителя порядка n, соответствующего матрице (2.2.3). Определим знак, с каким произведение (2.2.4) входит в состав определителя. Рассматривая определитель второго порядка (2.2.2), отметим, что член входит со знаком плюс, если его индексы составляют четную подстановку, и со знаком минус, если его индексы составляют нечетную подстановку. Распространим и эту закономерность на определитель порядка n. Определение. Определителем порядка n, соответствующим матрице (2.2.3), называется алгебраическая сумма n! членов, составленная из всевозможных произведений элементов этой матрицы, взятых по одному из каждой строки и из каждого столбца, причем член берется со знаком плюс, если его индексы составляют четную подстановку, и со знаком минус - в противоположном случае, т.е. a11 a12... a1n a21 a22... a2n n! 1 2 n A = = (2.2.5) (-1)inv(,,..., )a11 a2... an, 2 n............ an1 an2... ann где суммирование распространяется на всевозможные перестановки из n чисел 1, 2,Е, n. Рассмотрим свойства определителей. 1. Свойство равноправности строк и столбцов. При транспонировании, т.е. при замене каждой строки определителя столбцом с тем же номером, определитель не меняется. Пусть определитель a11 a21... an a12 a22... an A = (2.2.6)............ a1n a2n... ann / соответствует матрице А, полученной транспонированием матрицы А. Всякий член определителя (2.2.5) имеет вид a11 a22... ann, (2.2.7) где вторые индексы составляют некоторую перестановку из чисел 1, 2, Е, n. Однако все множители произведения (2.2.7) и в определителе (2.2.6) остаются в разных строках и в разных столбцах, т.е. (2.2.7) / является членом и для транспонированного определителя |A |. Верно, очевидно, и обратное, и поэтому определители (2.2.5) и (2.2.6) состоят из одних и тех же членов. Знак члена (2.2.7) в определителе (2.2.5) определяется четностью подстановки 1 2... n (2.2.8) 2... n а знак члена (2.2.7) в определителе (2.2.6) определяется четностью подстановки 1 1... n. (2.2.9) 1 2... n Подстановки (2.2.8) и (2.2.9) имеют, очевидно, одну и ту же четность. Следовательно, определители (2.2.5) и (2.2.6) имеют одинаковые члены, взятые с одинаковыми знаками, т.е. равны друг другу. Доказанное свойство означает равноправность строк и столбцов определителя и позволяет все последующие свойства доказывать лишь для строк, не доказывая их справедливость для столбцов. 2. Свойство антисимметрии при перестановке двух строк. При перестановке двух строк определитель сохраняет свою абсолютную величину, но меняет знак на противоположный. Пусть в определителе (2.2.5) переставляются iЦая и jЦая строки, а все остальные строки остаются на месте. В результате получим определитель (2.2.10). a11 a12... a1n............ a a... a (i) j1 j2 jn............ (2.2.10) ai1 ai2... ain ( j)............ an1 an2... ann Если (2.2.7) есть член определителя (2.2.5), то все его множители и в определителе (2.2.10) остаются, очевидно, в разных строках и в разных столбцах. Таким образом, определители (2.2.5) и (2.2.10) состоят из одних и тех же членов. Члену (2.2.7) в определителе (2.2.5) соответствует подстановка 1 2... i... j... n, (2.2.11) 1 2... i... j... n а в определителе (2.2.10) - подстановка 1 2... j... i... n (2.2.12) 1 2... i... j... n т.к. элемент стоит в (2.2.10) в jЦой строке, но остается в i -ом a iji столбце. Подстановка (2.2.12) получена из подстановки (2.2.11) одной транспозицией в верхней строке, т.е. имеет противоположную четность. Отсюда следует, что все члены определителя (2.2.5) входят в определитель (2.2.10) с обратными знаками, т.е. определители отличаются друг от друга лишь знаком. 3. Линейное свойство определителя. Будем говорить, что некоторая строка (a1,a2,..., an) является линейной комбинацией строк (b1,b2,...,bn) и (c1,c2,...,cn) с коэффициентами и , если a = bj + c, j = 1, n. j j Если в определителе nЦго порядка |A| некоторая i-ая строка (ai1, ai2,..., ain) является линейной комбинацией строк (b1,b2,...,bn) и (c1,c2,...,cn) с коэффициентами и , то A = A1 + A2, где |A1| - определитель, у которого iЦая строка равна (b1,b2,...,bn), а все остальные те же, что и у |A|, а |A | - определитель, у которого iЦая строка равна (c1,c2,...,cn), а все остальные строки те же, что и у |A|. Всякий член определителя |A| можно представить в виде a11 a2 2... aii... an n = a11 a2 2...(bi + ci )... an n = = a11 a2 2...bi... an n + a11 a2 2... ci... an n Группируя первые и вторые слагаемые и вынося общие множители, получим A = A1 + A2. Линейное свойство справедливо и для случая, когда iЦая строка является линейной комбинацией m строк, m > 2. Доказанные три свойства являются основными свойствами определителя. Следующие пять свойств являются логическими следствиями трех основных свойств. Следствие 1. Определитель с двумя одинаковыми строками равен нулю. Действительно, при перестановке двух одинаковых строк, с одной стороны, определитель |A| не изменится, а с другой стороны, в силу свойства 2 изменит знак на противоположный. Таким образом, |A|=|-A|, откуда |A|=0. Следствие 2. Умножение всех элементов некоторой строки определителя на число равносильно умножению определителя на это число. Иными словами общий множитель всех элементов можно вынести за знак этого определителя. Это свойство следует из свойства при =0. Следствие 3. Если все элементы некоторой строки определителя равны нулю, то и сам определитель равен нулю. Это свойство вытекает из предыдущего при = 0. Следствие 4. Если элементы двух строк определителя пропорциональны, то определитель равен нулю. Действительно, в силу следствия 2 множитель пропорциональности можно вынести за знак определителя, после чего останется определитель с двумя одинаковыми строками, который равен нулю. Следствие 5. Если к элементам некоторой строки определителя прибавить соответствующие элементы другой строки, умноженные на произвольный множитель, то величина определителя не изменится. Действительно, полученный в результате определитель в силу свойства 3 можно разбить на сумму двух определителей, первый из которых совпадает с исходным, а второй, в силу следствия 4, равен нулю. Следствие 5 широко применяется при вычислении определителей порядка n 3. Замечание. В силу свойства 1 все доказанные утверждения справедливы и для столбцов определителя. 2.3. Миноры и алгебраические дополнения Вычисление определителей на основании данного выше определения представляет некоторые трудности. Существует более простой метод вычисления определителей, основанный на том, что определитель порядка n может быть выражен через определители более низких порядков. Пусть дана квадратная матрица A = (aij). Будем называть n,n минором элемента aij матрицы А определитель (n-1)-го порядка, соответствующий матрице, которая получается из матрицы А вычеркиванием iЦой строки и jЦго столбца. Минор элемента aij будем обозначать символом Mij. 1 4 1 Например, A = 2 5 8, M =. 3 3 6 Алгебраическим дополнением Aij элемента aij матрицы А i+ j называется его минор, взятый со знаком (-1), т.е. Aij = (-1)i+ j Mij. 2 Например, в предыдущей матрице A12 = -. 3 Теорема. Произведение любого элемента aij на его алгебраическое дополнение в определителе |A| является алгебраической суммой, слагаемые которой будут некоторыми членами определителя |A|, причем их знаки в этой сумме совпадают с теми знаками, с которыми они входят в состав определителя. Покажем сначала, что произведение a11 A11 является алгебраической суммой, слагаемые которой удовлетворяют условию теоремы. В определителе a11 a12... a1n a21 a22... a2n A =............ an1 an2... ann М11 занимает правый нижний угол. Число i+j является в этом случае четным и поэтому A11 = M11. Произвольный член... (2.3.1) a a a 22 33 nn inv(2,3,...,n ) имеет в миноре знак, где (-1) M M 11 2 3... n inv(,,..., ) есть число инверсий в подстановке. 2 3 n... 2 3 n Умножая на (2.3.1), получим произведение a... (2.3.2) a a a a 11 22 33 nn элементов, расположенных в разных строках и разных столбцах определителя |A|. Поэтому каждое такое произведение (2.3.2) будет членом определителя |A|. Знаки членов (2.3.2) и (2.3.1) совпадают, так как знак члена (2.3.2) определяется выражением 2 inv(2,3,...,n ) inv(2,3,...,n ) =. Такой же знак имеет каждый член (-1) (-1) (-1) 1 2... n (2.2.3) и в определителе |A|, так как четность подстановки, 1 2... n составленной из индексов этого члена, определяется выражением inv(2,3,...,n ). (-1) Перейдем к рассмотрению общего случая. Переставляя соседние строки и столбцы определителя |A|, передвинем произвольный элемент aij в левый верхний угол. Для этой цели переставим iЦую строку на (iЦ1) раз и jЦый столбец на (jЦ1) раз. Очевидно, что при данной перестановке взаимное расположение строк и столбцов в миноре M остается без изменения. После этих ij преобразований получим новый определитель |A | с тем же минором M 1 ij для элемента aij, но расположенный в правом нижнем углу определителя |A |. Как доказано выше, произведение aij M является суммой ij некоторого числа членов определителя |A |. Однако определитель |A | 1 получен из определителя |A| путем (i+j-2) перестановок строк и столбцов, и поэтому члены определителя |A | отличаются от соответствующих членов определителя |A| лишь знаком (-1)i+ j. Отсюда следует, что произведение (-1)i+ j aij M состоит из некоторого ij количества членов определителя |A|, взятых с такими же знаками, какие они имеют в этом определителе. Теорема доказана. 2.4. Вычисление определителей n-го порядка Полученные в предыдущем параграфе результаты позволяют свести вычисление определителей порядка n к вычислению нескольких определителей порядка n-1. Действительно, aij Aij является суммой нескольких членов определителя |A|. Легко подсчитать число этих членов: оно равно числу членов в миноре Mij, т.е. равно (n-1)!. Рассмотрим теперь все произведения элементов i-ой строки на соответствующие им алгебраические дополнения, т.е. произведения ai1 Ai1,ai2 Ai2,...,ain Ain (2.4.1) С одной стороны, никакой член определителя |A| не может войти в состав двух разных произведений (2.4.1), так как все члены определителя, входящие в любое произведение aij Aij (j =1,n), содержат из i-й строки элемент aij и поэтому отличается от членов, входящих в остальные произведения. С другой стороны, общее число членов определителя |A|, входящих во все произведения (2.3.1), равно ((n +1)!) n = n!, т.е. совпадает с числом членов определителя порядка n. Таким образом, мы доказали, что имеет место следующая теорема. Теорема. Определитель равен сумме произведений элементов любой его строки на их алгебраические дополнения, т.е. A = ai1 Ai1 + ai2 Ai2 +...+ ain Ain (2.4.2) Аналогично разложение определителя можно получить и по любому его столбцу. Теорема. Сумма произведений элементов какой-либо строки (или какого-либо столбца) определителя на соответствующие алгебраические дополнения элементов другой строки (другого столбца) равна нулю. Перепишем выражение (2.4.2) в виде a11 a12... a1n a21 a22... a2n = ai1 Ai1 + ai2 Ai2 +...+ ain Ain (2.4.3)............ an1 an2... ann так как алгебраические дополнения Aij не зависит от элементов i ой строки, то равенство (2.4.3) является тождеством относительно элементов ai1, ai2,..., ain. Заменив элементы ai1, ai2,..., ain соответствующими элементами любой k-ой строки, k i, получим a11 a12... a1n............ ak1 ak 2... akn............ = ak1 Ak1 + ak 2 Ak 2 +... + akn Akn (2.4.4) ak1 ak 2... akn............ an1 an2... ann Левая часть равенства (2.4.4) есть определитель, содержащий две одинаковые строки и, следовательно, равна нулю. Теорема доказана. Вычисление определителей n-го порядка производится на основании соотношения (2.4.2) разложением определителя по элементам какой-либо строки или какого-либо столбца. В этом случае необходимо вычислить n определителей порядка n-1. Используя следствие 5, можно свести вычисления определителя порядка n к вычислению лишь одного определителя порядка (n-1). Для этого на основании следствия необходимо так преобразовать определитель порядка n, чтобы некоторая строка (столбец) содержала только один ненулевой элемент. Пример. Вычислить определитель. 3 6 5 6 5 9 7 8 A = 6 12 13 9 7. 4 6 6 5 2 5 4 5 Решение. На основании свойства определителей, именно следствия 5, преобразуем данный определитель следующим образом: из элементов второго столбца вычтем удвоенные соответствующие элементы первого столбца: 3 0 5 6 5 -1 7 8 A = 6 0 13 9 4 - 2 6 5 2 1 4 5 Элемент a52 =1 назовем направляющим элементом. Второй столбец преобразуем в единичный с единицей на месте направляющего элемента a52. Для этого ко второй и к четвертой строкам прибавим направляющую пятую строку, соответственно умноженную на 1 и на 2. Тогда 3 0 5 6 7 0 11 13 A = 6 0 13 9 8 0 14 15 2 1 4 5 Разложим определитель по элементам второго столбца 3 5 6 5+ A = (-1)7 11 13 9. 6 13 9 8 14 15 Из элементов второй строки вычтем удвоенные соответствующие элементы первой строки 3 5 6 1 1 1 A = -. 6 13 9 8 14 15 Выбирая в качестве направляющего элемента элемент a21 =1, преобразуем вторую строку в единичную. Для этого ко второму, третьему и четвертому столбцам прибавим первый столбец, умноженный на Ц1. 3 2 3 1 0 0 A = -. 6 7 3 8 6 7 Разложим определитель по элементам второй строки: 2 3 A = (-1)2+1 (-1) 7 3 1. 6 7 Вычтем из второй строки первую и разложим определитель по элементам второй строки. В результате получим 2 3 3 2+ A = 5 0 0 = (-1) 5 = -5(6 - 7) = 5. 7 6 7 2.5. Задания для самостоятельной работы по главе sin + sin cos + cos 2.1. cos - cos sin - sin 1- t2 2t 1+ t2 1+ t 2.2. - 2t 1- t 1+ t2 1+ t 1 logb a 2.3. loga b 2.4. Доказать, что для равенства нулю определителя второго порядка необходимо и достаточно, чтобы его строки были пропорциональны. То же верно и для столбцов (если некоторые элементы определителя равны нулю, то пропорциональность можно понимать в том смысле, что элементы одной строки получаются из соответствующих элементов другой строки умножением на одно и то же число, быть может, равное нулю). 3 4 - 2.5. 8 7 - 2 -1 ax + b 2.6. Показать, что значение дроби, где по крайней мере cx + d одно из чисел с или d отлично от нуля, тогда и только тогда не зависит a b от значения х, когда = c d 2.7. Найти наибольшее значение, которое может принимать определитель 3-го порядка, при условии, что все его элементы равны или (-1). 2.8. Найти наибольшее значение, которое может принимать определитель 3-го порядка, при условии, что все его элементы равны или 0. 2.9. Доказать, что от любой перестановки чисел 1,2,Е,n, содержащей k инверсий, можно перейти к исходному положению путем k смежных транспозиций, но нельзя перейти путем меньшего числа таких транспозиций. 2.10. Выбрать значения i и k так, чтобы произведение a62ai5a33ak 4a46a21 входило в определитель 6-го порядка со знаком минус. 2.11. Вычислить определитель a11 0 0... a21 a22 0... a31 a32 a33... 0,............... an1 an2 an3... ann в котором все элементы по одну сторону от главной диагонали равны нулю. 2.12. Решить уравнение 1 1 1... 1 1- x 1... 1 1 2 - x... 1 =............... 1 1 1... n - x 2.13. Доказать, что определитель не изменится, если к каждому столбцу, начиная со второго, прибавить предыдущий столбец. 2.14. Разлагая по 3-ей строке, вычислить определитель 2 - 3 4 4 - 2 3 a b c d 3 -1 4 2.15. Вычислить определитель 3 - 3 - 2 - 2 5 4 5 5 8 4 4 5 ГЛАВА 3. АЛГЕБРА МАТРИ - (ПРОДОЛЖЕНИЕ) 3.1. Обратная матрица Пусть задана квадратная матрица A = (aij ) порядка n. Определение. Квадратная матрица А-1 порядка n называется обратной к матрице А, если она удовлетворяет соотношению (3.1.1) A-1A = AA-1 = E Присоединенной матрицей квадратной матрицы А называется матрица А*, каждый элемент Aij которой есть алгебраическое дополнение элемента aij транспонированной матрицы А, т.е. A11 A21... An A12 A22... An A* =. ............ A1n A2n... Ann Квадратная матрица А называется невырожденной (неособенной), если ее определитель |A| отличен от нуля, и вырожденной, если |A|=0. Теорема. Для всякой невырожденной матрицы А существует единственная обратная матрица А-1, определяемая следующим выражением: A-1 = A* (3.1.2) A Доказательство. Докажем сначала единственность. Предположим, - что существуют две различные обратные матрицы A1-1 и A2. Тогда имеем -1 - A1-1AA2 = A1-1(AA2 ) = A1-1E = A1- (3.1.3) -1 -1 -1 - A1-1AA2 = (A1-1A)A2 = EA2 = A (3.1.4) - Из двух последних равенств следует, что A1-1= A2. Покажем теперь, что выражение (3.1.2) действительно задает обратную матрицу. Составим произведение АА*. Очевидно, что элементами данного произведения являются суммы произведений n элементов строк матрицы А на алгебраические дополнения, т.е. Ajk. aik k= n Как известно из гл.2, при i=j Ajk =0. В итоге получаем aik k= A 0... 0 A... AA* = = A E,............ 0 0... A или A A* = E, A откуда A-1 = A*. A В заключение отметим, что А* перестановочна с А, т.е. AA* = A*A, что видно непосредственно. Теорема доказана. Пример. Вычислить обратную матрицу для матрицы А, равной: 2 A =. 1 - Решение. A = -7 0. Вычислим присоединенную матрицу А*: А11=-3, А12=-1, А21=-1, А22=2, 3 - 3 -1 3 7 A* = ; A-1 =. 1 = -1 2 7 - 2 17 Проверкой убеждаемся, что АА-1=Е. Обратная матрица обладает следующими свойствами: 1. Определитель обратной матрицы равен обратной величине определителя исходной матрицы, т.е. |A-1|=. A 2. Произведение двух невырожденных матриц А и В является - невырожденной матрицей и (AB) = B-1A-1. - 3. Если матрица А невырожденная, то (A-1) = A. 4. Обратная матрица к транспонированной является - транспонированной матрицей к обратной, т.е. (A') = (A-1)'. 3.2. Ранг матрицы Рассмотрим прямоугольную матрицу A = (aij). Выделим в m,n матрице произвольно k строк и k столбцов (k m, k n).Определитель Мк, стоящий на пересечении выделенных строк и столбцов, называется минором k-го порядка матрицы А. Число миноров k-го порядка равно k k CmCn. Определение. Рангом матрицы А называется наивысший порядок отличных от нуля ее миноров. Ранг матрицы обозначается r(A). Ранг матрицы равен нулю только у нулевой матрицы. Если матрица отлична от нулевой, то 1 r(A) min{m,n}. Если ранг матрицы равен r, то среди миноров этой матрицы есть, по крайней мере, один минор M порядка r, отличный от нуля, а все r миноры порядков (r+1) и выше равны нулю. Следует отметить, что если все миноры некоторого порядка матрицы А равны нулю, то равны нулю все миноры более высоких порядков. Справедливость этого утверждения следует из теоремы о разложении определителя. Одним из способов вычисления ранга матрицы является метод элементарных преобразований матрицы. Перечислим элементарные преобразования: 1. Перестановка двух строк или столбцов. 2. Умножение всех элементов строки или столбца на любое число, отличное от нуля. 3. Прибавление ко всем элементам строки (столбца) соответствующих элементов другой строки (столбца), умноженных на одно и то же число. Теорема. При элементарных преобразованиях ранг матрицы не меняется. Доказательство. Справедливость теоремы относительно преобразований 1и 2 доказывается на основании соответствующих свойств определителей. Докажем теорему относительно преобразования 3. Рассмотрим матрицу В, полученную из матрицы A прибавлением к i-му столбцу k-го столбца, умноженного на число 0 : a11 a12... a1i + a1k... a1k... a1n a21 a22... a2i + a2k... a2k... a2n B =. ........................ a am2... ami + amk... amk... amn m Пусть ранг матрицы А равен r(А). Покажем, что r(B) r(A). Для этого докажем, что любой минор M порядка r+1 матрицы В равен r+ нулю. Рассмотрим минор M матрицы В, который не содержит i-ый r+ столбец. В этом случае M в точности соответствует некоторому r+ минору порядка r+1 матрицы А и, следовательно, равен нулю. Если минор M содержит i-ый и k-ый столбцы, то по свойству r+ определителей он равен сумме двух миноров порядка r+1, причем один из них равен нулю, так как совпадает с минором (r+1)-го порядка матрицы А, а второй минор равен нулю, так как i-ый и k-ый столбцы его пропорциональны. Пусть минор M содержит i-ый столбец, но не содержит k-ый r+ столбец. В этом случае минор M равен сумме двух миноров, один из r+ которых совпадает с минором порядка (r+1) матрицы А и поэтому равен нулю, а второй минор равен нулю, так как отличается от соответствующего минора матрицы А множителем. Таким образом, r(B) r(A) (3.2.1) Матрицу А можно получить из матрицы В с помощью элементарного преобразования 3, следовательно, r(A) r(B) (3.2.2) Из полученных равенств (3.2.1) и (3.2.2) следует, что r(A) = r(B). Теорема доказана. С помощью элементарных преобразований любую матрицу можно привести к виду, содержащему единичную подматрицу порядка r. Пример. Вычислить ранг матрицы с помощью элементарных преобразований. 1 2 4 5 2 3 1 1 A =. 0 1 7 9 1 3 11 14 Решение. Осуществим над матрицей А элементарные преобразования: 1 2 4 5 2 3 1 1 A(0) = A =. 0 1 7 9 1 3 11 14 Прибавим ко второй строке матрицы первую строку, умноженную на (Ц2), третью строку оставим без изменения, к четвертой строке прибавим первую строку, умноженную на (Ц1). Получим матрицу 1 2 4 5 0 -1 - 7 - 9 - A(1) =. 0 1 7 9 0 1 7 9 Прибавим первый столбец, умноженный на (Ц2), на (Ц4), на (Ц5) и на (Ц2) соответственно ко второму, третьему, четвертому и пятому столбцам. Затем вторую строку прибавим к третьей и четвертой строкам. Умножим вторую строку на Ц1. Получим: 1 0 0 0 0 1 7 9 A(2) =. 0 0 0 0 0 0 0 0 Прибавим второй столбец, умноженный на нужные множители, к третьему, четвертому и пятому столбцам: 1 0 0 0 0 1 0 0 A(3) =. 0 0 0 0 0 0 0 0 r(A)=2. Определение. Минор M, отличный от нуля, называется базисным r минором матрицы. Число базисных миноров матрицы А=(aij) не m,n r r больше чем CmCn. Строки и столбцы, на пересечении которых стоит некоторый базисный минор, называются базисным. 3.3. Линейная зависимость и независимость строк матрицы Введем понятие линейной зависимости и независимости строк матрицы. Пусть дана некоторая матрица А=(aij) и l1,l2,...,lm ее строки. m,n Будем говорить, что k-ая (1 k m ) строка матрицы является линейной комбинацией остальных ее строк (линейно выражается через остальные), если lk = 1l1 + 2l2 +...+ k-1lk -1 + k +1lk +1 +...+ m lm (3.3.1) где 1,2,...,k-1,k+1,...,m - какие-то числа (некоторые из этих чисел или даже все могут быть равны нулю). Это означает наличие следующих равенств между элементами столбцов: ak1 = 1a11 +... + k -1ak -1,1 + k +!aR+1,1 +... + mam ak1 = 1a12 +... + k -1ak -1,2 + k +1aR+1,2 +... + mam.............................................................................. ak1 = 1a1n +... + k -1ak -1,n + k +!aR+1,n +... + mamn n или aij = aij, j =1,n. i i= ik Из (3.3.1) вытекает, что 1l1 + 2l2 +... + k-1lk-1 + (-1)lk + k+1lk+1 +... + mlm = 0, (3.3.2) где 0 - нулевая строка. Определение. Строки l1,l2,...,lm матрицы А линейно зависимы, если существуют такие числа 1,2,...,m, не все равные нулю одновременно, что 1l1 +2l2 +... + mlm = 0 (3.3.3) Если равенство (3.3.3) справедливо тогда и только тогда, когда 1 = 2 =... = m = 0, то строки l1,l2,...,lm называются линейно независимыми. Соотношение (3.3.2) показывает, что если одна из строк линейно выражается через остальные, то строки линейно зависимы. Легко видеть и обратное: если строки линейно зависимы, то найдется строка, которая будет линейной комбинацией остальных строк. 2 m Пусть, например, в (3.3.3) 1 0, тогда l1 = - l2 -...- lm. 1 Определение. Пусть в матрице А выделен некоторый минор r-го порядка M и пусть минор (r+1)-го порядка этой же матрицы r M целиком содержит внутри себя минор M. Будем говорить, что в r+1 r этом случае минор M окаймляет минор M (или M является r+1 r r+ окаймляющим для M ). r Теперь докажем важную лемму. Лемма об окаймляющих минорах. Если минор M порядка r r матрицы А=(aij) отличен от нуля, а все окаймляющие его миноры m,n равны нулю, то любая строка (столбец) матрицы А является линейной комбинацией ее строк (столбцов), составляющих M. r Доказательство. Не нарушая общности рассуждений, будем считать, что отличный от нуля минор r-го порядка M стоит в левом r верхнем углу матрицы А=(aij) : m,n a11 a12... a1r... a1n a21 a22... a2r... a2n.................. A =. ar1 ar 2... arr... arn.................. a am2... amr... amn m Для первых k строк матрицы А утверждение леммы очевидно: достаточно в линейную комбинацию включить эту же строку с коэффициентом, равным единице, а остальные - с коэффициентами, равными нулю. Докажем теперь, что и остальные строки матрицы А линейно выражаются через первые k строк. Для этого построим минор (r+1)-го порядка M путем добавления к минору M k-ой строки ( r k m ) и l r+1 r го столбца (1 l n ): a11 a12... a1r a1l a a22... a2r a2l M =................ r+ ar1 ar 2... arr arl a ak... akr akl k1 Полученный минор равен нулю при всех k и l. Если l r, то он равен нулю как содержащий два одинаковых столбца. Если l > r, то полученный минор M является окаймляющим минором для M и, r+1 r следовательно, равен нулю по условию леммы. Разложим минор M по элементам последнего l-го столбца: r+ a1l A1 + a2l A2 +... + arl Ar + akl Ar+1 = (3.3.4) где A1, A2,..., Ar+1 - алгебраические дополнения к элементам a1l,a2l,...,akl. Алгебраические дополнение Ar+1 есть минор M матрицы А, r поэтому Ar+1 0. Разделим (3.3.4) на Ar+1 0 и выразим akl через a1l,a2l,...,arl : akl = 1a1l + a2l +...+ arl (3.3.5) 2 r Ai где = -, i =1,2,...,r. i Ar+ Полагая l =1,2,...,n, получим: ak1 = 1a11 + a21 +... + ar 2 r ak 2 = 1a12 + a22 +... + ar 2 r (3.3.6)............................................ akn = 1a1n + a2n +... + arn 2 r Выражение (3.3.6) означает, что k-я строка матрицы А линейно выражается через первые r строк. Так как при транспонировании матрицы значения ее миноров не изменяются (ввиду свойства определителей), то все доказанное справедливо и для столбцов. Теорема доказана. Следствие I. Любая строка (столбец) матрицы является линейной комбинацией ее базисных строк (столбцов). Действительно, базисный минор матрицы отличен от нуля, а все окаймляющие его миноры равны нулю. Следствие II. Определитель n-го порядка тогда и только тогда равен нулю, когда он содержит линейно зависимые строки (столбцы). Достаточность линейной зависимости строк (столбцов) для равенства определителя нулю доказана ранее как свойство определителей. Докажем необходимость. Пусть задана квадратная матрица n-го порядка, единственный минор которой M равен нулю. Отсюда следует, n что ранг этой матрицы меньше n, т.е. найдется хотя бы одна строка, которая является линейной комбинацией базисных строк этой матрицы. Докажем еще одну теорему о ранге матрицы. Теорема. Максимальное число линейно независимых строк матрицы равно максимальному числу ее линейно независимых столбцов и равно рангу этой матрицы. Доказательство. Пусть ранг матрицы А=(aij) равен r. Тогда m,n любые ее k базисных строк являются линейно независимыми, иначе базисный минор M был бы равен нулю. С другой стороны, любые r+1 и r более строк линейно зависимы. Предположив противное, мы могли бы найти минор порядка более чем r, отличный от нуля по следствию предыдущей леммы. Последнее противоречит тому, что максимальный порядок миноров, отличных от нуля, равен r. Все доказанное для строк справедливо и для столбцов. В заключение изложим еще один метод нахождения ранга матрицы. Ранг матрицы можно определить, если найти минор максимального порядка, отличный от нуля. На первый взгляд, это требует вычисления хотя и конечного, но быть может, очень большого числа миноров этой матрицы. Следующая теорема позволяет, однако, внести в этот значительные упрощения. Теорема. Если минор M матрицы А отличен от нуля, а все r окаймляющие его миноры равны нулю, то ранг матрицы равен r. Доказательство. Достаточно показать, что любая подсистема строк * * * матрицы l1,l2,...,ls при S>r будет в условиях теоремы линейно зависимой (отсюда будет следовать, что r - максимальное число линейно независимых строк матрицы или любые ее миноры порядка больше чем k равны нулю). * * * Предположим противное. Пусть строки l1,l2,...,ls линейно независимы. По лемме об окаймляющих минорах каждая из них будет линейно выражаться через строки l1,l2,...,ls, в которых стоит минор M и r которые, ввиду того, что M отличен от нуля, линейно независимы: r * l1 = 11l1 +12l2 +...+1r lr * l2 = 21l1 +22l2 +...+2r lr (3.3.7).......................................... * ls = s1l1 +s2l2 +...+sr lr Рассмотрим матрицу К из коэффициентов линейных выражений (3.3.7): 11 12... 1к 22... 2r K =. ............ S... Sr S1 Строки этой матрицы обозначим через K1, K2,..., KS. Они будут линейно зависимы, так как ранг матрицы К, т.е. максимальное число ее линейно независимых строк, не превышает r Перейдем к равенству компонент S (3.3.8) ij = 0, j = 1,r. i i= Теперь рассмотрим следующую линейную комбинацию: S * * * 1l1 + 2l2 +... + S lS или i li* i= Используя (3.3.7) и (3.3.8), получаем S S r r S ili* = i l = ij i j ij l = 0, j i=1 i =1 j =1 j =1 i= * * * что противоречит линейной независимости строк l1,l2,...,ls. Следовательно, наше предположение неверно и, значит, любые S>r строк в условиях теоремы линейно зависимы. Теорема доказана. Рассмотрим правило вычисления ранга матрицы - метод окаймляющих миноров, основанный на данной теореме. При вычислении ранга матрицы следует переходить от миноров меньших порядков к минорам больших порядков. Если уже найден минор r-го порядка M, отличный от нуля, то требуется вычислить лишь r миноры (r+1)-го порядка, окаймляющие минор M. Если они равны r нулю, то ранг матрицы равен r. Этот метод применяется и в том случае, если мы не только вычисляем ранг матрицы, но и определяем, какие столбцы (строки) составляют базисный минор матрицы. Пример. Вычислить методом окаймляющих миноров ранг матрицы 1 2 4 5 2 3 1 1 A =. 0 1 7 9 1 3 11 14 Решение. Минор второго порядка, стоящий в левом верхнем углу матрицы А, отличен от нуля: 1 M = 0. 2 Однако все окаймляющие его миноры третьего порядка равны нулю: 1 2 4 1 2 ( ( M31) = 2 3 1 = 0 ; M32) = 2 3 1 = 0 ; 0 1 7 0 1 1 2 2 1 2 ( ( M33) = 2 3 3 = 0 ; M34) = 2 3 1 = 0 ; 0 1 1 1 1 1 2 5 1 2 ( ( M35) = 2 3 1 = 0; M36) = 2 3 3 = 0. 1 3 14 1 3 Следовательно, ранг матрицы А равен двум: r(A) = 2. Первая и вторая строки, первый и второй столбцы в данной матрице являются базисными. Остальные строки и столбцы являются их линейными комбинациями. В самом деле, для строк справедливы следующие равенства: l3 = 2l1 + (-1)l2, l4 = 3l1 + (-1)l2. В заключение отметим справедливость следующих свойств: 1) ранг произведения матриц не больше ранга каждого из сомножителей; 2) ранг произведения произвольной матрицы А справа или слева на невырожденную квадратную матрицу Q равен рангу матрицы А. 3.4. Многочленные матрицы Определение. Многочленной матрицей или -матрицей называется прямоугольная матрица, элементы которой являются многочленами от одного переменного с числовыми коэффициентами. Над -матрицами можно совершать элементарные преобразования. К ним относятся: - перестановка двух строк (столбцов); - умножение строки (столбца) на число, отличное от нуля; - прибавление к одной строке (столбцу) другой строки (столбца), умноженной на любой многочлен f (). Две -матрицы A() и B() одинаковых размеров называются эквивалентными: A() ~ B(), если от матрицы A() к B() можно перейти с помощью конечного числа элементарных преобразований. Пример. Доказать эквивалентность матриц -1 + +1 A() =, B() = 0 ( +1)(2 - 2). +1 2 + 2 + Решение. 1. Поменяем местами в матрице A() первый и второй столбцы: + 1 2 - A() ~. + 2 + 1 + 2. Из второй строки вычтем первую, умноженную на ( + 1): 2 - + A() ~. 0 - 3 - 2 + 2 + 3. Умножим вторую строку на (Ц1) и заметим, что 3 + 2 - 2 - 2 = ( +1)(2 - 2). Получим 2 - + A() ~. 0 ( + 1)(2 - 2) 4. Вычтем из второго столбца первый, умноженный на ( -1), получим +1 A() ~. 0 ( +1)(2 - 2) Множество всех -матриц данных размеров [m n] разбивается на непересекающиеся классы эквивалентных матриц. Матрицы, эквивалентные между собой, образуют один класс, не эквивалентные - другой. Каждый класс эквивалентных матриц характеризуется канонической, или нормальной, -матрицей данных размеров. Определение. Канонической, или нормальной, -матрицей размеров [m n] называется -матрица, у которой на главной диагонали стоят многочлены E1(), E2 (),..., Ep (), где р - меньшее из чисел m и n ( p = min{m, n}), причем не равные нулю многочлены имеют старшие коэффициенты, равные 1, и каждый следующий многочлен делиться на предыдущий. Все элементы вне главной диагонали равны 0. Из определения следует, что если среди многочленов имеются многочлены нулевой степени, то они в начале главной диагонали. Если имеются нули, то они стоят в конце главной диагонали. Матрица B() предыдущего примера есть каноническая. Матрица 1 0 0 0 0 0 0 C() = 0 0 ( - 3) 0 0 0 0 0 также каноническая. Каждый класс -матриц содержит единственную каноническую -матрицу, т.е. каждая -матрица эквивалентна единственной канонической матрице, которая называется канонической формой или нормальной формой данной матрицы. Многочлены, стоящие на главной диагонали канонической формы данной -матрицы, называются инвариантными множителями данной матрицы. Один из методов вычисления инвариантных множителей состоит в приведении данной -матрицы к канонической форме. Так, для матрицы C() предыдущего примера инвариантными множителями являются E1() =1, E2 () =, E3() = ( - 3), E4 () = 0. Из сказанного следует, что наличие одной и той же совокупности инвариантных множителей является необходимым и достаточным условием эквивалентности -матриц. Приведение -матриц к каноническому виду сводится к определению инвариантных множителей Dk () Ek ()= Dk-1(), k =1,2,...,r ; D0 =1, где r - ранг -матрицы; Dk - наибольший общий делитель миноров k-го порядка, взятый со старшим коэффициентом, равным 1. Пример. Пусть дана -матрица - 2 -1 A()= 0 - 2 -1. 0 0 - Решение. Очевидно, наибольший общий делитель первого порядка D1 =1, т.е. E1()=1. Определим миноры второго порядка: - 2 -1 -1 = ( - 2), = и т.д. 0 - 2 - 2 - Уже этих данных достаточно для того, чтобы сделать вывод: D D2 =1, следовательно, E2 = =1. D Определяем D - 2 -1 D3 = 0 - 2 -1 = ( - 2)3, 0 0 - ( - 2) Следовательно, E3 = = ( - 2). Таким образом, канонической формой данной матрицы является следующая -матрица: 1 0. 0 1 0 0 - 2) ( Матричным многочленом называется выражение вида F()= A0S + A1S-1 +...+ AS, где - переменное; A0, A1,..., AS - квадратные матрицы порядка n с числовыми элементами. Если A0 0, то S называют степенью матричного многочлена, n - порядком матричного многочлена. Любую квадратичную -матрицу можно представить в виде матричного многочлена. Справедливо, очевидно, и обратное утверждение, т.е. любой матричный многочлен можно представить в виде некоторой квадратной -матрицы. Справедливость данных утверждений со всей очевидностью вытекает из свойств операций над матрицами. Остановимся на следующих примерах: Пример. Представить многочленную матрицу -1 + A()= +1 2 + 2 + в виде матричного многочлена можно следующим образом 1 0 0 -1 2 + +. 0 1 1 1 Пример. Матричный многочлен 2 0 1 1 - G()= 2 + + 0 1 3 0 1 - можно представить в виде следующей многочленной матрицы ( матрицы) 2 + + 3 - G()=. 3 +1 2 - Эта взаимозаменяемость матричных многочленов и многочленных матриц играет существенную роль в математическом аппарате методов факторного и компонентного анализа. Матричные многочлены одинакового порядка можно складывать, вычитать и умножать аналогично обычным многочленам с числовыми коэффициентами. Следует, однако, помнить, что умножение матричных многочленов, вообще говоря, не коммутативно, т.к. не коммутативно умножение матриц. Два матричных многочлена называются равными, если равны их коэффициенты, т.е. соответствующие матрицы при одинаковых степенях переменного. Суммой (разностью) двух матричных многочленов F() и G() называется такой матричный многочлен, у которого коэффициент при каждой степени переменного равен сумме (разности) коэффициентов при той же степени в многочленах F() и G(). Чтобы умножить матричный многочлен F() на матричный многочлен G(), нужно каждый член матричного многочлена F() умножить на каждый член матричного многочлена G(), сложить полученные произведения и привести подобные члены. Степень матричного многочлена - произведения F()G() меньше или равна сумме степеней сомножителей. Операции над матричными многочленами можно осуществлять с помощью операций над соответствующими -матрицами. Чтобы сложить (вычесть) матричные многочлены, достаточно сложить (вычесть) соответствующие -матрицы. То же относится к умножению. -матрица произведения матричных многочленов равна произведению -матриц сомножителей. Пример. 1 0 0 1 0 1 1 F()= + G()= + 0 -1 0 -1 0 -1 1 0 0 1 0 1 0 1 1 0 1 F()G()= 2 + 0 -10 1 + 0-1 0 + -1 00 1 - 0 1 1 0 0 1 1 -1 + 2 + 0 -1-1 0 = 0 -1 + 1 -1 - С другой стороны F() и G() можно записать в виде 1 F()= G()= и - -1 - -1 0 1 1 2 + -1 F()G()= = 2 + 0 -1 + 1 - +1- 2 -1 - Так как умножение матриц не коммутативно, для матричных многочленов определяются два деления с остатком - правое и левое. Пусть даны два матричных многочлена порядка n F()= A0S + A1S-1 +... + AS G()= B0t + B1t-1 +...+ Bt где В0 - невырожденная матрица. При делении F() на G() существует однозначно определенное правое частное Q1() и правый остаток R1() F()= Q1()G()+ R1(), где степень R1 меньше степени G(), или R1()= 0 (деление без остатка), а также левое частное Q2() и левый остаток R2() F() = G()Q2 () + R2 (), где степень R2() меньше степени G(), или R2()=0 (деление без остатка). Обобщённая теорема Безу. При делении матричного многочлена F() на многочлен (E - A) правый остаток равен правому значению делимого F() при = A, т.е. матрице F(пр) = A0 AS + A1AS-1 +...+ AS = R1, (3.4.1) а левый остаток - левому значению делимого F() при = A, т.е. матрице F( лев) = AS A0 + AS-1A0 +...+ AS = R (3.4.2) Доказательство. Доказательство справедливости обеих формул (3.4.1) и (3.4.2) осуществляется одинаково, непосредственной подстановкой. Докажем одну из них. Итак, делимое - F(), делитель - G = E - A, в качестве частного имеем многочлен Q2() = A0S -1 + (AA0 + A1)S -2 + (A2 A0 + AA1 + A2)S -3 +... + + (AS -1A0 + AS -2 A1 +... + AS -1). Определим произведение (E - A) Q2(): A0S + (AA0 + A1)S -1 + (A2 A0 + AA1 + A2)S -2 +... + + (AS -1A0 + AS -2 A1 +... + AS -1) - AA0S -1 - (A2 A0 + AA1)S -2 - (A3A0 + A2 A1 + AA2)S -3 -... - (AS A0 + AS -1A1 +...+ AAS -1) = = A0S + A1S -1 + A2S -2 +...+ AS - (AS A0 + AS -1A1 +...+ AAS -1), т.е. (AS A0 + AS -1A1 +...+ AAS -1) + F() = (E - A)Q2 (), или F() = (E - A)Q2 () + (AS A0 + AS -1A1 +...+ AAS-1), т.е. R2 = AS A0 + AS -1A1 +...+ AAS-1, что и требовалось доказать. Следствие. F() делится справа (слева) на многочлен (E - A) тогда и только тогда, когда F(пр) = R1(F( лев) = R2 ) равно 0. Пример. Показать, что матричный многочлен - 2 - 2 - 2 0 0 - 1 F()= = 2 + + 1 1 2 0 2 + 2 делится на матричный многочлен (E - A), 2 где A =, слева без остатка. -1 - Решение. В самом деле, справедливо равенство F()= (E - A)Q()+ R1, где R1 = - 2 -1 E - A = ; Q()= 1 +1 0 Подсчитаем значение левого остатка по теореме Безу 1 - 21 0 0 - R1 = A2 + A + = 0 1 2 0 2 1 1 0 2 1 2 0 0 - 2 0 - = + + 0 0 0 2 = 0. -1 -1 -1 -1 1 2 3.5. Задания для самостоятельной работы по главе 3.1. Найти обратную матрицу 1 2 3 2 3 1 2. 1 1 1 - 1 0 - 2 - 3.2. Найти обратную матрицу порядка n 1 1 1... 0 1 1... 0 0 1... 1. ............... 0 0 0... 3.3. Найти обратную матрицу порядка n 1 2 3 4... n -1 n 0 1 2 3... n - 2 n - 0 0 1 2... n - 3 n -. ..................... 0 0 0 0... 1 0 0 0 0... 0 3.4. Найти обратную матрицу порядка n 1 1 1... 1 0 1... 1 1 0... 1. ............... 1 1 1... 3.5. Найти обратную матрицу cos - sin. sin cos 3.6. Найти обратную матрицу порядка (n+1) 1 a a2 a3... an 0 1 a a2... an- 0 0 1 a... an-2. .................. 0 0 0 0... 3.7. Найти обратную матрицу порядка n -1 0 0... -1 2 -1 0... 0 -1 2 -1... 0. .................. 0 0 0 0... 3.8. Как изменится обратная матрица A-1, если в данной матрице A: а) переставить i-ую и j-ую строки? б) i-ую строку умножить на число с, не равное нулю? в) к i-ой строке прибавить j-ую, умноженную на число с, или совершить аналогичное преобразование столбцов? Ek U 3.9. Найти матрицу A-1, обратную для матрицы A = O El, где Ek и El - единичные матрицы соответственно порядков k и l, U - произвольная матрица порядка k l, а все остальные элементы равны нулю. 3.10. Показать, что операция транспонирования матрицы обладает свойствами: а) (A + B) = A + B ; б) (AB) = B A ; в) (cA) = cA ; - г) (A-1) = (A ), где с - число, а А и В - матрицы. 3.12. Доказать, что если А и В - симметрические квадратные матрицы одинакового порядка, то матрица C = A B A B... A B A является симметрической. 3.12. Показать, что для любой матрицы В матрица A = B B является симметрической. 3.13. Квадратная матрица A = (aij) порядка n называется ортогональной, если A A = E, где Е - единичная матрица. Показать, что для ортогональности квадратной матрицы А необходимо и достаточно любое из следующих условий: а) столбцы А образуют ортонормированную систему, т.е. n a akj = ij, ki k = где ij - символ Кронекера, обозначающий 1 при i=j и 0 при i j ; б) строки А образуют ортонормированную систему, т.е. n a a = ij. ik jk k = 3.14. Доказать, что ранг суммы двух матриц не больше суммы их рангов. 3.15. Доказать, что если ранг матрицы А равен r, то минор d, стоящий на пересечении любых r линейно независимых строк и r линейно независимых столбцов этой матрицы, отличен от нуля. ГЛАВА 4. РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ 4.1. Система линейных уравнений Системой m линейных уравнений с n неизвестными называется система m алгебраических уравнений первой степени вида a11x1 + a12x2 +... + a1nxn = b1, a21x1 + a22x2 +... + a2n xn = b2, (4.1.1)........................................ am1x1 + am2x2 +... + amnxn = bm, где x, j =1,n - неизвестные, подлежащие определению; j aij - числа, называемые коэффициентами при неизвестных; bi - числа, называемые свободными членами. Решением системы уравнений (4.1.1) называется совокупность n чисел 1,2,...,n таких, что если в каждое уравнение системы вместо неизвестных подставить эти числа (1 вместо x1, 2 вместо x2,...,n вместо xn ), то все уравнения обратятся в тождества. Если система линейных уравнений (4.1.1) имеет хотя бы одно решение, то она называется совместной. В противном случае система называется несовместной. Совместная система, имеющая единственное решение, называется определенной, а система, имеющая более одного решения - неопределенной. Две системы линейных уравнений называются эквивалентными, если любое решение каждой из них является одновременно решением и другой системы. Две произвольные несовместные системы считаются эквивалентными. Системе линейных уравнений (4.1.1) поставим в соответствие матрицу A = (aij) и расширенную матрицу m,n a11 a12... a1n b a21 a22... a2n b ~ A =,............... am1 am2... amn bm полученную присоединением к матрице А столбца свободных членов. 4.2. Методы решения системы n линейных уравнений с n неизвестными Рассмотрим систему n линейных уравнений с n неизвестными a11x1 + a12x2 +... + a1nxn = b1, a21x1 + a22x2 +... + a2nxn = b2, (4.2.1)........................................ an1x1 + an2x2 +... + annxn = bn. Определитель |A| матрицы А называется определителем системы (4.2.1). Теорема Крамера. Если определитель |A| системы (4.2.1) отличен от нуля, то система совместна и имеет единственное решение. Доказательство. Пусть система (4.2.1) совместна и 1,2,...,n - одно из ее решений. Тогда получим n тождеств: a111 + a122 +... + a1nn = b1, a211 + a222 +... + a2nn = b2, (4.2.2)........................................ an11 + an22 +... + annn = bn. Умножим обе части первого из равенств (4.2.2) на алгебраическое дополнение А1 j, обе части второго равенства умножим на алгебраическое дополнение А2 j и т.д. и обе части n-ого равенства - на Аnj. Складывая левые и правые части полученных выражений, придем к следующему равенству: (a11А1 j + a21А2 j +...+ an1Аnj )1 + (a12А1 j + a22 А2 j +... + an2 Аnj )2 + +... + (a1 j А1 j + a2 j А2 j +... + anj Аnj ) +... + (a1n А1 j + a2n А2 j +... + (4.2.3) j + ann Аnj )n = b1А1 j + b2 А2 j +... + bn Аnj Коэффициент при равен определителю |A| системы (4.2.1), j коэффициент при 1,2,...,,,...,n равен нулю, а правая часть j-1 j+ равенства (4.2.3) является определителем, полученным из определителя |A| путем замены j-го столбца столбцом свободных членов. Обозначим данный определитель через Aj = b1A1 j + b2 A2 j +... + bn Anj Тогда равенство (4.2.3) примет вид: | А | =| Aj |, откуда j | Aj | =, j = 1, n (4.2.4) j | A | Из формулы (4.2.4) следует, что если система (4.2.1) совместна, то она обладает единственным решением. Формулы (4.2.4) называются формулами Крамера. | Aj | Непосредственной подстановкой значений =, j = 1, n, во j | A | все уравнения системы убедимся в том, что они образуют ее решение: n n n n n n | Aj | 1 1 aij | Aj | = aij Akj. a | A | = a b Akj = b ij ij k k | A | | A | | A | j=1 j=1 j=1 k=1 k=1 j= n n При i = k, a Akj =| A |; при i k, a Akj = 0. ij ij j =1 j= Таким образом, получим n | Aj | aij = bi | A |= bi,i = 1, n. | A | | A | j= Теорема доказана. Пример. Решить систему линейных уравнений методом Крамера: x1 + 2x2 + 3x3 = 7, x1 - 3x2 + 2x3 = 5, x1 + x2 + x3 = 3. Решение. Вычислим определитель | A |,| A1 |,| A2 |,| A3 |: 1 2 | А |= 1 - 3 2 = 9 1 1 7 2 3 1 0 1 | А1 |= 5 - 3 2 = 14 0 5 = - = -(5 -14) = 9, 14 3 1 1 3 1 1 7 3 1 7 - 2 - | А2 |= 1 5 2 = 0 - 2 -1 = = 4 - 4 = 0, - 4 - 1 3 1 0 - 4 - 1 2 7 1 2 - 5 - | А3 |= 1 - 3 5 = 0 - 5 - 2 = = 20 - 2 =18, -1 - 1 1 3 0 -1 - откуда x1 =1, x2 = 0, x3 = 2. Решение системы линейных уравнений с определителем |A|, отличным от нуля, можно найти с помощью обратной матрицы. Для этого запишем систему (4.2.1) в виде матричного уравнения АХ=В (4.2.5) где A = (aij )n,n; X = (x1, x2,..., xn )T, B = (b1,b2,...,bn )T. Решение матричного уравнения (4.2.5) имеет вид (4.2.6) X = A-1B Пример. Решить систему линейных уравнений с помощью обратной матрицы x1 + 2x2 + 3x3 = x1 - 3x2 + 2x3 = x1 + x2 + x3 = Решение. Вычислим для матрицы 1 2 А = - 3 1 1 ее обратную матрицу - 5 1 А-1 = 1 - 2. 4 1 - Определим неизвестную матрицу-столбец Х: - 5 1 13 2 3 1/ 1 Х = А-1В = 1 - 2 1 = = 0 3 1/3, 9 4 1 - 5 1 3 1/ откуда x1 =1/3, x2 =1/ 3, x3 =1/ 3. Формулы Крамера (4.2.4) могут быть получены из выражения (4.2.6). Действительно, запишем матричное равенство X = A-1B в развернутом виде: x1 A11 A21... An1 b x2 1 A12 A22... An2 b =. M | A |............ M xn A1n A2n... Ann bn Из полученного выражения непосредственно следуют формулы Крамера: n xi = Akibk, i = 1, n. | A | k= 4.3. Теорема Кронекера-Карелли Теорема. Система линейных уравнений (4.1.1) совместна тогда и ~ только тогда, когда r(A) = r(A). Доказательство. Необходимость. Пусть система (4.1.1) совместна и пусть числа 1,2,...,n - одно из ее решений. Подставляя эти числа вместо неизвестных в систему (4.1.1), получим m тождеств, которые ~ показывают, что последний столбец матрицы A является линейной комбинацией всех остальных столбцов, взятых соответственно с ~ коэффициентами 1,2,...,n. Всякий другой столбец матрицы A входит и в матрицу А. Поэтому максимальное число линейно ~ независимых столбцов матриц А и A совпадает. Следовательно, ~ r(A) = r(A). ~ Достаточность. Пусть дано, что r(A) = r(A) = r. Отсюда следует, ~ что максимальное число линейно независимых столбцов матриц А и A совпадает и равно r. Для определенности предположим, что первые r ~ столбцов матриц А и A линейно независимы, а остальные (n-r) столбцов является их линейными комбинациями. Выражая последний столбец матрицы А как линейную комбинацию первых r столбцов, получим: ai1 1 + ai2 2 +... + air r = bi, i =1, m или ai1 1 + ai2 2 +... + air r + ai,r +1 0 +... + ai,n 0 = bi, i = 1, m откуда следует, что числа 1,2,...,r,0,...,0 являются решением системы (4.1.1), т.е. система (4.1.1) совместна. Теорема доказана. На основании теоремы Кронекера-Капелли имеем: ~ 1. Если r(A) r(A), то система (4.1.1) несовместна; ~ 2. Если r(A) = r(A) = r, то система (4.1.1) совместна. Пусть для определенности базисный минор порядка r расположен в верхнем левом углу матрицы А. Тогда первые r строк матрицы А линейно независимы, а остальные ее строки являются линейной комбинацией первых r строк. Но это означает, что первые r уравнений системы (4.1.1) линейно независимы, а остальные (m-r) ее уравнений являются их линейными комбинациями. Поэтому достаточно решить систему r уравнений; решения такой системы будут, очевидно, удовлетворять и остальным (m-r) уравнениям. При этом возможны два случая: 1. r = n. Тогда систему, состоящую из первых r уравнений системы (4.1.1) a11x1 + a12x2 +... + a1nxn = b1, a21x1 + a22x2 +... + a2nxn = b2,........................................ ar1x1 + ar 2x2 +... + arnxn = br. можно решить, например, по правилу Крамера. В этом случае система имеет единственное решение, т.е. система совместна и определена; 2. r < n. Рассмотрим первые r уравнений системы (4.1.1). Оставив в левых частях первые r неизвестных, перенесем остальные в правые части. Получим систему: a11x1 +... + a1r xr = b1 - a1,r+1xr+1 -... - a1nxn, a21x1 +... + a2r xr = b2 - a2,r+1xr+1 -... - a2nxn,........................................ ar1x1 +... + arr xr = br - ar,r+1xr+1 -... - arnxn. Очевидно, что полученная система и, следовательно, система (4.1.1) являются совместными и неопределенными. ~ Таким образом, если r(A) = r(A), то система (4.1.1) совместна ~ (определенная или неопределенная), если r(A) < r(A), то система (4.1.1) несовместна. Если в системе n линейных уравнений с n неизвестными ~ определитель системы равен нулю, то r(A) < n. Тогда если r(A) = r(A), ~ то система является совместной и неопределенной. Если r(A) < r(A), то система несовместна. Теорема Кронекера-Капелли устанавливает необходимое и достаточное условие совместности системы (4.1.1), но не дает способа нахождения решения этой системы. Рассмотрим метод Жордана-Гаусса - метод решения системы m линейных уравнений с n неизвестными. 4.4. Метод Жордана-Гаусса Метод Жордана-Гаусса основан на элементарных преобразованиях (п.3.2) строк расширенной матрицы a11 a12... a1n b a21 a22... a2n b ~ A =............... am1 am2... amn bm системы (4.1.1). В результате каждого из элементарных преобразований расширенная матрица изменяется, однако системы линейных уравнений, соответствующие полученным матрицам, эквивалентны исходной системе линейных уравнений. Пусть дана система m линейных уравнений с n неизвестными. Применяя элементарные преобразования, построим эквивалентную систему специального вида. Для этого выберем в качестве первого уравнений одно из тех уравнений системы, где коэффициент при х отличен от нуля. Не нарушая общности, предположим, что а11 0. Тогда первым уравнением системы будет уравнение. a11x1 + a12 x2 +... + a1n xn = b Умножим первое уравнение на. Затем умножим это же a ai уравнение на, и прибавим его почленно к уравнениям -,i = 2,3,...,m a системы с номерами i=2,3,Е,m. После этого преобразования в уравнениях с номерами i>1 будет исключено неизвестное х1. Первый шаг метода Жордана-Гаусса закончен. (1 (1 ( b11) 1 a12) a13)... a11) ( n (1 (1 ( b(1) 0 a22) a23)... a21) ~ n A(1) =. .................. (1) (1) (1) b(1) 0 am2 am3... amn m Может случиться, что на первом шаге вместе с неизвестными х будут исключены неизвестными x2, x3,..., x ( jk-1 < n), но найдется хотя jk - бы одно уравнение, в котором сохранится неизвестное x. Одно из jk таких уравнений примем в качестве второго уравнения системы. В этом ~ случае расширенная матрица A(1), соответствующая полученной системе, имеет вид: (1 (1 ( ( 1 a12) a13)... a11)... a11) ( b11) n jk ( ( b(1) 0 0 0... a21)... a21) ~ n jk A(1) =. ........................ (1 (1) b(1) 0 0 0... amj)... amn k m Используем второе уравнение для исключения неизвестного x jk из всех уравнений, кроме второго. После второго шага метода Жордана Гаусса получим расширенную матрицу (2) (2) ( (2) (2) 1 a12 a13... 0 a12)... a1n b jk + ( ( 0 0 0... 1 a22)... a22) ( b21) n jk + ~ ( ( A(2) = 0 0 0... 0 a32)... a32) (. b32) n jk +........................... (2 ( 0 0 0... 0 amj)... amn) ( bm2) k + ~ Продолжая процесс, после r шагов получим матрицу A(r), содержащую r единичных столбцов на месте первых n столбцов матрицы А (r - ранг матрицы А системы). При этом возможны три случая: ~ ~ 1. Если r(A) = r(A) = n, то матрица A преобразуется в матрицу (n) 1 0 0... b ( 0 1 0... b2n).................. ~ ( A(n) = 0 0 0... bnn) 0 0 0..................... 0 0 0... Система имеет единственное решение: (n) ( ( x1 = b1, x2 = b2n),..., xn = bnn). ~ 2. Если r(A) = r(A) = r и r ~ ( ( (r) A(r) = 0 0 0... 1 arrr)... a2r) br, +1 n 0 0 0... 0 0... 0........................... 0 0 0... 0 0... 0 Система имеет бесконечное множество решений. Общее решение имеет вид: (r) ( (r x1 = b1 - a1,rr) xr+1 -... - a1n) xn, + ( ( ( x2 = b2r) - a2rr) xr+1 -... - a2r) xn,, +1 n................................................ (r ( (r xr = br1) - arrr) xr+1 -... - arn) xn. , + Неизвестные x1, x2,..., xr называются базисными. xr+1, xr+2,..., xn - свободными неизвестными. Свободным неизвестным xr+1, xr+2,..., xn можно придавать какие угодно значения, получая при этом соответствующие значения неизвестных x1, x2,..., xr. В результате имеем бесконечное множество частных значений. Среди частных решений системы выделим базисные решения, которые получают при равенстве нулю всех свободных неизвестных. Очевидно, что одним из базисных решений является следующее: (r) ( (r) x1 = b1, x2 = b2r),..., xr = br, xr+1 = 0,..., xn =. r В общем случае число базисных решений не превышает Cn. ~ 2. Если r(A) r(A), то ( (r (r) 1 0 0... 0 a1,r)... a1n) b r+ ( ( ( 0 1 0... 0 a2rr)... a2r) b2r), +1 n........................... ~ ( ( (r) A(r) = 0 0 0... 1 arrr)... a2r) br, +1 n (r) 0 0 0... 0 0... 0 br+........................... ( 0 0 0... 0 0... 0 bnr) где хотя бы один из элементов bi(r),r + 1 i m отличен от нуля. В этом случае система (4.1.1) несовместна. Таким образом, метод Жордана-Гаусса состоит из r итераций (r шагов). На каждой S-ой итерации выбирается направляющий элемент ai(S-1) 0, где iS, jS - соответственно направляющие строка и столбец. С jS S помощью элементарных преобразований столбец jS преобразуется в единичный с единицей в строке iS. Рассмотрим алгоритм произвольной итерации метода Жордана ~ ~ (0) Гаусса. Положим J = {1,2,...,m}, A(0) = A. (S ) (S-1) Шаг 1. Сформировать множество J = J \ {iS}. (S ) Шаг 2. Если J =, то процесс элементарных преобразований закончить. В противном случае перейти к шагу 3. (S ) ( Шаг 3. Если для i J aijS-1) = 0, то процесс элементарных преобразований закончить. В противном случае найти направляющий (S ) элемент ai(S-1) 0, iS J и перейти к шагу 4. jS S Шаг 4. Разделить направляющую строку iS на ai(S -1) 0. jS S Шаг 5. К i-ой строке, i iS,i =1,m, прибавим строку iS, ( aijS -1) S умноженную на -. ai(S -1) jS S Покажем, что столбец jS преобразуется в единичный с единицей в ~ строке iS. Пусть jS = k,iS = l. Элементы матрицы A(S ) выражаются ~ через элементы матрицы A(S-1) следующим образом: ( ( ( aljS ) = aljS-1) / alkS-1), j =1,n (4.4.1) ( bi(S ) = bl(S-1) / alkS-1), (4.4.2) ( aljS-1) ( ( ( aijS ) = aijS-1) - aijS-1),i =1,2,...,l -1,l + 1,...,m; j =1,2,...,n (4.4.3) ( alkS-1) bl(S -1) ( bi(S ) = bi(S-1) - aikS-1),i =1,2,...,l -1,l + 1,...,m; j =1,2,...,n (4.4.4) ( alkS-1) Полагая j=k, из (4.4.1) и (4.4.3) имеем ( ( alkS ) =1,aiks) = 0,i =1,2,...,l -1,l + 1,...,m. Пример. Решить систему линейных уравнений методом Жордана Гаусса. а) 2x1 + 5x2 + 5x3 + x4 = 20, 2x1 + 10x2 + 9x3 + 7x4 = 40, x1 + 3x2 + 2x3 + x4 =11, 3x1 + 8x2 + 9x3 + 2x4 = 37. Решение. Составим из данной системы расширенную матрицу 2 5 4 1 ~ 2 10 9 7 A = 1 3 2 1 3 8 9 2 ~ ~ (0) Полагаем A(0) = A, J = {1,2,3,4}. Итерация 1. (1) (0) Шаг 1. J = J = {1,2,3,4}. (3) Шаг 2. J, переходим к шагу 3. ( Шаг 3. Находим ai(0) = a31) =1; i1 = 3, j1 =1. j ( Шаг 4. Делим третью строку на a31) = 1. Шаг 5. К первой, второй и четвертой строкам прибавляем третью строку, соответственно умноженную на Ц2, -2, -3. В результате матрица ~ A(0) преобразуется в матрицу 0 -1 0 -1 - ~ 0 4 5 5 A(1) =. 1 3 2 1 0 -1 3 -1 Итерация 2. (2) (1) Шаг 1. J = J \ {3} = {1,2,4}. (3) Шаг 2. J, переходим к шагу 3. ( Шаг 3. Находим ai(1) = a12) = -1; i2 =1, j2 = 2. j ( Шаг 4. Делим первую строку на a12) = -1. Шаг 5. Ко второй, третьей и четвертой строкам прибавляем первую строку, соответственно умноженную на Ц4, -3, 1. Получим матрицу 0 1 0 1 ~ 0 0 5 1 A(2) =. 1 0 2 - 2 0 0 3 0 Итерация 3. (3) (2) Шаг 1. J = J \ {1} = {2,4}. (3) Шаг 2. J, переходим к шагу 3. ( Шаг 3. Находим ai(2) = a43) = -1; i3 = 4, j3 = 3. j ( Шаг 4. Делим четвертую строку на a43) = 3. Шаг 5. К первой, второй, третьей строкам прибавляем четвертую строку, соответственно умноженную на 0, -5, -2. Получим матрицу 0 1 0 1 ~ 0 0 0 1 A(3) = 1 0 0 - 2 1. 0 0 1 0 Итерация 4. (4) (3) Шаг 1. J = J \ {4} = {2}. (4) Шаг 2. J, переходим к шагу 3. ( Шаг 3. Находим ai(3) = a24) =1; i4 = 2, j4 = 4. j ( Шаг 4. Делим четвертую строку на a43) = 3. Шаг 5. К первой, третьей и четвертой строкам прибавляем вторую строку, соответственно умноженную на -1, 2, 0. Получим матрицу 0 1 0 0 ~ 0 0 0 1 A(3) = 1 0 0 0 1. 0 0 1 0 Итерация 5. (5) (4) Шаг 1. J = J \ {2} =. (5) Шаг 2. J =, поэтому процесс элементарных преобразований ~ закончен. На основании вида матрицы A(4) получаем единственное решение исходной системы: x1 = 1, x2 = 2, x3 = 2, x4 = 0. б) x1 + 2x2 + 3x3 - x4 = 0, x1 - 2x2 + x3 + 2x4 = 4, x1 + 5x2 + 5x3 - 4x4 = -4, x1 + 8x2 + 7x3 - 7x4 = -8. Решение. Составим расширенную матрицу 1 2 3 -1 ~ 1 -1 1 2 4 ~ A = 1 5 5 - 4 - 4 = A(0). 1 8 7 - 7 - ( В результате итерации 1, полагая ai(0) = a11) =1, получим матрицу j 1 2 3 -1 ~ 0 - 3 - 2 3 A(1) = 0 3 2 - 3 - 0 6 4 - 6 - ( После итерации 2, полагая ai(1) = a23) = -2, получим матрицу j 1 - 5/ 2 0 7 / 2 ~ 0 3/ 2 1 - 3/ 2 - A(2) = 0 0 0 0 0 0 0 0 Итерация 3. (3) (2) Шаг 1. J = J \ {2} = {3,4}. (3) Шаг 2. J. ( ( Шаг 3. Так как j =1,4,a32) = 0,a42j) = 0, то процесс элементарных j преобразований закончен. ~ Матрица A(2) определяет общее решение системы: x1 = 6 + 5 / 2 x2 + 7 / 2x4, x3 = -2 - 3 / 2x2 + 3 / 2x4, x1, x3 - базисные, x2, x4 - свободные переменные. Получим одно из базисных решений: x1 = 6, x2 = 0, x3 = -2, x4 = 0. в) 2x1 - x2 - 3x3 + 4x4 = 5, 2x1 - x2 + x3 - x4 = 3, 4x1 - 2x2 + 10x3 -12x4 = 2, 4x1 - 2x2 - 2x3 + 3x4 = 2. ~ ~ ~ Решение. Матрицы A(0), A(1), A(2) имеют вид: 2 -1 - 3 4 ~ 2 -1 1 -1 A(0) = 4 - 2 10 -12 2; 4 - 2 - 2 3 8 - 4 0 1 2 -1 1 -1 ~ А(1) = -16 8 0 - 2 - 8 - 4 0 1 0 0 0 0 ~ 10 - 5 1 0 А(2) = 0 0 0 0 - 8 - 4 0 1 Очевидно, что процесс элементарных преобразований следует ( ( закончить, так как a12) = 0; a32) = 0; j =1,4. Из первой (или третьей) j j ~ строки матрицы A(2) следует, что исходная система линейных уравнений несовместна. Действительно, первой строке соответствует уравнение 0xx + 0x2 + 0x3 + 0x4 = 6, которое не может быть удовлетворено ни при каких значениях неизвестных xx; x2; x3; x4. Используя метод Жордана-Гаусса, рассмотрим еще один метод вычисления обратной матрицы A-1. Рассмотрим матричное уравнение AХ = Е, (4.4.5) где A = (аij )n,n,| A | 0, X = (xij )n,n, Е - единичная матрица. Очевидно, что матричное уравнение (4.4.5) имеет единственное решение Х = A-1. Решение матричного уравнения (4.4.5) сводится к решению n систем n линейных уравнений с n неизвестными вида (4.4.6) ai1x1 j + ai2x2 j +... + ain xnj = eij ; i, j =1,n, 1, если i = j, где eij = 0, если i j. Системе линейных уравнений (4.4.6) соответствует расширенная ~(0) ~(0) матрица С = (A Е). Применяя к матрице С алгоритм метода ~(n) Жордана-Гаусса, получим матрицу С = (E B). Покажем, что B = A-1. ~(n) Расширенной матрице С соответствует матричное уравнение EХ = B, ~(n) которое имеет единственное решение Х=В. Матрица С = (E B) ~(0) получена из матрицы С = (A Е) методом Жордана-Гаусса. Поэтому системы линейных уравнений, соответствующие матрицам (E B) и (A Е), равносильны, т.е. имеют одно и то же решение. Отсюда следует, ~(n) что B = A-1, следовательно, С = (E А-1). Таким образом, чтобы для невырожденной матрицы А вычислить ~(0) обратную матрицу A-1, необходимо составить матрицу С = (A Е). ~(0) Методом Жордана-Гаусса в матрице С преобразовать матрицу А к виду единичной матрицы Е, тогда на месте единичной матрицы Е получим обратную матрицу A-1. Пример. Вычислить обратную матрицу A-1 для матрицы 1 3 A = -1 6. 2 6 Решение. Составим матрицу 1 3 4 1 0 ~(0) С = -1 6 8 0 1 0. 2 6 12 0 0 ( На итерации 1, полагая ai(0) = a11) =1, получим j 1 3 4 1 0 ~(1) С = 9 12 1 1 0. 0 0 4 - 2 0 ( На итерации 2, полагая ai(1) = a22) = 9, получим j 1 0 0 2/3 -1/3 ~(2) С = 1 4/ 3 1/ 9 1/9 0. 0 0 4 - 2 0 ( На итерации 3, полагая ai(2) = a33) = 4, получим j 1 0 0 2/3 -1/3 ~(2) С = 1 0 7 / 9 1/9 -1/3, 0 0 1 -1/ 2 0 1/ 2/3 -1/3 откуда А-1 = 7 / 9 1/9 -1/3. -1/ 2 0 1/ 4.5. Однородные системы линейных уравнений Однородной называется система линейных уравнений, свободные члены которой равны нулю: a11x1 + a12x2 +... + a1nxn = 0, a21x1 + a22x2 +... + a2n xn = 0, (4.5.1).......................................... am1x1 + am2x2 +... + amnxn = 0. Очевидно, что система однородных уравнений (4.5.1) всегда совместна, так как имеет нулевое решение x1 = 0, x2 = 0,..., xn = 0. Это следует также из теоремы Кронекера-Капелли: в случае ~ однородной системы r(A) = r(A). При решении системы однородных уравнений можно поставить вопрос: при каком условии однородная система (4.5.1) является неопределенной, т.е. имеет ненулевые решения. Ответ на этот вопрос дает следующая теорема. Теорема. Для того чтобы система (4.5.1) имеет ненулевые решения, необходимо и достаточно, чтобы выполнялось условие r(A) < n. Действительно, если r(A) = n, то система имеет единственное и, значит, только нулевое решение: x1 = 0, x2 = 0,..., xn = 0. Если r(A) < n, то система (4.5.1) является неопределенной (несовместной она быть не может) и, значит, имеет бесчисленное множество решений. Пусть x1 = 1, x2 = 2,..., xn = n - какое-нибудь ненулевое решение однородной системы (4.5.1). Представим это решение как вектор-строку = (1,2,...,n ). Тогда 1 = (11, 12,..., 1n ) тоже, очевидно, будет решением системы (4.5.1). Далее, если = (1, 2,..., n ) какое-то другое решение системы (4.5.1), отличное от, то при любых 1 и 2 линейная комбинация 1 + 2 = (11 + 22, 12 + 22,..., 1n + 2n ) данных решений тоже будет решением системы, так как если ai11 + ai22 +... + ainn = 0, ai11 + ai22 +... + ainn = 0, то и ai1(11 + 21) + ai2(12 + 22) +... + ain (1n + 2n ) = Итак, любая линейная комбинация решений однородной системы (4.5.1) тоже будет ее решением. Определение. Линейно независимая система решений u1,u2,...,uk,k = n - r(A) системы (4.5.1) называется фундаментальной, если каждое решение системы (4.5.1) является линейной комбинацией решений u1,u2,...,uk. Теорема. Если r(A) < n, то система (4.5.1) обладает фундаментальными системами решений. Доказательство. Пусть r(A) = n, r Отсюда следует, что первые r уравнений системы (4.5.1) линейно независимы. Перенеся свободные неизвестные xr+1,..., xn первых r уравнений системы (4.6.1) в правые части, получим систему a11x1 + a12x2 +... + a1r xr = -a1,r +1xr +1 -... - a1nxn, a21x1 + a22x2 +... + a2r xr = -a2,r +1xr +1 -... - a2nxn, (4.5.2)............................................................................... ar1x1 + ar 2x2 +... + arr xr = -ar,r +1xr +1 -... - arnxn. Придавая свободным неизвестным значения xr+1 =1, xr+2 = 0,..., xn = 0, получим соответствующие значения x1 = 1, x2 = 2,..., xr = r первых r неизвестных. Аналогично, придавая свободным неизвестным значения xr+1 = 0, xr+2 =1,..., xn = 0, получим: x1 = 1, x2 = 2,..., xr = r и т.д. В результате будет найдено k=n-r решений системы (4.5.1): u1 = (1,2,...,r,1,0,...,0), u2 = (1,2,...,r,0,1,...,0),...................................... uk = (1,,...,,0,0,...,1). 2 r Решения u1,u2,...,uk линейно независимы, т.к. ранг образованной ими матрицы равен К. Покажем теперь, что каждое решение системы (4.5.1) линейно выражаются через u1,u2,...,uk. Пусть u = (1,2,...,r,r+1,...,n ) - произвольное решение системы (4.5.1). Составим новое решение u0 как следующую линейную комбинацию решений u1,u2,...,uk : u0 = u -r+1u1 -r+2u2 -... -nuk Очевидно, что все элементы, начиная с k-ого элемента, в решении u0 равны нулю, то из однородной системы (4.5.2), определитель которого отличен от нуля, получаем, что и значения всех остальных неизвестных в u0 должны быть равны нулю, т.е. u0 = (0,0,...,0) и тогда u = r+1u1 +... + nuk, т.е. произвольное решение u является линейной комбинацией линейно независимых решений u1,u2,...,uk. Теорема доказана. Рассмотрим систему уравнений a11x1 + a12x2 +... + a1nxn = b1, a21x1 + a22x2 +... + a2nxn = b2, (4.5.3)........................................ am1x1 + am2x2 +... + amnxn = bm. и соответствующую ей систему однородных уравнений a11x1 + a12x2 +... + a1nxn = 0, a21x1 + a22x2 +... + a2nxn = 0, (4.5.4).......................................... am1x1 + am2x2 +... + amn xn = 0. Пусть u1 = (1,2,...,n ) - какое-то решение системы (4.5.3) и u2 = (1, 2,..., n ) любое другое ее решение, отличное от u1. Очевидно, что разность u1 - u2 = (1 - 1,2 - 2,...,n - n ) будет решением системы (4.5.4), и если u3 = (1,,..., ) - 2 n произвольное решение однородной системы (4.5.4), то очевидно, что u1 + u3 = (1 + 1,2 +,...,n + ) 2 n является решением системы (4.5.3). Отсюда следует, что все решения системы (4.5.3) можно получить, прибавляя к одному какому нибудь ее решению всевозможные решения однородной системы (4.5.4). Таким образом, общее решение системы (4.5.3) равно линейной комбинации общего решения однородной системы (4.5.4) и произвольного, но фиксированного решения системы (4.5.3). Если u1,u2,...,uk фундаментальная система решений однородной системы (4.5.4) и u0 - произвольное фиксированное решение системы (4.5.3), то общее решение системы (4.5.3) имеет вид u = u0 + 1u1 + 2u2 +... + кuk, где 1, 2,..., к - произвольные числа. Пример. Найти фундаментальную систему однородной системы уравнений - 2x1 + 2x2 + 5x3 + x4 = 0, 9x1 - 39x2 + 2x3 + 5x4 = 0. Решение. Решаем систему методом Жордана-Гаусса: - 2 2 5 1 0 - 2 2 5 1 ~ ~ A(0) = ; A(1) = ; 9 - 39 3 5 0 19 - 49 - 23 0 0 - 60/19 49/19 1 ~ A(2) = 1 - 49/19 - 23/19 0 0. x1 = 49/19x2 + 23/19x Общее решение имеет вид:. x4 = 60/19x2 + 9/19x Решение u1 получим, придавая свободным неизвестным значения x2 = 1, x3 = 0 : 49 u1 = (,1,0, ), 19 и решение u2 получим, полагая x2 = 0, x3 = 1: 23 u2 = (,0,1,- ). 19 Таким образом, одна из фундаментальных систем решений имеет вид: 49 60 23 u1 = (,1,0, ), u2 = (,0,1,- ). 19 19 19 Общее решение системы можно представить в следующем виде: 49 29 60 u = 1u1 + 2u2 = ( 1 + 2, 1, 2, 1 - 2), 19 19 19 где 1,2 - произвольные числа. Например, полагая 1 =19 и 2 =19, получим одно из частных решений: x1 = 72, x2 = 19, x3 =19, x4 =11. 4.6. Задания для самостоятельной работы по главе 4.1. Решить систему линейных уравнений по правилу Крамера. 2x1 + 2x2 - x3 + x4 = 4x1 + 3x2 - x3 + 2x4 = 8x1 + 5x2 - 3x3 + 4x4 = 3x1 + 3x2 - 2x3 + 2x4 = 4.2. Решить систему линейных уравнений по правилу Крамера. 2x1 + 3x2 +11x3 + 5x4 = x1 + x2 + 5x3 + 2x4 = 2x1 + x2 + 3x3 + 2x4 = - x1 + x2 + 3x3 + 4x4 = - 4.3. Решить систему линейных уравнений по правилу Крамера. 2x1 + 5x2 + 4x3 + x4 = x1 + 3x2 + 2x3 + x4 = 2x1 +10x2 + 9x3 + 7x4 = 3x1 + 8x2 + 9x3 + 2x4 = 4.4. Решить систему линейных уравнений по правилу Крамера. 3x1 + 4x2 + x3 + x4 + 3 = 3x1 + 5x2 + 3x3 + 5x4 + 6 = 6x1 + 8x2 + x3 + 2x4 + 8 = 3x1 + 5x2 + 32x3 + 4x4 + 8 = 4.5. Решить систему линейных уравнений по правилу Крамера. 7x1 + 9x2 + 4x3 + 2x4 - 2 = 2x1 - 2x2 + x3 + x4 - 6 = 5x1 + 6x2 + 3x3 + 2x4 - 3 = 2x1 + 3x2 + x3 + x4 = 4.6. Решить систему линейных уравнений методом Жордана Гаусса. x1 + x2 - 6x3 - 4x4 = 3x1 - x2 - 6x3 - 4x4 = 2x1 + 3x2 + 9x3 + 2x4 = 3x1 + 2x2 + 3x3 + 8x4 = - 4.7. Решить систему линейных уравнений методом Жордана Гаусса. 2x1 - 3x2 + 3x3 + 2x4 - 3 = 6x1 + 9x2 - 2x3 - x4 + 4 = 10x1 + 3x2 - 3x3 - 2x4 - 3 = 8x1 + 6x2 + x3 + 3x4 + 7 = 4.8. Решить систему линейных уравнений методом Жордана Гаусса. x1 + 2x2 + 5x3 + 9x4 = 3x1 +13x2 +18x3 + 30x4 = 2x1 + 4x2 +11x3 +16x4 = x1 + 9x2 + 9x3 + 9x4 = 4.9. Решить систему линейных уравнений методом Жордана Гаусса. x1 + x2 + x3 + x4 + x5 = x1 + 2x2 + 3x3 + 4x4 + 5x5 = x1 + 3x2 + 6x3 +10x4 +15x5 = x1 + 4x2 +10x3 + 20x4 + 35x5 = x1 + 5x2 +15x3 + 35x4 + 70x5 = 4.10. Решить систему линейных уравнений методом Жордана Гаусса. x1 + 2x2 + 3x3 + 4x4 + 5x5 = 2x1 + 3x2 + 7x3 +10x4 +13x5 = 3x1 + 5x2 +11x3 +16x4 + 21x5 = 2x1 - 7x2 + 7x3 + 7x4 + 2x5 = x1 + 4x2 + 5x3 + 3x4 +10x5 = 4.11. Исследовать совместимость и найти общее и одно базисное решение системы линейных уравнений. 2x1 - x2 + 3x3 - 7x4 = 6x1 - 3x2 + x3 -14x4 = 4x1 - 2x2 +14x3 - 31x4 = 4.12. Исследовать совместимость и найти общее и одно базисное решение системы линейных уравнений. x1 + x2 + 3x3 - 2x4 + 3x5 = 2x1 + 2x2 + 4x3 - x4 + 3x5 = 3x1 + 3x2 + 5x3 - 2x4 + 3x5 = 2x1 + 2x2 + 8x3 - 3x4 + 9x5 = 4.13. Исследовать систему и найти общее решение в зависимости от значения параметра. (1+ )x1 + x2 + x3 = 2 + x1 + (1+ )x2 + x3 = 3 + x1 + x2 + (1+ )x3 = 4 + 4.14. Найти общее решение и фундаментальную систему решений для однородной системы уравнений ГЛАВА 5. ВЕКТОРНЫЕ ПРОСТРАНСТВА 5.1. Понятие векторного пространства Определение. Множество R элементов x, y, z,... называется векторным или линейным пространством, если: 1. Любой паре элементов x R и y R однозначно ставится в соответствие элемент z R, называемый суммой x и y и обозначаемый z = x + y ; 2. Каждому элементу x R и любому числу ставится в соответствие элемент z R, называемый произведением элемента x на число и обозначаемый z = x ; 3. Введение операций сложения элементов и умножения элементов на число удовлетворяют следующим аксиомам: I. x + y = y + x ; II. (x + y) + z = x + ( y + z), для любых x, y, z R ; III. существует такой нулевой элемент 0 R, что x + 0 = x, для любого x R ; IV. для каждого элемента x R существует такой элемент (-x) (называемый противоположным к x ), что x + (-x) = 0 ; V. 1 x = x ; VI. (x) = ( )x, для любого x R и любых чисел, ; VII. ( + )x = x + x, для любого x R и любых чисел, ; VIII. (x + y) = x + y, для любых x и y из R и любого числа ; Элементы векторного пространства называются векторами. Если в пространстве R определено умножение его элементов на вещественные числа, то R называется вещественным векторным пространством. Если элементы из R можно умножать на комплексные числа, то R называется комплексным векторным пространством. Из аксиом I - VIII непосредственно вытекают следующие свойства векторного пространства: 1. Единственность нулевого вектора. Предположим, что в пространстве R имеются два нулевых вектора 01 и 02. Тогда, так как для любого x R имеем x + 01 = x и x + 02 = x, то, в частности, полагая x = 02, получаем 02 + 01 = 02 и, полагая x = 01, получаем 01 + 02 = 01. Ввиду равенства 01 + 02 = 02 + 01 получаем 01 = 02. 2. Единственность противоположного вектора. Предположим, что у вектора x имеются два противоположных вектора x' и x''. Тогда x + x'= 0 и x + x''= 0. Следовательно, x'+x + x''= x'+(x + x'') = x + 0 = x', и x'+x + x''= (x'+x) + x''= 0 + x''= x'', откуда x'= x''. 3. Для каждого вектора x R 0 x = 0. Действительно, для каждого x имеем 0 x = (0 + 0)x = 0 x + 0 x. Прибавляя к левой и правой частям последнего равенства (-0 x), получим 0 x - 0 x = 0 x + 0 x - 0 x, или 0 = 0 x. 4. Для любого числа и 0 R 0 = 0. Действительно, 0 = (0 + 0) = 0 + 0. Прибавляя к левой и правой частям равенства (-0), получим 0 = 0. 5. Если произведение x = 0, то либо = 0, либо x = 0. В самом 1 1 x деле, пусть 0, тогда x =1 x = = (x) = 0 = 0. Приведем следующие примеры некоторых векторных пространств. 1. Множество всех вещественных чисел с обычными операциями сложения и умножения. Данное множество является векторным пространством, если числовой множитель является элементом множества рациональных или вещественных чисел. Если числовой множитель есть элемент множества комплексных чисел, то данное множество не образует векторного пространства, так как произведение действительного числа на комплексное число в общем случае есть комплексное число. 2. Множество всех рациональных чисел образует здесь векторное пространство, если числовой множитель есть рациональное число. Если числовой множитель является вещественным или комплексным числом, то это множество векторного пространства не образует. 3. Рассмотрим множество элементов, каждый из которых является упорядоченной последовательностью из действительных чисел. Элементы этого множества будем называть векторами и обозначать 1 x =, y = M M n n Операции сложения векторов и умножения вектора на число вводятся следующим образом: 1 + 1 +. x + y =, x = L L + n n n Введенные операции удовлетворяют всем аксиомам I - VIII векторного пространства. Значит, это множество является векторным пространством, которое обозначим Rn. Очевидно, что нулевой вектор из Rn имеет вид: 0 = (0,0,...,0)T. 4. Множество всех многочленов степени, не превосходящей n, с обычными для многочленов операциями сложения и умножения на число. В этом пространстве вектор x имеет вид: x = A0tn + A1tn-1 +... + An, где А0,А1,Е,An - произвольные числа, t - переменная. Данное множество является векторным пространством. Пусть множество R образует некоторое векторное пространство. Тогда всякое подмножество R1 множества R, элементы которого также образуют векторное пространство с теми же самыми операциями сложения и умножения на число, что и в R, называется подпространством векторного пространства R. Для того чтобы подмножество R1 множества R было подпространством векторного пространства, необходимо и достаточно, чтобы выполнялись условия: 1) если x R1 и y R1, то x + y R 2) если x R1 и - любое число, то x R1. Необходимость следует из того, что эти условия должны выполняться для любого векторного пространства. Для доказательства достаточности надо показать, что выполняются все восемь аксиом векторного пространства. Справедливость аксиом I, II, V - VIII очевидна. Докажем выполняемость аксиомы III. Так как по условию, если x R1, то x R при любом, то, полагая =0, получим 0 x = 0 R1. Но x + 0 = x R и, следовательно, аксиома III верна. Для доказательства аксиомы IV положим = -1. Так как x R1, то (-1)x R1, a (-1)x есть вектор, противоположный вектору x. Следовательно, подмножество R1 вместе с вектором x содержит и противоположный ему элемент, что и доказывает выполнимость аксиомы IV. 5.2. Линейная зависимость и независимость векторов Важную роль в дальнейшем изложении будет играть понятие линейной зависимости и независимости векторов. Определение. Пусть R - векторное пространство. Векторы a1, a2,..., ak называются линейно зависимыми, если существуют такие числа 1, 2,..., k, не равные одновременно нулю, что 1a1 + 2a2 +... + kak = (5.2.1) Векторы, не являющиеся линейно зависимыми называются линейно независимыми. Другими словами, векторы a1, a2,..., ak называются линейно независимыми, если равенство (5.2.1) выполняется, тогда и только тогда, когда 1 = 0,2 = 0,Е,k = 0. Пусть векторы a1, a2,..., ak линейно зависимы, т.е. пусть в соотношении (5.2.1) хотя бы один из коэффициентов, например, отличен от нуля. Тогда 1a1 = -2a2 - 3a3 -... - kak и, разделив на 1 0 и положив 2 3 k 2 = -,3 = -,Е,k = -, 1 1 получим a1 = 2a2 + 3a3 +... + kak (5.2.2) Если вектор a1 выражается через векторы a2, a3,..., ak в виде (5.2.2), то говорят, что a1 есть линейная комбинации векторов a2, a3,..., ak. Таким образом, если векторы a1, a2,..., ak линейно зависимы, то хотя бы один из них является линейной комбинацией остальных. Верно и обратное утверждение: векторы, один из которых есть линейная комбинация остальных, линейно зависимы. На прямой любые два вектора пропорциональны, т.е. линейно зависимы. На плоскости можно найти два линейно независимых вектора, но всякие три вектора линейно зависимы. Если R - совокупность векторов трехмерного пространства, то три линейно независимых вектора в R можно найти, но всякие четыре вектора линейно зависимы. Из приведенных примеров мы видим, что максимальное число линейно независимых векторов на прямой, плоскости, в трехмерном пространстве совпадает с тем, что в аналитической геометрии принято называть размерностью прямой, плоскости, пространства. Введем определение размерности векторного пространства. Определение. Векторное пространство R называется n-мерным, если в нем существует n линейно независимых векторов, но больше чем n линейно независимых векторов оно не содержит. Векторное пространство размерности n обозначается Rn. Если в пространстве R можно найти любое число линейно независимых векторов, то R называется бесконечномерным. Бесконечномерные пространства составляют предмет специального изучения. В линейной алгебре изучаются только конечномерные пространства. 5.3. Базис векторного пространства Определение. Совокупность n линейно независимых векторов a1, a2,..., an пространства Rn называется его базисом. Согласно определению n мерного векторного пространства Rn в нем существует n линейно независимых векторов, т.е. существует базис. Теорема. Каждый вектор x векторного пространства можно представить, и притом единственным образом как линейную комбинацию векторов базиса. Доказательство. Пусть, векторы a1, a2,..., an образуют базис в Rn. Присоединим к ним произвольный вектор y из Rn. Так как каждая система из (n+1) векторов пространства Rn линейно зависима, то линейно зависима и система x, a1, a2,..., an, т.е. существуют такие не равные одновременно нулю числа 0, 1, 2,...,n что 0x + 1a1 + 2a2 +... + nan = (5.3.1) При этом 0 0, так как иначе из формулы (5.3.1) следовала бы линейная зависимость векторов a1, a2,..., an. Выражая из (5.3.1) вектор x, получим 1 2 n x = - a1 - a2 -... - an 0 0 i Полагая xi = -, i = 1, n, будем иметь x = x1a1 + x2a2 +... + xnan Данное представление вектора x через векторы a1, a2,..., an единственно, так как если x = x1a1 +... + xnan и x = x1a1 +... + xnan, то (x1 - x1)a1 +... + (xn - xn )an = 0. Ввиду линейной независимости векторов a1, a2,..., an, x1 - x1 = 0,..., xn - xn = 0, откуда x1 = x1,..., xn = xn. Таким образом, если в n-мерном векторном пространстве Rn задан базис a1, a2,..., an, то, используя выражение x = x1a1 +... + xnan можно установить взаимно однозначное соответствие между векторами этого пространства и упорядоченными последовательностями из n чисел x1, x2,..., xn. Числа x1, x2,..., xn будем называть координатами вектора x в базисе a1, a2,..., an и будем писать x = (x1, x2,..., xn )T. Из приведенной n n теоремы следует, что два вектора x = xiai и y = yiai в Rn равны i =1 i= тогда и только тогда, когда их координаты в базисе a1, a2,..., an равны, т.е. когда x1 = y1, x2 = y2,..., xn = yn. Рассмотрим действия над векторами в координатной форме. Пусть в пространстве Rn задан базис a1, a2,..., an. Так как любой вектор из Rn можно представить, и притом единственным образом, в виде линейной комбинации базисных векторов, т.е. x = x1a1 + x2a2 +... + xnan y = y1a1 + y2a2 +... + ynan, то на основании аксиом, которым удовлетворяют операции сложения и умножения на число, имеем x + y = (x1a1 +... + xnan ) + ( y1a1 +... + ynan ) = (x1 + y1)a1 +... + (xn + yn )an, x = (x1a1 + x2a2 +... + xnan ) = x1a1 + x2a2 +... + xnan. Отсюда следует, что если векторы пространства Rn, заданы своими координатами относительно некоторого базиса a1, a2,..., an, то при сложении векторов или умножении их на число координаты векторов соответственно складываются или умножаются на. Таким образом, x + y = (x1 + y1, x2 + y2,..., xn + yn )T, x = (x1, x2,..., xn )T и если y = 1x1 + 2x2 +... + nxn где x1 = (x11, x12,..., x1n ), x2 = (x21, x22,..., x2n ), ЕЕЕЕЕЕЕЕ. xm = (xm1, xm2,..., xmn ), y = ( y1, y2,..., yn ), то y1 = 1x11 + 2x21 +... + mxm1, y2 = 1x12 + 2x22 +... + mxm2, ЕЕЕЕЕЕЕЕЕЕЕЕ.. yn = 1x1n + 2x2n +... + mxmn. У нулевого вектора 0 все координата равны нулю, так как из равенства 1a1 + 2a2 +... + nan = 0 ввиду линейной независимости векторов a1, a2,..., an, вытекает, что 1 = 2 =... = n = 0. Вектор, противоположный к x = (x1, x2,..., xn )T равен (-x1,-x2,...,-xn )T так как (x1, x2,..., xn )T + (-x1,-x2,...,-xn )T = (0,0,...,0)T = 0. Примеры. I. Для случая трехмерного пространства R3 определение координат вектора совпадает с имеющимся в аналитической геометрии определением координат вектора в некоторой системе координат. II. Пусть Rn - пространство, векторами которого являются упорядоченные системы x = (1,2,...,n )T из n чисел. Очевидно, что n векторов е = (1,0,.....,0)Т, е = (0,1,.....,0)Т, ЕЕЕЕЕЕ.. е = (0,0,.....,1)Т, n образуют базис этого пространства. Найдем координаты 1,2,......,n вектора x в этом базисе: х = (1,2,...,n ) = 1(1,0,...,0) + 2(0,1,...,0) +... + n (0,0,...,1) = = 1e + 2e +... + n e 1 2 n Отсюда следует, что числа 1,2,......,n можно рассматривать как координаты вектора х = (1,2,...,n )Т в базисе е,е,....,е пространства 1 2 n Rn. III. Rn - пространство, векторами которого являются многочлены степени меньшей либо равной ( n -1). Простейшим базисом является совокупность векторов e1 = 1, e2 = t, en = tn-1. Тогда координатами многочлена P(t) = a0tn-1 + a1tn-2 +... + an-1 в этом базисе являются его коэффициенты an-1,an-2,...a1,a0. Выберем другой базис: ' ' ' ' e1 =1,e2 = t - a,e3 = (t - a)2,...,en = (t - a)n-1. Каждый многочлен по формуле Тейлора может быть представлен в виде P(t) = P(a) + P'(a)(t - a) + P(n-1) (a)(t - a)n-1. Таким образом, в этом (n -1)! P(n-1) (a) базисе P(t) имеет координаты P(a), P'(a),.... (n -1)! 5.4. Изоморфизм векторных пространств Определение. Векторные пространства R и RТ называются изоморфными, если между их векторами-элементами можно установить взаимно однозначное соответствие такое, что если x x и y y, где x, y R, x, y R, то x + y x + y и x x. Из определения изоморфизма следует, что если x, y,... - векторы из R, a x, y,... - вектора из R', то равенство x + y +... = 0 равносильно равенству x + y +... = 0. Следовательно, линейно независимым векторам из R соответствуют линейно независимые векторы из R' и обратно. Пространства различной размерности не могут быть между собой изоморфны. В самом деле, пусть R и R' изоморфны. Тогда максимальное число линейно независимых векторов в R и R' одно и то же, т.е. размерности пространств R и R' равны. Все пространства, имеющие одну и ту же размерность n, изоморфны между собой. 5.5. Преобразование координат при изменении базиса Пусть e1,e2,...,en и e1,e2,...,en - два базиса пространства Rn. Каждый вектор ei, i = 1, n можно выразить через векторы ei, i = 1, n: e1 = a11e1 + a21e2 +... + an1en, e2 = a12e1 + a22e2 +... + an2en (5.5.1) ЕЕЕЕЕЕЕЕЕЕЕЕ en = a1ne1 + a1ne2 +... + annen Выражения (5.5.1) показывают, что новые базисные векторы ei получаются из старых базисных векторов ei с помощью матрицы: a11 a12 L a1n a a22 L a2n AT =, L L L L an1 an2 L an причем коэффициенты их разложений по старым базисным векторам образуют столбцы этой матрица. Матрица А называется матрицей перехода от базиса ei к базису ei. Определитель матрицы А отличен от нуля, так как в противном случае ее столбцы, а следовательно, и векторы e1,e2,...,en были бы линейно зависимы. Рассмотрим, как связаны между собой координаты одного и того же вектора x в старом и новом базисах. Пусть x = x1e1 + x2e2 +... + xnen (5.5.2) и в то же время x = x1e1 + x2e2 +... + xnen (5.5.3) Подставим в (5.5.3) вместо ei их выражения из (5.5.1): n n n n x = x ei = a e a x (5.5.4) j ij i ij j j =1 i=1 i =1 j = Из (5.5.2) и (5.5.4) в силу единственности разложения вектора x по базису e1,e2,...,en получаем n xi = x, i = 1, n, a ij j j= или в матричном виде X=AX', (5.5.5) где X = (x1, x2,..., xn )T, X = (x1, x2,..., xn )T. Уравнение (5.5.5.) показывает связь между координатами хj и x'j вектора x в базиcах ei и ei, i = 1, n. Из (5.5.5.) получаем: X'=А-1Х Таким образом, при переходе от базиса e1,e2,...,en к базису e1,e2,...,en координаты вектора x преобразуются с помощью матрицы А, являющейся обратной к транспонированной матрице, задающей преобразование базисов. Пример. В базисе e1 = (1,0,0)Т, e2 = (0,1,0)Т, e3 = (0,0,1)Т пространства R3 заданы векторы a1 = (1,2,-1)Т, a2 = (3,1,2)Т, a3 = (2,4,0)Т, b = (0,-5,5)Т. Показать, что векторы a1, a2, a3 образует базис. Найти координаты вектора b в базисе a1, a2, a3. Выразить связь между базисами e1,e2,...,en и a1, a2, a3. Решение. Векторы a1, a2, a3 образуют базис пространства R3, если они линейно независимы. Векторы a1, a2, a3 линейно независимы если векторное равенство 1a1 + 2a1 + 3a3 = 0 выполняется тогда и только тогда, когда 1 = 0, 2 = 0, 3 = 0. Найдем решение векторного равенства 1 3 2 1 2 + 21 + 34 = 2 0 -1 методом Жордана-Гаусса. (1) 3 2 0 1 3 2 ~ ~ A(0) = 2 1 4 0 A(1) = (5) 0 0 5 2 -1 2 0 1 0 2 0 1 0 0 ~ ~ A(2) = 1 0 0 A(3) = 1 0 0 0 0 (1) 0 0 0 1 откуда 1 = 2 = 3 = 0. Система векторов a1,a2, a3 линейно независима и, следовательно, образует базис в R3. Выразим каждый вектор ai через векторы ei : a1 = e1 + 2e2 - e a2 = 3e1 + e2 + 2e a3 = 2e1 + 4e Матрица А перехода от базиса e1,e2,...,en к базису a1, a2, a3 имеет вид: 1 3 A = 2 1 4. -1 2 Вычислив 4 - - 5 2 A-1 = - 0, 5 1 1 - 2 2 определим координаты (x1, x2, x3) вектора x в новом базисе 4 - - 5 - 2 x = A-1b = A-1 = - 0 - 5 = 1. 5 5 1 1 - 2 2 Таким образом, в базисе a1, a2, a3 вектор b определяется координатами x1 = -3, x2 = 1, x3 = 0. Связь между базисом e1,e2,...,en и базисом a1, a2, a3 определяется из следующих соотношений: e1 = x11a1 + x21a2 + x31a3, e2 = x12a1 + x22a2 + x32a3, e3 = x13a1 + x23a2 + x33a3, или в матричном виде: E=XA, где x11 x12 x X = x21 x22 x23. x31 x32 x Решение данного матричного уравнения имеет вид X=A-1, откуда получаем 4 2 e1 = a1 + a2 - a3, 5 5 2 1 e2 = - a1 - a2 + a3, 5 5 e3 = -a1 + a3, Данные соотношения выражают связь между базисами. 5.6. Евклидово пространство n -мерное векторное пространство Еn называется евклидовым, если каждой паре векторов x и y из Е поставлено в соответствие вещественное число ( x, y ), называемое скалярным произведением, при чем это соответствие удовлетворяет следующим аксиомам: I. Линейности по первому аргументу (c1x + c2 y, z)= c1(x, z)+ c2(y, z); II. Симметрии (x, y)= (y, z); III. Положительной определенности (x, x)> 0, при x и (x, x)= 0 тогда и только тогда, когда x = 0. Из линейности по первому аргументу и симметрии следует и линейность по второму аргументу (x,c1y + c2z)= c1(x, y)+ c2(x, z) Примеры. 1. Векторами пространства En является любая упорядоченная система n действительных чисел x = (1,2,...,n ). Сложение векторов и умножение их на число определены в п.5.1, а скалярное произведение векторов x = (1,2,...,n)T и y = (1, 2,..., n)T определим формулой (x, y)= 11 + 22 +... + nn. Легко убедиться в том, что аксиомы I-III действительно выполняются. 2. Рассмотрим более общий случай. Вектор x En по-прежнему определим как упорядоченную совокупность n действительных чисел. Сложение векторов и умножение их на число определим так же, как в примере 1. Зададимся некоторой квадратной матрицей А=(aij)n,n, Скалярное произведение векторов x и y определим формулой (x, y)= a1111 + a1212 +... + a1n1n + + a2121 + a2222 +... + a2n2n +...+ (5.6.1) + an1n1 + an2n2 +... + annnn Рассмотрим, каким условиям должна удовлетворять матрица А, чтобы определенное данной формулой скалярное произведение удовлетворяло бы аксиомам I-Ш. Непосредственной проверкой можно убедиться в том, что аксиома I выполняется для любой матрицы А=(aij)n,n. Для того, чтобы была выполнена аксиома II, т.е. чтобы выражение (x, y) было симметричным относительно x и y, необходимо и достаточно, чтобы aij = a, т.е. ji чтобы матрица А=(aij)n,n, была симметричной. Аксиома III требует, чтобы выражение n (x, x)= i a (5.6.2) ij j i, j = было неотрицательно для любых 1,2,...,n и обращалось в нуль лишь если 1 = 0,2 = 0,...,n = 0. Однородный многочлен (квадратичная форма), определяемый формулой (5.6.2), называется положительно определенным, если он принимает неотрицательные значения и обращается в нуль, только тогда, когда все i равны нулю. Следовательно, аксиома III требует, чтобы квадратичная форма (5.6.2) была положительно определенной. Таким образом, всякая матрица А=(aij)n,n задает скалярное произведение в Еn, определяемое формулой (5.6.1), если только эта матрица симметричная и соответствующая ей квадратичная форма положительно определенная. Если а качестве матрицы А=(aij)n,n взять единичную матрицу Е, т.е. положить aii=1, а aij=0 (i j), то скалярное произведение принимает вид n (x, y)= i i i = и мы получаем евклидово пространство, определенное в примере 1. 3. Векторами пространства Еn будем называть непрерывные функции, заданные на интервале (а,b). Скалярное произведение таких функций определим как интеграл их произведения b f (t)g(t)dt. a Можно проверить, что при таком определении скалярного произведения аксиомы I-III выполнены. С помощью введенного понятия скалярного произведения определим длину вектора и угол между векторами. Определение. Нормой (длиной) x вектора x в Еn называется корень квадратный из этого скалярного произведения: x = (x, x). Векторы x и y, скалярное произведение (x, y) которых равно нулю, называются ортогональными. В любом евклидовом пространстве Еn верна "теорема Пифагора": если x и y ортогональны, то 2 2 x + y = x + y. Определение. Угол между ненулевыми векторами x и y определяется равенством (x, y) cos =. x y Можно доказать, что в любом пространстве Еn справедливо неравенство Коши-Буняковского: 2 (x, y)2 x y, откуда следует, что (x, y) 2 x y или, что то же самое, (x, y) -1 2 x y Это означает, что косинус угла между векторами из Еn по модулю, не превосходит единицы. Если x и y - ненулевые векторы из Еn, то ортогональность означает, что угол между ними равен. Ненулевой вектор x пространства Еn, называется нормированным если его норма равна единице. Любой ненулевой вектор можно умножить на некоторое число так, что в результате получится нормированный вектор. Действительно, пусть x En - ненулевой вектор. Тогда (x,x)= (x, x) и достаточно взять таким, чтобы 1 = = (x, x) x Число называется нормирующим множителем для вектора x. Определение. Система векторов a1, a2,..., ak пространства Еn называется ортогональной, если векторы этой системы попарно ортогональны. Система векторов a1, a2,..., ak называется ортонормированной, если векторы этой системы попарно ортогональны и имеют норму, равную единице, т.е. если 1, при i = j (ai, a )= i, j = 1, k. j 0, при i j Теорема. Ортогональная система ненулевых векторов пространства Еn линейно независима. Доказательство. Пусть ненулевые векторы a1, a2,..., ak попарно ортогональны. Тогда (ai, a )= 0 при i j. j Покажем, что векторное равенство 1a1 + 2a2 +... + kak = (5.6.3) выполняется тогда и только тогда, когда 1 = 2 =... = k = 0. Умножим обе части равенства (5.6.3) скалярно на a1. Получим 1(a1,a1) + 2(a1, a2) +... + k (a1, ak ) = из условия ортогональности векторов имеем (a1, a1) 0, (a1, a )= 0, j = 2, k. j Следовательно, 1 = 0. Аналогично, умножая (5.6.3) на a2, получим что 2 = 0 и т.д. Таким образом, мы доказали, что a1, a2,..., ak линейно независимы. Рассмотрим процесс ортогонализации векторов. Он состоит в том, что из заданных линейно независимых векторов a1, a2,..., am (m n) строятся m попарно ортогональных векторов b1,b2,...,bm. Положим b1 = a1. Вектор b2 будем искать в виде b2 = a2 + 21b1. Число 21 следует подобрать так, чтобы векторы b1 и b2 были ортогональны, т.е. (b2, a1) (b2 + 21b1, a1) = 0, откуда 21 = (a1, a1). Допустим теперь, что попарно ортогональные и отличные от нуля векторы b1,b2,...,bm-1 уже построены. Вектор bm ищем в виде: bm = am + m1b1 +... + m,m-1bm-1, т.е. вектор bm мы получаем из вектора am "исправлением" его с помощью линейной комбинации уже построенных векторов b1,b2,...,bm-1. Коэффициенты m1,m2,...,m,m-1 находим из условия ортогональности вектора bm к векторам b1,b2,...,bm-1: (am + m1b1 +... + m,m-1bm-1,b1)= (am + m1b1 +...+ m,m-1bm-1,b2)= (5.6.4)............................................... (am + m1b1 +... + m,m-1bm-1,bm-1)= Так как векторы b1,b2,...,bm-1 попарно ортогональны, то из равенств (5.6.4) получаем (am,b1)+ m1(b1,b1)= 0, (am,b2)+ m2(b2,b2)= 0, ЕЕЕЕЕЕЕЕЕЕЕ (am,bm-1)+ m,m-1(bm-1,bm-1)= 0, откуда (am,b1), = - (am,b2),..., = - (am,bm-1) m1 = m2 m,m- (b1,b1) (b2,b2) (bm-1,bm-1). Докажем теперь, что построенный вектор bm отличен от нуля. Вектор bm есть линейная комбинация векторов b1,b2,...,bm, am. Но вектор bm-1 можно заменить линейной комбинацией вектора am-1 и векторов b1,b2,...,bm-2 и т.д. Окончательно мы получаем, что вектор bm записывается в виде bm = c1a1 + c2a2 +... + cm-1am-1 + am (5.6.5) откуда следует, что bm 0. Действительно, в противном случае левая часть равенства (5.6.5) была бы равна 0, что противоречит линейной независимости векторов a1, a2,..., am (коэффициент при am равен единице). Таким образом, доказано, что am 0. По векторам b1,b2,...,bm-1 и am построен вектор bm. Таким же образом, по векторам b1,b2,...,bm, am+1, можно построить вектор bm+1. Продолжая этот процесс, можно по заданной системе n линейно независимых векторов в Еn построить систему n ненулевых ортогональных векторов. Докажем следующую теорему. Теорема. Во всяком евклидовом пространстве Еn существуют ортонормированные базисы. Доказательство. По определению n-мерного векторного пространства в нем существует некоторый базис a1, a2,..., an. С помощью процесса ортогонализации из него можно построить ортогональный базис b1,b2,...,bn. Если теперь каждый вектор bi,i = 1, n разделить на его норму, то получится ортонормированный базис, образованный b1 b2 bn векторами,,...,. b1 b2 bn Найдем выражение скалярного произведения в координатах. Пусть е1,е2,...,еn произвольный базис пространства Еn и x = x1e1 + x2e2 +... + xnen, y = y1e1 + y2e2 +... + ynen. Тогда n n n n (x, y)= xiei, ykek = xi yk(ei,ek ). i=1 k =1 i=1 k = Если е1,е2,...,еn - нормированный базис, то (ei,ek )= 0, при i k, (ei,ei) 0, при i = 1, n а, значит (x, y)= x1y1 + x2 y2 +... + xn yn. И обратно, если в базисе е1,е2,...,еn скалярное произведение векторов x = x1e1 + x2e2 +... + xnen и y = y1e1 + y2e2 +... + ynen равно x1y1 + x2 y2 +... + xn yn, то этот базис ортонормированный, так как в этом случае (ei,ei) 0, при i = 1, n и (ei,ek )= 0, при i k. Если в 2 2 некотором базисе скалярное произведение (x, x)= x1 + x2 +... + xn, то этот базис ортонормированный. Пусть е1,е2,...,еn - ортонормированный базис в Еn и x = x1e1 + x2e2 +... + xnen. Умножив обе части последнего равенства скалярно на ei получим (x,ei )= xi, т.е. i-я координата вектора x в ортонормированном базисе равна скалярному произведению x на единичный вектор ei. Это скалярное произведение называется ортогональной проекцией вектора x на вектор ei. Таким образом, координаты вектора в ортонормированном базисе - это его проекции на базисные векторы. Определим в пространстве Еn расстояние между векторами. Расстояние (x, y) между векторами x и y определяется как норма вектора (x - y): (x - y)= (x - y) = ((x - y),(x - y)) = (x, x)- 2(x, y)+ (y, y). Из определения расстояния следует, что 1) (x, y)= (y, x); 2) (x, y)> 0, при x y ; 3) (x, y)= 0, при x = y ; 4) (x, z) (x, y)+ (y, z) для любых x, y, z из En. Пример. По заданной в En системе линейно независимых векторов a1 = (2,4,0)T, a2 = (3,1,2)T, a3 = (1,2,-1)T построить ортонормированный базис. Решение. Полагаем b1 = a1 = (2,4,0)T. Вектор b2 будем находить в виде: b2 = a2 + 21b1, где коэффициент (a2,b1) 3 2 + 4 1+ 2 0 21 = - = - = -. (b1,b1) 22 + 42 + Тогда b2 = (2,-1,2)T. Находим вектор b3 = a3 + 31b1 + 32b2. (a3,b1) 1 (a3,b2) 31 = - = -,32 = - = (b1,b1) 2 (b2,b2) T 4 2 b3 =,,. 9 9 Находим нормы векторов b1,b2,b3. b1 = 2 5 b2 = 3 b3 = Нормируем векторы b1,b2,b3. Получим ортонормированный базис: 1 1 b1 = (1,2,0)T ; b2 = (2,-1,2)T ; b3 = (4,-2,-5)T. 5 3 5.7. Ортогональные преобразования Рассмотрим свойства матрицы перехода от одного ортонормированного базиса к другому ортонормированному базису в пространстве En. Введем понятие ортогональной матрицы. Определение. Матрица Т с вещественными элементами называется - ортогональной, если T = T т.е. TT = T T = E. Из определения следует, что ортогональная матрица всегда невырожденная, так как TT = T T = E = 1 и T = T, то T = 1. Основные свойства ортогональной матрицы. 1. Матрица, обратная ортогональной, также ортогональна. - Пусть Т - ортогональная матрица, т.е. T = T. Тогда -1 - -1 -1 -1 -1 - (T ) = (T ) = T = (T ), т.е. (T ) = (T ). Значит, матрица T - ортогональна. 2. Матрица T = (tij) ортогональна тогда и только тогда, когда ее n,n элементы удовлетворяют равенствам n n t t, при i j, t2 = 1. ik jk ik k =1 k = Линейное преобразование Y=ТХ с ортогональной матрицей Т называется ортогональным. Так как T = 1, то ортогональное преобразование всегда невырожденное. Теорема. Ортогональное преобразование координат не изменяет скалярного произведения векторов. ~ Доказательство. Рассмотрим линейный оператор T, соответствующий матрице Т, и два произвольных вектора x и y из En. ~ ~ Их образы обозначим через x1 и y1, т.е. x1 = T (x), y1 = T (y). Тогда (x, y)= x y, (x1, y1)= (Tx)Ty = x T Ty = x Ey = x y. ~ ~ Поэтому (x1, y1)= (T (x),T (y))= (x, y). Следствие 1. Ортогональное преобразование не меняет норм векторов и углов между векторами. Следствие 2. Ортогональное преобразование переводит ортонормированный базис в ортонормированный. Следствие 3. Матрица Т перехода от одного ортонормированного базиса к другому ортонормированному базису является ортогональной. Следствие 4. Матрица Т, приводящая симметричную матрицу А к диагональному виду, является ортогональной. 5.8. Выпуклые множества Рассмотрим совместную систему линейных уравнений n a xj = bj, i =1, m, (5.8.1) ij j = у которой ранг r матрицы A = (aij )n,m меньше n, и пусть k=n-r. Определение. Множество точек x = (x1, x2,..., xn)T из En, координаты которых удовлетворяют системе уравнений (5.8.1), называется k-мерной плоскостью. Одномерные плоскости называются прямыми, а (n-1)-мерные плоскости - гиперплоскостями. Очевидно, что каждую гиперплоскость можно задать всего одним линейным уравнением: a1x1 + a2x2 +... + anxn = b. В трехмерном пространстве E3 гиперплоскости - это обычные плоскости, а в E2 - это прямые. Определение. Отрезком [x1, x2] в En, соединяющим точки x1 и x2, называется множество таких точек x, что x = 1x1 + 2x2, 1 0, 2 0, 1 + 2 = 1. Точки x1 и x2 называются концами отрезка [x1, x2]. Определение. Множество Х пространства En называется выпуклым, если вместе с любыми двумя точками x1 X и x2 X ему принадлежит и соединяющих их отрезок [x1, x2]. Выпуклость множества Х означает, что из x, y X следует z = x + (1-)y X для всех 0 1. Например, в E2 выпуклый отрезок, полупрямая, круг, треугольник, полуплоскость и вся плоскость. Определение. Множество Х точек пространства En называется ограниченным, если координаты всех его точек x = (x1, x2,..., xn )T в некотором базисе ограничены. Пусть в пространстве задана гиперплоскость a1x1 + a2x2 +...+ anxn = b. Все точки из En разбиваются этой гиперплоскостью на два полупространства: X1 - множество точек, для которых a1x1 + a2x2 +... + anxn b и X2 - множество точек, для которых a1x1 + a2x2 +... + anxn b. Теорема. Каждое полупространство пространства En является выпуклым множеством. Доказательство. Пусть точки a = (1,2,...,n) и b = (1, 2,..., n) из En принадлежат, например, полупространству X1. Тогда a11 + a22 +... + ann b a11 + a22 +... + ann b Если x = (x1, x2,..., xn)T - произвольная точка отрезка [a,b], то xi = 1i + 2i, i = 1, n, где 1,2 0, 1 + 2 =1. Для этой точки x имеем: a1x1 + a2x2 +... + anxn = a1(11 + 21)+ a2(12 + 22)+... + an(1n + 2n)= = 1(a11 + a22 +... + ann)+ 2(a11 + a22 +... + ann) 1b + 2b = (1 + 2)b = b т.е. произвольная точка x отрезка [a,b] принадлежит X1. Теорема доказана. Теорема. Пересечение любого числа выпуклых множеств есть множество выпуклое. Доказательство. Пусть X1, X,..., Xk - выпуклые множества в En. Если X = X1 X2... Xk состоит из одной точки, то оно выпукло. Если более чем из одной, то пусть x1 и x2 - любые две из них. Тогда x1 Xi и x2 Xi, i = 1,k и, так как все множества Xi выпуклы, то [x1, x2] Xi, i =1, k и, следовательно, [x1, x2] X, что и требовалось доказать. Из данной теоремы следует, что гиперплоскость как пересечение выпуклых множеств X1 и X2, является выпуклым множеством. Каждая k-мерная плоскость в En также выпукла. Пусть в En даны m полупространств, определяемых неравенствами ai1x1 + ai2x2 +...+ ainxn bi, i =1, m. (5.8.2) Пересечение этих полупространств, называемое выпуклой многогранной областью, определяет множество решений системы линейных неравенств (5.8.2). Если это пересечение ограничено, оно называется выпуклым многогранником в En. Определение. Последовательность {xm} точек в En сходится к точке x при m, если lim xm - x = 0. m Множество N (x)= {y : y - x b} называется окрестностью точки x En. Определение. Множество X En называется замкнутым, если оно содержит все свои предельные точки. Определение. Точка x X из En называется внутренней точкой множества Х, если существует такая ее -окрестность, все точки которой принадлежат множеству Х. Определение. Точка x X из En называется граничной точкой множества Х, если любая ее -окрестность содержит как точки, принадлежащие множеству Х, так и точки, ему не принадлежащие. Множество, состоящее из всех граничных точек множества Х, называется границей множества Х. Определение. Точка x X называется крайней точкой (вершиной), если в Х не существует точек x1, x2, x1 x2, что x = x1 + (1- )x2, 0 < 1. Для круга любая точка ограничивающей его окружности является крайней. Крайними точками являются все вершины выпуклого многогранника. Определение. Точка x называется выпуклой комбинацией точек x1, x2,..., xn, если существуют такие числа i 0, i =1, m, что x = 1x1 + 2x2 +... + mxm при условии 1 + 2 +... + m = 1. Например, любая внутренняя точка круга является выпуклой комбинацией концов хорды, проходящей через эту точку. Теорема (о представлении). Любая точка x выпуклого замкнутого, ограниченного множества X En может быть представлена в виде выпуклой комбинации конечного числа крайних точек этого множества. Пример. Используя теорему о представлении, выразить точку x = (6, 3)T в виде выпуклой комбинации крайних точек множества X E2, заданного системой неравенств - 4x1 + 7x2 6x1 - x2 x1 + 3x2 Решение. Очевидно, что множество Х выпукло. Множество Х (рис.5.1) (x ) gx ( ) (x ) 0 1 2 3 4 5 6 7 8 9 представляет собой треугольник с вершинами x1 = (2, 3)T x2 = (9, 7)T x3 = (8, 1)T. На основании теоремы о представлении точку x = (6, 3)T можно представить в виде следующей выпуклой комбинации: x = 1x1 + 2x2 + 3x3, где i 0, i = 1,3, 1 + 2 + 3 = 1. В координатной форме получим два уравнения: 21 + 92 + 83 = 31 + 72 + 3 = Добавляя к данной системе условие 1 + 2 + 3 =1, получим систему трех линейных уравнений с тремя неизвестными. Решая систему методом Жордана-Гаусса, получаем 2 9 8 6 - 6 1 0 - 2 0 19 0 4 0 1 0 4 / ~ ~ ~ ~ А(0) = 3 7 1 3, А(1) = 2 6 0 2, А(2) = 1 3 0 1, А(3) = 1 0 0 7 /19, 1 1 1 1 0 - 2 1 0 0 0 1 8 / 1 1 1 7 4 откуда 1 =, 2 =, 3 =. 19 19 Все эти коэффициенты удовлетворяют условию неотрицательности: i 0, i =1,3. Поэтому искомое представление имеет вид x = (7x1 + 4x2 + 8x3). 5.9. Задания для самостоятельной работы по главе 5.1. Доказать, что скалярное произведение двух любых векторов x = (x1, x2,..., xn) y = (y1, y2,..., yn) евклидова пространства тогда и только тогда выражается равенством (x, y)= x1y1 + x2 y2 +... + xn yn, когда базис, в котором взяты координаты, является ортонормированным.