Главная » Аналитическая геометрия » Матрицы и системы линейных уравнений » Общая теория систем линейных уравнений

Общая теория систем линейных уравнений

5 разделов
от теории до практики
1 пример
Примеры решения задач
видео
Примеры решения задач
Содержание
  1. Условия совместности.
    Начать изучение
  2. Нахождение решений.
    Начать изучение
  3. Приведенная система.
    Начать изучение
  4. Общее решение системы линейных уравнений.
    Начать изучение

Условия совместности.

Займемся изучением систем из m уравнений с n неизвестными. Систему
\begin{matrix}a_{1}^{1}x^{1}+a_{2}^{1}x^{2}+...+a_{n}^{1}x^{n}=b^{1},\\a_{1}^{2}x^{1}+a_{2}^{2}x^{2}+...+a_{n}^{2}x^{n}=b^{2},\\\cdots\\a_{1}^{m}x^{1}+a_{2}^{m}x^{2}+...+a_{n}^{m}x^{n}=b^{m}\end{matrix} мы можем кратко записать в виде \tag{1} A\boldsymbol{x}=\boldsymbol{b}.
Система задается своей расширенной матрицей A^{*}, получаемой объединением матрицы системы A и столбца свободных членов \boldsymbol{b}.

Простое и эффективное условие, необходимое и достаточное для совместности системы (1), дает следующая теорема, называемая теоремой Кронекера-Капелли.

Теорема Кронекера-Капелли.

Система линейных уравнений совместна тогда и только тогда, когда ранг матрицы системы равен рангу расширенной матрицы.

Иначе утверждение теоремы можно сформулировать так: приписывание к матрице A размеров m \times n столбца \boldsymbol{b} высоты m не меняет ее ранга тогда и только тогда, когда этот столбец — линейная комбинация столбцов A.

Доказательство.

Если \mathbf{Rg}\,A^{*}=\mathbf{Rg}\,A, то базисный минор A является базисным и для A^{*}. Следовательно, \boldsymbol{b} раскладывается по базисным столбцам A. Мы можем считать его линейной комбинацией всех столбцов A, добавив недостающие столбцы с нулевыми коэффициентами.

Обратно, если \boldsymbol{b} раскладывается по столбцам A, то элементарными преобразованиями столбцов можно превратить A^{*} в матрицу A_{0}, получаемую из A приписыванием нулевого столбца. Из утверждения о том, что ранг матрицы не меняется при элементарных преобразованиях, следует \mathbf{Rg}\,A_{0}=\mathbf{Rg}\,A^{*}. С другой стороны, \mathbf{Rg}\,A_{0}=\mathbf{Rg}\,A, так как добавление нулевого столбца не может создать новых невырожденных подматриц. Отсюда \mathbf{Rg}\,A=\mathbf{Rg}\,A^{*}, как и требовалось.

Утверждение 1.

Пусть матрица A^{*} приведена к упрощенному виду с помощью элементарных преобразований строк. Система (1) несовместна тогда и только тогда, когда в упрощенную матрицу входит строка \begin{Vmatrix} 0&...& 0& 1 \end{Vmatrix}.

Доказательство.

Пусть рассматриваемая система не совместна, и \mathbf{Rg}\,A^{*} > \mathbf{Rg}\,A=r. В упрощенном виде матрицы A последние m-r строк — нулевые. Последний столбец матрицы A^{*} должен быть базисным, и в упрощенном виде матрицы A^{*} последний столбец — r+1-й столбец единичной матрицы. Поэтому r+1-я строка этой матрицы есть \begin{Vmatrix} 0&...& 0& 1 \end{Vmatrix}. Обратно, если в матрице содержится такая строка, то последний столбец не может быть линейной комбинацией остальных, и система с упрощенной матрицей несовместна. Тогда несовместна и исходная система (согласно ранее доказанного утверждения).

Иначе это утверждение можно сформулировать так.

Следствие.

Система линейных уравнений несовместна тогда и только тогда, когда противоречивое равенство 0=1 является линейной комбинацией ее уравнений.

Равенство рангов матрицы системы и расширенной матрицы можно выразить, понимая ранг матрицы как строчный ранг. Это приведет нас к важной теореме, известной как теорема Фредгольма.

Транспонируем матрицу A системы (1) и рассмотрим систему из n линейных уравнений \tag{2} \begin{matrix} a_{1}^{1}y_{1}+a_{1}^{2}y_{2}+...+a_{1}^{m}y_{m}=0,\\ a_{2}^{1}y_{1}+a_{2}^{2}y_{2}+...+a_{2}^{m}y_{m}=0,\\\cdots\\a_{n}^{1}y_{1}+a_{n}^{2}y_{2}+...+a_{n}^{m}y_{m}=0\end{matrix} с m неизвестными, матрицей A^{T} и свободными членами, равными нулю. Она называется сопряженной однородной системой для системы (1). Если \boldsymbol{y} — столбец высоты m из неизвестных, то систему (2) можно записать как A^{T} \boldsymbol{y}=\boldsymbol{o}, или лучше в виде \tag{3} \boldsymbol{y}^{T}A=\boldsymbol{o}, где \boldsymbol{o} — нулевая строка длины n.

Теорема Фредгольма.

Для того чтобы система (1) была совместна, необходимо и достаточно, чтобы каждое решение сопряженной однородной системы (3) удовлетворяло уравнению \tag{4} \boldsymbol{y}^{T} \boldsymbol{b}=y_{1}b^{1}+...+y_{m}b^{m}=0.

Доказательство.

1^{\circ}. Пусть система (1) совместна, то есть существует столбец \boldsymbol{x} высоты n, для которого A\boldsymbol{x}=\boldsymbol{b}. Тогда для любого столбца \boldsymbol{y} высоты m выполнено \boldsymbol{y}^{T} A\boldsymbol{x}=\boldsymbol{y}^{T} \boldsymbol{b}. Если \boldsymbol{y} — решение системы (3), то \boldsymbol{y}^{T} \boldsymbol{b}=(\boldsymbol{y}^{T} A)\boldsymbol{x}=\boldsymbol{o}\boldsymbol{x}=0.

2^{\circ}. Предположим теперь, что система (1) несовместна. Тогда согласно утверждению 1 строка \begin{Vmatrix} 0&...& 0& 1 \end{Vmatrix} входит в упрощенный вид расширенной матрицы A^{*}=\begin{Vmatrix} A& |& \boldsymbol{b} \end{Vmatrix} и, следовательно, является линейной комбинацией ее строк. Обозначим коэффициенты этой линейной комбинации y_{1},..., y_{m} и составим из них столбец \boldsymbol{y}. Для этого столбца \boldsymbol{y}^{T} \begin{Vmatrix} A& |& \boldsymbol{b} \end{Vmatrix}=\begin{Vmatrix} 0&...& 1 \end{Vmatrix} (согласно данного утверждения). Это же равенство можно расписать как два: \boldsymbol{y}^{T} A=\boldsymbol{o} и \boldsymbol{y}^{T} \boldsymbol{b}=1. Итак, нам удалось найти решение системы (3), не удовлетворяющее условию (4). Это заканчивает доказательство.

В качестве примера применим теорему Фредгольма к выводу условия параллельности двух различных прямых на плоскости. Их уравнения составляют систему A_{1}x+B_{1}y+C_{1}=0,\ A_{2}x+B_{2}y+C_{2}=0.
Она не имеет решений, если существуют такие числа y_{1}, y_{2}, что y_{1}A_{1}+y_{2}A_{2}=0, y_{1}B_{1}+y_{2}B_{2}=0, но y_{1}C_{1}+y_{2}C_{2} \neq 0. Ясно, что y_{1} и y_{2} не равны нулю. Поэтому можно положить \lambda=-y_{2}/y_{1} и записать полученное условие в виде: существует число \lambda такое, что A_{1}=\lambda A_{2}, B_{1}=\lambda B_{2} и C_{1} \neq \lambda C_{2}.

Нахождение решений.

В этом пункте мы будем предполагать, что дана совместная система из m линейных уравнений с n неизвестными. Ранг матрицы системы обозначим r. Поскольку ранг расширенной матрицы тоже равен r, мы можем считать базисные столбцы матрицы системы базисными столбцами расширенной матрицы. Элементарными преобразованиями строк приведем расширенную матрицу к упрощенному виду (возможность этого мы уже доказывали). Наша система линейных уравнений перейдет в эквивалентную ей систему из r линейно независимых уравнений.

Для удобства записи будем предполагать, что первые r столбцов — базисные. Тогда преобразованную систему можно записать в виде \tag{5} \begin{matrix} x^{1}=\beta^{1}-(\alpha_{r+1}^{1}x^{r+1}+...+\alpha_{n}^{1}x^{n}),\\\cdots\\x^{r}=\beta^{r}-(\alpha_{r+1}^{r}x^{r+1}+...+\alpha_{n}^{r}x^{n}).\end{matrix}
Здесь \alpha_{j}^{i} и \beta^{i} — элементы преобразованной расширенной матрицы. В левых частях равенств мы оставили неизвестные, соответствующие выбранным нами базисным столбцам, так называемые базисные неизвестные. Остальные неизвестные, называемые параметрическими, перенесены в правые части равенств.

Как бы мы ни задали значения параметрических неизвестных, по формулам (5) мы найдем значения базисных так, что они вместе со значениями параметрических неизвестных образуют решение системы (1). Легко видеть, что так мы получим все множество решений.

На формулах (5) можно было бы и остановиться, но ниже мы дадим более простое и наглядное, а также принципиально важное описание совокупности решений системы линейных уравнений.

Приведенная система.

Сопоставим системе линейных уравнений (1) однородную систему с той же матрицей коэффициентов: \tag{6}A\boldsymbol{x}=\boldsymbol{o}. По отношению к системе (1) она называется приведенной.

Утверждение 2.

Пусть \boldsymbol{x}_{0} — решение системы (1). Столбец \boldsymbol{x} также будет ее решением тогда и только тогда, когда найдется такое решение у приведенной системы (6), что \boldsymbol{x}=\boldsymbol{x}_{0}+\boldsymbol{y}.

Доказательство.

Пусть \boldsymbol{x} — решение системы (1). Рассмотрим разность \boldsymbol{y}=\boldsymbol{x}-\boldsymbol{x}_{0}. Для нее A\boldsymbol{y}=A\boldsymbol{x}-A\boldsymbol{x}_{0}=\boldsymbol{b}-\boldsymbol{b}=\boldsymbol{o}.

Обратно, если \boldsymbol{y} — решение системы (6), и \boldsymbol{x}=\boldsymbol{x}_{0}+\boldsymbol{y}, то A\boldsymbol{x}=A\boldsymbol{x}_{0}+A\boldsymbol{y}=\boldsymbol{b}+\boldsymbol{o}=\boldsymbol{b}.

Это предложение сводит задачу описания множества решений совместной системы линейных уравнений к описанию множества решений ее приведенной системы.

Однородная система совместна. Действительно, нулевой столбец является ее решением. Это решение называется тривиальным.

Пусть столбцы матрицы A линейно независимы, то есть \mathbf{Rg}\,A=n. Тогда система (6) имеет единственное решение (ранее мы это уже доказывали) и, следовательно, нетривиальных решений не имеет.

Утверждение 3.

Если \boldsymbol{x}_{1} и \boldsymbol{x}_{2} — решения однородной системы, то любая их линейная комбинация — также решение этой системы.

Доказательство.

Действительно, из A\boldsymbol{x}_{1}=\boldsymbol{o} и A\boldsymbol{x}_{2}=\boldsymbol{o} для любых \alpha и \beta следует A(\alpha \boldsymbol{x}_{1}+\beta \boldsymbol{x}_{2})=\alpha A \boldsymbol{x}_{1}+\beta A\boldsymbol{x}_{2}=\boldsymbol{o}.

Если однородная система имеет нетривиальные решения, то можно указать несколько линейно независимых решений таких, что любое решение является их линейной комбинацией. Сделаем это.

Определение.

Матрица F, состоящая из столбцов высоты n, называется фундаментальной матрицей для однородной системы с матрицей А, если:

  1. AF=O;
  2. столбцы F линейно независимы;
  3. ранг F максимален среди рангов матриц, удовлетворяющих условию 1).

Столбцы фундаментальной матрицы называются фундаментальной системой решений.

Если фундаментальная матрица существует, то каждый ее столбец в силу первого условия определения — решение системы. Если система не имеет нетривиальных решений, то фундаментальной матрицы нет. Это будет в том случае, когда столбцы А линейно независимы: \mathbf{Rg}\,A=n.

Ниже мы докажем, что в остальных случаях фундаментальная матрица существует, но сначала выясним, что означает третье условие в определении.

Утверждение 4.

Пусть A — матрица размеров m \times n и ранга r. Если AF=O, то \mathbf{Rg}\,F \leq n-r.

Доказательство.

Приведем матрицу A к упрощенному виду элементарными преобразованиями строк, а затем элементарными преобразованиями столбцов обратим в нулевые все небазисные столбцы. Мы получим матрицу A'=PAQ, где P и Q — произведения соответствующих элементарных матриц. Первые r строк A' — строки единичной матрицы порядка n, а остальные — нулевые. Обозначим F'=Q^{-1}F. Тогда \mathbf{Rg}\,F'=\mathbf{Rg}\,F. Используя ранее доказанное нами утверждение, легко заметить, что первые r строк матрицы A'F' совпадают с первыми r строками F'. Но A'F'=PAF=O и, следовательно, F' содержит r нулевых строк. Так как всего в ней n строк, \mathbf{Rg}\,F' \leq n-r. Это равносильно доказываемому утверждению.

Покажем теперь, как может быть построена фундаментальная матрица. Согласно ранее доказанному утверждению, решение однородной системы состоит из коэффициентов равной нулю линейной комбинации столбцов матрицы системы. Мы можем получить такие линейные комбинации, основываясь на теореме о базисном миноре. Снова для удобства записи будем считать, что в матрице A первые r столбцов — базисные. Каждый из небазисных столбцов \boldsymbol{a}_{j} (j=r+1,..., n) раскладывается по базисным: \tag{7} \boldsymbol{a}_{j}=\alpha_{j}^{1}\boldsymbol{a}_{1}+...+\alpha_{j}^{r}\boldsymbol{a}_{r}. Отсюда следует, что столбец \begin{Vmatrix} -\alpha_{j}^{1}... -\alpha_{j}^{r}& 0...0& 1& 0...0 \end{Vmatrix}^{T} решением. (Единица в нем стоит на j-м месте.)

Таких решений можно составить столько, сколько есть небазисных столбцов, то есть (n-r). Убедимся в том, что эти решения линейно независимы. Для этого объединим все столбцы в одну матрицу \tag{8} \begin{Vmatrix} -\alpha_{r+1}^{1}& -\alpha_{r+2}^{1}&... -\alpha_{n}^{1},\\\cdots\\-\alpha_{r+1}^{r}& -\alpha_{r+2}^{r}&... -\alpha_{n}^{r},\\1& 0&...& 0\\0& 1&...& 0\\\cdots\\0& 0&...& 1\end{Vmatrix}.
Подматрица в последних n-r строках — единичная. Поэтому ранг матрицы (8) равен числу столбцов, и столбцы линейно независимы.

Таким образом, мы получили

Утверждение 5.

Если ранг матрицы однородной системы линейных уравнений r меньше числа неизвестных n, то система имеет фундаментальную матрицу из n-r столбцов.

Итак, система столбцов (8) — фундаментальная система решений. Она называется нормальной фундаментальной системой решений. Каждому выбору базисных столбцов соответствует своя нормальная фундаментальная система решений. Вообще же, каждая система из n-r линейно независимых решений является фундаментальной.

Для нахождения матрицы (8) можно привести матрицу A системы к упрощенному виду, что даст коэффициенты разложения небазисных столбцов по базисным.

Пусть F — фундаментальная матрица системы A\boldsymbol{x}=\boldsymbol{o}. Рассмотрим произвольный столбец с высоты n-r. Произведение F\boldsymbol{c} — столбец высоты n, и из равенства AF\boldsymbol{c} =\boldsymbol{o} следует, что при любом с столбец F\boldsymbol{c} — решение системы. Оказывается, имеет место

Утверждение 6.

Столбец \boldsymbol{x} — решение системы A\boldsymbol{x}=\boldsymbol{o} тогда и только тогда, когда существует такой столбец \boldsymbol{c}, что \tag{9} \boldsymbol{x}=F\boldsymbol{c}.

Доказательство.

Остается доказать необходимость условия. Пусть \boldsymbol{x} — решение. Присоединив его к F, получим матрицу F^{*}=\begin{Vmatrix} F\ |\ \boldsymbol{x} \end{Vmatrix} . Эта матрица удовлетворяет условию AF^{*}=O, так как каждый ее столбец — решение. Значит, \mathbf{Rg}\,F^{*}=n-r. По теореме Кронекера-Капелли мы заключаем отсюда, что существует столбец \boldsymbol{c}, удовлетворяющий системе F\boldsymbol{c}=\boldsymbol{x}.

Общее решение системы линейных уравнений.

Теперь мы можем собрать воедино наши результаты — утверждения 2 и 6.

Теорема 3.

Если \boldsymbol{x}_{0} — некоторое решение системы (1), a F — фундаментальная матрица ее приведенной системы, то столбец \tag{10} \boldsymbol{x}=\boldsymbol{x}_{0}+F\boldsymbol{c} при любом \boldsymbol{c} является решением системы (1). Наоборот, для каждого ее решения \boldsymbol{x} найдется такой столбец \boldsymbol{c}, что оно будет представлено формулой (10).

Доказательство.

в

Выражение, стоящее в правой части формулы (10), называется общим решением системы линейных уравнений. Если \boldsymbol{f}_{1},..., \boldsymbol{f}_{n-r} — фундаментальная система решений, а c_{1},..., c_{n-r} — произвольные постоянные, то формула (10) может быть написана так: \tag{11} \boldsymbol{x}=\boldsymbol{x}_{0}+c_{1}\boldsymbol{f}_{1}+...+c_{n-r}\boldsymbol{f}_{n-r}.

Теорема 3 верна, в частности, и для однородных систем. Если \boldsymbol{x}_{0} — тривиальное решение, то (10) совпадает с (9).

Одна из ранее доказанных нами теорем гласит, что для существования единственного решения системы из n линейных уравнений с n неизвестными достаточно, чтобы матрица системы имела детерминант, отличный от нуля. Сейчас легко получить и необходимость этого условия.

Утверждение 7.

Пусть A — матрица системы из n линейных уравнений с n неизвестными. Если \det A=0, то система либо не имеет решения, либо имеет бесконечно много решений.

Доказательство.

Равенство \det A=0 означает, что \mathbf{Rg}\,A < n и, следовательно, приведенная система имеет бесконечно много решений. Если данная система совместна, то из теоремы 3 следует, что и она имеет бесконечно много решений.

Пример.

Рассмотрим уравнение плоскости как систему \tag{12}Ax+By+Cz+D=0 из одного уравнения. Пусть A \neq 0 и потому является базисным минором матрицы системы. Ранг расширенной матрицы 1, значит, система совместна. Одно ее решение можно найти, положив параметрические неизвестные равными нулю: y=z=0. Мы получим x=-D/A. Так как n=3, r=1, фундаментальная матрица имеет два столбца. Мы найдем их, придав параметрическим неизвестным два набора значений: y=1, z=0 и y=0, z=1. Соответствующие значения базисной неизвестной x, найденные из приведенной системы, будут -B/A и -C/A. Итак, общее решение системы (12) \tag{13} \begin{Vmatrix} x\\ y\\ z \end{Vmatrix}=\begin{Vmatrix} -D/A\\ 0\\ 0 \end{Vmatrix}+c_{1} \begin{Vmatrix} -B/A\\ 1\\ 0 \end{Vmatrix}+c_{2} \begin{Vmatrix} -C/A\\ 0\\ 1 \end{Vmatrix}.

Выясним геометрический смысл полученного решения. Очевидно, прежде всего, что решение \begin{Vmatrix} -D/A& 0& 0 \end{Vmatrix}^{T} состоит из координат некоторой (начальной) точки плоскости, или, что то же, из компонент ее радиус-вектора. В формуле (10) решение x_0 можно выбирать произвольно. Это соответствует произволу выбора начальной точки плоскости. Мы уже знаем, что компоненты лежащих в плоскости векторов удовлетворяют уравнению A\alpha_{1}+B\alpha_{2}+C\alpha_{3}=0, то есть приведенной системе. Два линейно независимых решения этой системы (фундаментальная система решений) могут быть приняты за направляющие векторы плоскости. Таким образом, формула (13) — не что иное, как параметрические уравнения плоскости.

Оставить комментарий