Точные методы решения
К числу распространённых относятся метод Гаусса и его модификация, называемая методом Жордана – Гаусса.
Метод Гаусса.Центральной частью данного метода является процедура приведения исходной системы уравнения к треугольному, в общем случае, трапецеидальному, виду. Это осуществляется путём эквивалентных преобразований системы в следующей последовательности.
Шаг 1.В левой части первого уравнения выбирается отличный от нуля коэффициент, который называется ведущим или определяющим. Пусть это , в противном случае добьемся этого, переставив столбцы и перенумеровав неизвестные. После этого разделим первое уравнение на ведущий элемент
.
Шаг 2.Вычтем почленно из второго уравнения первое, умноженное на , далее, из третьего первое, умноженное на
и т.д., наконец из n-го,- первое, умноженное на
. В результате этого получим
.
Шаг 3.Первое уравнение оставим неизменным, а во втором,- выберем ведущий элемент, пусть это и разделим на него второе уравнение.
Шаг 4.Из третьего и всех последующих уравнений, описанным выше способом, исключим переменную х2.
Далее, поступая таким же образом с третьим и остальными уравнениями за конечное число шагов приведём систему к треугольному виду
(3.2)
если решение единственно, или к трапецеидальному, если решений бесконечно много. Если же на каком-то шаге одно из уравнений примет вид , то это означает несовместимость исходной системы уравнений.
Описанный процесс преобразования системы называется прямым ходом. Предположим, что в результате выполнения прямого хода система приведена к виду (3.2). В этом случае из последнего уравнения определяется значение . Оно подставляется в предыдущее, из которого находится
. Найденные значения
,
подставляются в (n-2)-е уравнение, из которого находится
. Далее, действуя аналогичным образом, из (n-3)-го уравнения определяется значение
, из (n-4)-го, -
и, наконец, из первого – значение
. Процесс последовательного нахождения
из системы (3.2) называется обратным ходом.
С целью снижения влияния погрешностей округления, возникающих при выполнении вычислений, в качестве ведущего рекомендуется выбирать наибольший по модулю элементы левой части уравнения. Действительно, в этом случае коэффициенты системы (3.2) по модулю не превышают единицу и частичные погрешности значения xi , обусловленные ошибками
значений xm
не превышает величины , т.е. не возрастают.
Метод Жордана -Гаусса.Совмещает выполнение прямого и обратного ходов метода Гаусса. Реализуется следующим образом.
Шаг 1, 2, 3.Совпадают с первыми шагами метода Гаусса.
Шаг 4.С помощью второго уравнения переменная удаляется не только из последующих, но и из предыдущего, т.е. первого уравнения. В результате этого система принимает вид
.
Далее, рассматривается третье уравнение и с его помощью описанным образом исключается переменная из всех остальных уравнений. Поступая также с каждым следующим уравнением, и проводя, быть может, переобозначение неизвестных, за конечное число шагов система приводится к виду
.
Столбец правых частей и представляет собой решение системы уравнений.
Сравнительный анализ.С точки зрения трудоёмкости вычислений оба метода практически эквивалентны. Так, для реализации метода Гаусса необходимо арифметических операций, для выполнения метода Жордана-Гаусса,-
.
Вместе с тем, в литературе отмечается интересная особенность метода Жордана-Гаусса. А именно, если внести некоторые изменения в порядок его выполнения, то можно достичь существенного снижения необходимого объёма оперативной памяти. Так, рассматривая второе уравнение, использовать первое для исключения в нем переменной х1, после чего использовать модифицированное второе для исключения переменной х2 из первого уравнения. Далее, при рассмотрении третьего уравнения использовать первые два для исключения в них переменных х1 , х2 , после чего использовать третье для исключения из первых двух переменных х3. И так далее. При такой организации вычислений на каждом шаге в работе участвует не вся система, а только её часть. Показано, что при равных объёмах используемой оперативной памяти это позволяет примерно в два раза, по сравнению с методом Гаусса, повысить порядок решаемой системы.
Замечание. К числу точных относятся и методы, основанные на разложении матрицы А левой части системы (3.11) в виде произведения двух треугольных матриц В и С, т.е. А=ВС, где
,
.
В этом случае система принимает вид
BСХ=b,
и, обозначив Y=CX, вместо системы (3.11), имеем две системы уравнений с треугольными матрицами
BY=b
CX=Y.
Центральным моментом таких методов является реализация указанного разложения матрицы А. Показано, что для симметрических и невырожденных матриц такие процедуры существуют.
3.3. Приближённые методы решения
При использовании приближённых методов предполагается, что система (3.11) представлена в виде
x=Bx+d, (3.3)
который называется нормальной формой системы уравнений.
Процесс вычислений в этом случае организуют следующим образом. По тем или иным соображениям выбирается начальное приближение к решению системы. Оно подставляется в правую часть (3.3) , полученное значение обозначается через
, принимается в качестве следующего приближения и подставляется в правую часть для получения
и т.д. Таким образом, вычислительный процесс описывается формулой
(3.4)
и называется итерационным. Процедура получения очередного приближения называется итерацией. После выполнения ряда таких итераций одно из приближений и принимается в качестве приближённого решения. Оценка полученной при этом погрешности и вопросы сходимости последовательности рассмотрим ниже. Описанная процедура приближённого решения системы уравнений называется методом простой итерации.
Модификацией этого метода является метод Зейделя. Его отличие состоит в том, что при получении компонент (к+1)-го приближения используются полученные на этой же итерации «улучшенные» значения предыдущих компонент. Математически этот процесс описывается следующим способом
. (3.5)
С целью ускорения сходимости в качестве очередной улучшаемой компоненты рекомендуется выбирать ту, которой соответствует наибольшее значение модуля невязки, т.е. значения . Это реализуется так. После получения к-го приближения формируется вектор
,
компоненты которого упорядочиваются по убыванию их модулей. Установленный в результате этого порядок переносится и на последовательность вычисления компонент (к+1)-го приближения по правилам (3.5).
Можно показать, что стационарный метод Зейделя (3.5), т.е. когда порядок вычисления компонент неизменен, сводится к методу простой итерации. Действительно, обозначим через B1, B2 следующие матрицы
,
Тогда в матричном виде процесс (3.5) выглядит так
.
Отсюда
и
.
Таким образом, стационарный метод Зейделя с матрицей В эквивалентен методу простой операции с матрицей .
3.4. Сходимость и погрешность приближённых методов
Для описания сходимости вычислительного процесса и оценкипогрешности приближённого решения необходимы дополнительные понятия.
Понятие нормы.Нормой вектора х, обозначается , называется величина удовлетворяющая условиям:
1. ;
2. х=0; (3.6)
3. ;
4. .
В теории метрических пространств получили распространение следующие типы норм:
1. ;
2. ;
3. .
В зависимости от типа геометрической фигуры, получаемой в трёхмерном пространстве, описываемой условием , первая из них называется кубической, вторая,- октаэдрической и третья,- сферической.
Нормой матрицы А, обозначается , называется величина, удовлетворяющая помимо требований (3.6) дополнительному условию
Обычно, используются одна из следующих норм:
1. ;
2. ;
3. .
При одновременном использовании норм необходимо их согласование. А именно, норма вектора первого типа используется с нормой матрицы первого типа и т.д.
Понятие расстояния. Расстояниеммежду векторами x, y, обозначается символом , называется величина
.
Из свойства 4 (3.6) следует важное для дальнейшего, так называемое, неравенство треугольника
Действительно,
Сжимающие отображения.Пусть F ,- некоторое отображение в линейном пространстве векторов. Оно называется сжимающим,- если существует такое число , что для любых векторов x, y выполняется соотношение
.
Применительно к нормальной форме системы уравнений (3.3) в качестве F рассмотрим правую часть системы уравнений. А именно,
.
Тогда
.
Таким образом, для того, чтобы отображение, определяемое системой (3.3) было сжимающим достаточно , чтобы одна из норм матрицы В была меньше 1.
Понятие сходимости.Пусть , где к = 1, 2, …,- некоторая бесконечная последовательность векторов. Говорят, что она сходится к вектору х по норме, если
Последовательность сходится к вектору
покомпонентно, если
для
.
Нетрудно показать, что два эти понятия в некотором роде эквивалентны. А именно, если последовательность сходится по норме, то она сходится покомпонентно и наоборот.
При анализе сходимости последовательностей центральное место принадлежит признаку Коши:
Последовательность ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Сходимость итерационного процесса. Оценка погрешности. Пусть ,- итерационная последовательность, т.е.
, (3.7)
где ,- сжимающее отображение с коэффициентом сжатия
.
Рассмотрим . По индукции имеем
. (3.8)
Далее, по свойству треугольников и с учетом (3.8), справедливым оказывается соотношение
(3.9)
Потребовав теперь, чтобы
,
очевидно, можно найти номер , начиная с которого
для
, m > 0 .
Таким образом, для сжимающего отображения признак Коши выполнен и, следовательно, итерационный процесс (3.7) сходится.
Оценим теперь погрешность к-го приближения, а именно, величину , где х- точное решение. С этой целью рассмотрим соотношение (см. (3.9))
Переходя в нём к пределу при , получим , таким образом,
(3.10)
и доказанным становится утверждение:
Если одна из норм матрицы B системы уравнений (3.3) меньше единицы, то итерационный процесс (3.4) является сходящимся при любом начальном приближении. Погрешность к-го приближения описывается соотношением (3.10). |
3.5 Приведение системы Ax=b к нормальному виду
Из предыдущего следует, что успех приближённого решения системы линейных алгебраических уравнений (3.1) во многом определяется возможностью её приведения к нормальному виду (3.3), для которого выполняется достаточные условия сходимости. Приведём некоторые соображения и рекомендации на этот счёт.
Первый вариант.Рассмотрим систему
Ах=b.
Представим матрицу А в виде суммы А=А1+А2, где det А1 ≠ 0. Тогда
(А1+А2)x=b,
отсюда
.
Обозначив через ,
, получим
,
что и требовалось. Тогда для того, чтобы обеспечить выполнение достаточного условия сходимости , в качестве А1 достаточно взять матрицу близкую к А , т.е. А1≈А, в качестве А2, - «малую» матрицу
.
Поясним это предложение на примере. Рассмотрим
,
Здесь . Пусть
,
Тогда . Найдём
.
Имеем det А1 = -2 ≠ 0 и
.
Тогда
и система принимает вид
.
Очевидно, для сходимости метода итераций достаточно взять .
Второй вариант.Состоит в следующем. Путём эквивалентных преобразований стараются добиться того, чтобы диагональные элементы в матрице А доминировали в левой части соответствующих уравнений, т.е. были по модулю существенно больше остальных. После этого каждое из уравнений делят на и, первое уравнение разрешают относительно
второе,- относительно
и т.д.
В качестве примера рассмотрим следующую систему
В результате анализа коэффициентов левой части уравнений производится их перестановка
и для обеспечения доминирования во втором уравнении коэффициента , который пока равен -7,9, ко второму уравнению прибавляется третье. В результате этого имеем
или, в нормальной форме,
.
Здесь матрица
,
очевидно, её норма , и, следовательно, формируемый ею итерационный процесс сходится.
Третий вариант.Является обоснованным теоретически, формализуемым и, по этой причине, пожалуй, наиболее удобным. Он заключается в следующем.
Рассмотрим систему (3.11)
Ax=b
и предположим, что det А1 ≠ 0. Умножим обе части на , получим
A1 x=b1,
где A1=АТА, b1= AT b. Здесь матрица A1 является симметрической, т.е. , причём её диагональные элементы
, в противном случае, по крайней мере, один из столбцов матрицы А равен нулю и, следовательно, det А = 0. Далее деля уравнение на диагональные элементы
и, разрешая их относительно
,
и т.д. получим нормальную систему
,
где .
Показано, что для нормальной системы, полученной таким образом, метод Зейделя сходится.