Учебное пособие: Численные методы для решения нелинейных уравнений
Министерство общего и профессионального образования Российской Федерации
Саратовский государственный технический университет
ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ
Методические указания
к самостоятельной работе по курсу «Высшая математика»
для студентов всех специальностей
под контролем преподавателя
Одобрено
редакционно-издательским советом
Саратовского государственного
технического университета
Саратов 2008
Введение
Данная работа ориентирована на изучение некоторых численных методов приближенного решения систем нелинейных уравнений с любым числом уравнений, составление на базе этих методов вычислительных схем алгоритмов и программ на алгоритмическом языке ФОРТРАН – IV.
Методические указания могут быть использованы как в процессе выполнения курсовой работы, так и для решения практических задач.
Задача настоящих указаний состоит в том, чтобы научить студентов решать системы нелинейных уравнений с помощью ЭВМ и затем полученные навыки использовать в курсовом и дипломном проектировании.
Предполагается, что студенты прослушали лекционный курс по основам алгоритмического языка ФОРТРАН – IV.
В качестве справочного пособия по языкам программирования может быть использована литература. [5]
Численные методы для решения нелинейных уравнений
Цель работы: изучение численных методов приближенного решения нелинейных систем уравнений, составление на базе вычислительных схем алгоритмов; программ на алгоритмическом языке ФОРТРАН – IV, приобретение практических навыков отладки и решения задач с помощью ЭВМ.
1. Определения и условные обозначения
– конечномерное
линейное пространство, элементами (точками, векторами) являются группы из
упорядоченных действительных чисел,
например:
где – действительные числа,
.
В введена операция
сложения элементов, т. е.
определено
отображение
,
где
Оно обладает следующими свойствами:
1.
,
2.
,
3.
, что
(элемент
называется нулевым),
4.
, что
(элемент
называется противоположным
элементу
).
В введена операция
умножения элементов на действительные числа, т.е.
определено
отображение
,
где
Оно обладает следующими свойствами:
1.
,
2.
Операции сложения элементов и умножения их на числа удовлетворяют законам дистрибутивности:
1.
,
2.
.
Каждой паре элементов поставлено в соответствие
действительное число, обозначаемое символом
и
называемое скалярным произведением, где
и выполнены следующие условия:
1.
,
2.
,
3.
,
4.
, причем
–
нулевой элемент.
Матрица вида
, (1)
где – действительные числа (
,
) определяет линейный
оператор, отображающий линейное пространство
в себя, а именно, для
,
где .
Над линейными
операторами, действующими в линейном пространстве ,
вводятся следующие операции:
1.
сложение
операторов , при этом, если
, то
,
2.
умножение
операторов на числа: при этом, если
, то
,
3.
умножение
операторов: , при этом, если
, то
.
Обратным к оператору называется оператор
такой, что
, где
– единичный оператор,
реализующий тождественное отображение, а именно,
.
Пусть число и элемент
, таковы, что
.
Тогда число называется собственным
числом линейного оператора
, а
элемент
– собственным вектором
этого оператора, соответствующим собственному числу
.
Линейный оператор называется сопряженным к
оператору
, если для любых элементов
выполняется равенство
.
Для всякого оператора сопряженный оператор
существует, единствен;
если
, то
.
Справедливы равенства:
1.
,
2.
,
3.
,
4.
, если
существует.
Каждому элементу ставится в соответствие
действительное положительное число, обозначаемое символом
и называемое нормой
элемента
.
Введем в рассмотрение три
нормы для :
,
,
.
При этом выполняются следующие неравенства:
.
Норма элемента удовлетворяет следующим условиям (аксиомам нормы):
1.
, причем
,
лишь если
,
2.
,
3.
.
Говорят, что последовательность
элементов сходится к элементу
,
а именно, ,
или ,
если .
Определенная таким
образом сходимость в конечномерном линейном пространстве называется сходимостью по
норме.
Множество элементов , удовлетворяющих
неравенству
называется замкнутым
(открытым) шаром в пространстве
с
центром в точке
и обозначается
.
Каждому линейному
оператору, определяемому квадратной матрицей (1), ставится в
соответствие действительное неотрицательное число, обозначаемое символом и называемое нормой
линейного оператора
.
Норма линейного оператора удовлетворяет следующим условиям аксиомам норм:
4.4
, причем
,
лишь если
– нулевая матрица,
4.4
,
4.4
.
Введем в рассмотрение три
нормы для А отображающего в
:
,
,
,
где i-ое собственное значение матрицы
.
Эти нормы линейного
оператора А согласованы с соответствующими нормами элемента (вектора) в смысле условия
.
2.
Основные сведения о системах нелинейных уравнений в
Общая форма систем
нелинейных уравнений в имеет вид:
(2)
или F(x) = 0,
где – заданные функции n переменных,
– неизвестные.
Функция при действительных значениях
аргументов принимают действительные значения, т.е. являются
действительнозначными. Вычислять будем только действительные решения.
Решением системы
нелинейных уравнений (2) называется совокупность (группа) чисел , которые, будучи
подставлены на место неизвестных
,
обращают каждое уравнение системы в тождество.
Частным случаем системы (2) является система линейных уравнений:
или ,
где А – матрица
вида (1), порождающая линейный оператор, отображающий в
Система линейных
уравнений (2) поставим в соответствие линеаризованное уравнение (первые
два члена из разложения в ряд Тейлора (2)) в точке вида
(2
)
или ,
где – квадратная матрица
Якоби, составленная из частных производных первого порядка функций, а именно
, вычисленных точке
.
Для
дальнейшего нам потребуется еще одна форма записи системы нелинейных уравнений
в , а именно:
(3)
или ,
где .
Операции, с помощью которых осуществляется преобразование системы (2) к системе (3), могут быть любыми, необходимо только, чтобы искомое решение системы (3) удовлетворяло системе (2).
Функции удовлетворяют тем же
условиям, что и функции
.
3. Отделение решений
Задача отделения решений систем нелинейных уравнений состоит в определении достаточно малой окрестности (шара малого радиуса, центром которого является решение) около какого-нибудь одного решения и в выборе в этой окрестности начального приближения к решению. Начальное приближение должно попасть при этом в область сходимости метода.
Задача отделения решений не имеет достаточно эффективных методов общего характера. При решении уравнения предполагается знание начальных приближений к изолированному решению из постановки конкретной задачи. Если же таких данных нет, то можно дать лишь некоторые рекомендации для конкретных видов уравнений.
Так, если дано скалярное
уравнение , то его решение с
геометрической точки зрения можно рассматривать как абсциссы точек пересечения
графика функции с осью абсцисс. Построив график функции y=f (x), приближенно определяем окрестности изолированных точек
пересечения графика с горизонтальной осью. Сами точки пересечения берем за
начальные приближения к точным решениям.
Безусловно, графические построения имеют большие погрешности, и выбранные начальные приближения могут не попасть в область сходимости применяемого метода.
Тогда нужно провести пробные решения на ЭВМ выбранным методом с исследованием сходимости.
Если приближения сходятся, то начальные приближения выбраны в области сходимости метода и можно получить приближенное решение с заданной точностью.
Если приближения расходятся, следует провести более точные графические построения и выбрать начальное приближение в области сходимости.
Аналогично отделяются решения для системы двух нелинейных уравнений
,
.
В этом случае на
плоскости x,y строятся линии уровня функции двух переменных и
. Координаты точек
пересечения графиков этих функций дают начальные приближения изолированных
решений.
4. Методы решения нелинейных уравнений
4.1 Метод простой итерации
Метод простой итерации (см. [1]) применяется для решения систем нелинейных уравнений с любым числом уравнений. Его можно применять как для уточнения найденного решения, так и для первоначального нахождения решения. В последнем случае, однако, метод может не дать результата.
Для применения метода простой итерации система уравнений (2) приводится к виду (3).
Затем, взяв начальное
приближение , которое предполагается
либо известным, либо произвольным, строим последовательность
(4)
по следующим формулам
(5)
Замечание. Для приведения системы уравнений (2) к виду (3) можно использовать прием:
где – релаксационный параметр,
определяется методом Зейделя.
4.2 Метод Зейделя
Метод Зейделя отличается от метода простой итерации тем, что вычисления ведутся по формулам:
(6)
Иными словами, при
вычислении используются не
, как в методе простой
итерации, а
.
4.3 Метод Ньютона
Этот метод (см.[1], [4]) предложен И.Ньютоном в 1669 году, однако наиболее полное обоснование было сделано советским математиком Л.В.Канторовичем в 1949 году (см.[4]), поэтому в литературе этот метод часто называют методом Ньютона-Канторовича.
Метод Ньютона является одним из итерационных методов, получаемых линеаризацией линейного оператора
,
где из уравнения (2).
Так, для к-го приближения к точному решению
уравнения (2)
ставится в соответствие линеаризованное уравнение вида (2
), а именно:
или ,
где –
квадратная матрица Якоби, составленная из частных производных первого порядка
функций,
т.е.
, вычисленных в точке
.
Таким образом, последовательность (4) строится по следующим правилам:
(),
где –
обратный оператор к линейному оператору
,
определяемому квадратной матрицей
Трудности построения алгоритма метода
Ньютона, связанные с обращением производной (построение
), обычно преодолеваются
тем, что вместо методов обращения матрицы
решают
алгебраическую систему уравнений (7) относительно неизвестных
. Алгоритмы решения системы
линейных алгебраических уравнений хорошо отработаны, для них имеются
стандартные программы для ЭВМ и, кроме того, в результате решения системы
одновременно с обращением матрицы получается умножение обратной матрицы на
вектор
.
Итерационная формула метода Ньютона при таком подходе будет иметь вид:
(7)
. (8)
4.4 Модифицированный метод Ньютона
Эта разновидность метода Ньютона строится путем определения производной только в одной точке приближенного решения, т. е. Последовательные приближения (4) строятся по формулам:
, (9)
где –
начальное приближение к точному решению
.
4.5 Метод Зейделя на основе линеаризованного уравнения
Итерационная формула для построения приближенного решения нелинейного уравнения (2) на основе линеаризованного уравнения (7) имеет вид:
4.6 Метод наискорейшего спуска
Методы спуска (см. [2]) сводят
решение системы (2) к задаче нахождения минимума специально построенного
функционала (функционал – отображение в
R), а именно:
,
где .
Функционал в конечном пространстве Rn можно рассматривать как функцию
многих переменных .
Для нахождения точки , в которой функционал f принимает минимальное нулевое значение, выбирают точку
, находят
и строят итерационную
формулу:
с начальным приближением
.
В итерационной формуле параметр hk пока не определен, выберем его таким
образом, чтобы выполнилось условие: ,
начиная с x0, в предположении, что f – монотонный функционал.
Для выбора hk построим функционал, зависящий от
параметра, который изменяется непрерывно: .
При h=0 имеем, что f (0) – линия уровня функционала, проходящая через точку xk . Для нахождения следующей линии уровня, более близкой к минимуму, будем выбирать h таким образом, чтобы для данного xk
Это условие минимума по h будем рассматривать как уравнение для получения hk.
Решим его приближенно, т.к. ошибка в
несколько процентов обычно не влияет на скорость сходимости. Отметим кстати,
что число hk всегда должно быть
положительным. Для этого разложим функцию в
ряд Тейлора по h в точке h=0 и возьмем только линейную часть
этого разложения
.
Подстановка линейной части в условие , дает уравнение для
приближенного определения
.
Решая построенное уравнение относительно h, получим:
или
.
Таким образом, итерационная формула метода наискорейшего спуска имеет вид:
или
, где производные
вычислены в точке
.
Метод наискорейшего спуска требует большего количества вычислений, чем другие методы первого порядка. Однако он обладает по сравнению с другими методами важным преимуществом, заключающемся в неизбежной сходимости процесса. При этом нужно помнить, что метод наискорейшего спуска может привести не к решению системы уравнений (2), а к значениям аргумента, дающим относительный экстремум функции
, т.е.
.
5. Сходимость методов решения нелинейных уравнений
Если метод сходится, то
есть , где
– точное решение
– k-тое приближение к точному решению, то итерационный процесс
следовало бы закончить по достижению заданной погрешности
, где e – заданная точность (погрешность).
Однако практически это
условие выполнить нельзя, так как неизвестно,
тогда для окончания итерационного процесса можно воспользоваться неравенствами
, или
, где
и
– заданные величины.
При таком окончании
итераций погрешность может возрасти по сравнению с и,
поэтому, чтобы не увеличивалась, величины
и
соответственно уменьшают
или увеличивают число итераций.
Методы простой итерации,
Зейделя, модифицированный метод Ньютона, метод наискорейшего спуска (см. [1],
[2], [3], [4]) являются методами первого порядка – это
значит, что имеет место неравенство , k=1, 2, . . . , где
– константа, своя у
каждого метода, зависящая от выбора начального приближения
, функции fi , i = 1, 2, . . . , n, и их частных производных первого и второго порядков
– точнее их оценок в некоторой окрестности искомого решения, которой
принадлежит начальное приближение.
Метод Ньютона является
методом второго порядка, то есть для него имеет место неравенство , k=1, 2, . . . , где
– константа, зависящая от
тех же величин, что и константа
.
А теперь рассмотрим достаточные условия сходимости метода простой итерации и метода Ньютона.
Сходимость процесса
простой итерации зависит от двух условий. Первое условие состоит в том, что
какая-нибудь точка должна оказаться
близкой к исходному решению
.
Степень необходимой близости зависит от функций j1, j2, . . . , jn . Это требование не относится к
системам линейных уравнений, для которых сходимость процесса простой итерации
зависит только от второго условия.
Второе условие связано с матрицей, составленной из частных производных первого порядка функций j1, j2, . . . , jn – матрицей Якоби
,
вычисленных в точке .
В случае, когда
рассматривается система линейных алгебраических уравнений, матрица M состоит из постоянных чисел – коэффициентов,
стоящих при неизвестных в правой части уравнения (3). В случае
нелинейных уравнений элементы матрицы
M зависят, вообще говоря, от
. Для сходимости процесса
простой итерации достаточно, чтобы выполнялось неравенство:
для
из некоторой окрестности
точного решения
, которой должно
принадлежать начальное приближение
.
Приведем также
достаточные условия сходимости метода Ньютона для системы уравнений вида (2)
по норме .
Предположим, что имеется
начальное приближение к искомому решению
системы (2)
, функции
непрерывны и имеют
непрерывные частные производные до второго порядка в шаре
, тогда, если выполнены условия:
1)
Матрица Якоби системы (2) на
начальном приближении имеет обратную
и
известна оценка нормы обратной матрицы
,
2)
Для всех точек
шара выполнено неравенство
при i, j = 1, 2, . . . , n ,
3) Выполнено неравенство
,
где L – постоянная 0 £ L £ 1,
4)
Числа b, N, r
подчинены условию a = nbNr < 0,4, тогда система уравнений (2)
в шаре имеет единственное
решение, к которому сходятся последовательные приближения (8) или (7’), (9’).
Для других методов условия сходимости имеют сложный вид, и мы отсылаем читателя к специальной литературе [1], [2], [3], [4].
6. Примерный перечень возможных исследований
1) Сравнение различных методов на экономичность при решении конкретной задачи:
· по числу операций на одной итерации;
· по числу итераций, необходимых для достижения заданной точности;
2) Зависимость числа итераций для достижения заданной точности:
· от выбора вида нормы;
·
от выбора
критерия окончания итерационного процесса по или
по невязке
;
· от выбора начального приближения;
· от погрешности задания коэффициентов в уравнении.
7. Контрольные вопросы
1) Понятие о нелинейных системах уравнений в Rn.
2) Понятие приближенного и точного решения нелинейной системы уравнений.
3) Сущность графического метода отделения решения для системы двух нелинейных уравнений, каковы его преимущества и недостатки?
4) Сущность метода простой итерации и метода Зейделя. Каковы условия применимости метода простой итерации?
5) Сущность метода Ньютона и его модификации. Какова скорость сходимости метода Ньютона?
6) Сущность метода наискорейшего спуска. Как выбирается параметр спуска?
8. Порядок выполнения курсовой работы
1) Получить вариант задания, индивидуальный для каждого студента, у преподавателя, а именно:
Найти решение системы нелинейных уравнений в первой координатной четверти с номером – N1 (см. варианты заданий п.10), применив для первого этапа уточнения метод с номером – N2, а для второго этапа уточнения метод с номером – N3 , точность вычислений на первом этапе – EPS1Î[0.1 – 0.01], на втором этапе – EPS2 Î [0.1 - 0.0001], N4 – номер нормы, I – номер параметра a, J – номер параметра b, начальное приближение выбрать произвольно или графически, aÎ(0,1).
2) Разработать обязательные для выполнения задания разделы данных методических указаний.
Анализ методов определения минимального, максимального значения ... | |
Федеральное агентство по образованию Московский государственный открытый университет Чебоксарский политехнический институт Курсовой проект по ... На каждой итерации величина шага ak выбирается из условия минимума функции f(x) в направлении спуска, т.е. Поэтому естественно искать решение x* как первые m координат стационарной точки функции Лагранжа, например, методом Ньютона, мы приходим к методу Ньютона решения задач с ... |
Раздел: Рефераты по информатике, программированию Тип: курсовая работа |
Кафедра: ИТ МЕТОДЫ ОПТИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ Екатеринбург 2007 Оглавление Введение Лабораторная работа № 1. 1. Методы безусловной ... Выбор точки x0 (-2,-2) в качестве начальной для реализации метода Ньютона оказался неудачным, так как матрица Гессе в ней не является положительно определенной. Введем формулы, соответствующие системе (рис.2), и начальное приближение для решения системы уравнений (рис.3). |
Раздел: Рефераты по математике Тип: лабораторная работа |
Вычислительная математика | |
... методами. Основные понятия 1.1 Погрешность 1.2 Корректность 1.3 Вычислительные методы Тема 2. Решение нелинейных уравнений 2.1 Постановка ... Сходимость метода Ньютона зависит от того, насколько близко к корню выбрано начальное приближение. 5. Решение нелинейных уравнений методом простых итераций и методом Ньютона. |
Раздел: Рефераты по математике Тип: учебное пособие |
Классификации гиперболических дифференциальных уравнений в частных ... | |
Содержание Введение 1. Гиперболические уравнения как подкласс дифференциальных уравнений в частных производных. Классификация уравнений в частных ... Современная общая теория дифференциальных уравнений занимается главным образом линейными уравнениями и специальными классами нелинейных уравнений. Широкое распространение получили методы приближённого решения краевых задач, в которых задача сводится к решению системы алгебраических (обычно линейных) уравнений. |
Раздел: Рефераты по математике Тип: контрольная работа |
Численные методы решения систем линейных уравнений | |
Курсовая работа по информатике на тему: "Численные методы решения систем линейных уравнений" Выполнил: студент 06-ИСТ, Фадеева Т.В. Проверил: Ловыгина ... Среди задач линейной алгебры наибольшее значение имеют две: решение системы линейных алгебраических уравнений определение собственных значений и собственных векторов матрицы. Способ итераций дает возможность получить последовательность приближенных значений, сходящихся к точному решению системы, подобно тому, как это делается для одного уравнения. |
Раздел: Рефераты по информатике, программированию Тип: курсовая работа |