Постановка задачи многомерной оптимизации

МЕТОДЫ БЕЗУСЛОВНОЙ ОПТИМИЗАЦИИ

Исследование задач многомерной оптимизации сводится к поиску точек минимума функции многих переменных на всем пространстве соответствующей размерности. Такая задача сложнее задачи минимизации функции одной переменной, так как с ростом размерности пространства переменных возрастают объем вычислений и сложность алгоритмов, затрудняется анализ поведения целевой функции

 

Будем рассматривать функции многих переменных как функции, заданные в точках -мерного евклидова пространства . Точки представляются векторами-столбцами координат: , где символ «» - знак транспонирования. В дальнейшем, там где это не приводит к недоразумениям, символ «Т», будем опускать.

1. Точка называется точкой глобального минимума функции , если для всех выполняется неравенство . Значение называется минимумом функции. Множество всех точек глобального минимума функции будем обозначать через .

Замечание. Если , то вместо минимума функции иногда рассматривают ее точную нижнюю грань .

2. Точка называется точкой локального минимума функции , если существует -окрестность точки :такая, что для всех выполняется неравенство .

Теперь сформулируем постановку задачи безусловной оптимизации.

Дана целевая функция переменных , определенная не всем пространстве . Требуется определить минимум этой функции на и точки в которых он достигается.

Условимся для обозначения данной задачи использовать следующую краткую стандартную запись:

(4.1)

или ей эквивалентную , .

 

Классический метод решения задачи безусловной оптимизации

Под классическим методом решения поставленной задачи (4.1) понимается подход к поиску минимума функции, который основан на дифференциальном исчислении функций многих переменных.

Напомним некоторые понятия и факты, известные из курса математического анализа.

1. Если функция дифференцируема в точке , то ее приращение можно записать в виде

,

где - первый дифференциал в точке .

2. Вектор называется градиентом функции в точке . В малой окрестности точки градиент указывает направление наискорейшего возрастания функции , а его норма характеризует скорость этого возрастания. Градиент в точке перпендикулярен линии (поверхности) уровня , проходящей через эту точку. Очевидно, , поэтому

(4.2)

3. Если функция дважды дифференцируема в точке , то

,

где - второй дифференциал в точке .

Используя матрицу вторых производных (матрицу Гессе, гессиан) , второй дифференциал можно записать так: , поэтому

. (4.3)

4. Из формул (4.2) и (4.3) следует, что для малых

(4.4)

или

(4.5)

т.е. в малой окрестности точки поведение дифференцируемой функции приближенно описывается формулой (4.4), а дважды дифференцируемой - формулой (4.5), причем представление (4.5) является более точным.

5. Если в точке функция дифференцируема и достигает локального минимума, то

или (4.6)

(необходимое условие минимума). Точки, в которых выполнено условие (4.6), называются стационарными точками дифференцируемой функции .

6. Если в стационарной точке функция дважды дифференцируема и матрица ее вторых производных положительно определена, то есть точка локального минимума (достаточное условие минимума).

Условия 5 и 6 лежат в основе классического метода минимизации функций, дифференцируемых во всем пространстве . Приведем алгоритм этого метода.

Шаг 1. Решив систему уравнений (4.6), найти все стационарные точки функции .

Шаг 2. Используя достаточные условия минимума, среди стационарных точек функции найти точки локального минимума и, сравнивая значения функции в них, определить точки глобального минимума.

Пример 4.1. Классическим методом решить задачу

.

Шаг 1. Запишем систему (3.12): ; ; . Решив ее, получим стационарную точку .

Шаг 2. Находим гессиан . Так как, согласно критерию Сильвестра, эта матрица положительно определена, заключаем, что является точкой минимума функции . Минимальное значение .

Замечание. Классический метод минимизации функций многих переменных имеет ограниченное практическое применение в основном из-за трудностей в аналитическом решении системы уравнений (4.6). Кроме того, на практике часто аналитическое задание функции неизвестно, а ее значения получаются в результате измерений. Все это вынуждает заняться разработкой других методов решения задачи (4.1) более удобных для компьютерной реализации.