Теория неявных функций и ее приложения
ТЕОРИЯ НЕЯВНЫХ ФУНКЦИЙ И ЕЕ ПРИЛОЖЕНИЯ
§ 1. Понятие неявной функции
В математике и в ее приложениях приходится сталкиваться с такими задачами, когда переменная u, являющаяся по смыслу задачи функцией аргументов х, у, ... , задается посредством функционального уравнения
F(u, х, у, ...) = 0. (1)
В этом случае говорят, что u как функция аргументов х, у, ... задана неявно. Так, например, функция u = -, рассматриваемая в круге x2 + y2 ≤ 1, может быть неявно задана посредством функционального уравнения
F(u, х, у) = u2 + x2 + y2 – 1 = 0. (2)
Естественно, возникает вопрос, при каких условиях функциональное уравнение (1) однозначно разрешимо относительно u, т.е. однозначно определяет явную функцию u = φ( х, у, ...) и более тонкий вопрос, при каких условиях эта явная функция является непрерывной и дифференцируемой. Эти вопросы не являются простыми. Так функциональное уравнение (2), вообще говоря, определяет в круге x2 + y2 ≤ 1, кроме указанной выше явной функции u = -, бесконечно много других функций. Таковыми являются функция u = +, а также любая функция u, равная + для некоторых точек (х, у) из круга x2 + y2 ≤ 1 и равная -для остальных точек этого круга. Для выяснения вопроса об условиях, обеспечивающих однозначную разрешимость уравнения (2) относительно u, обратимся к геометрической иллюстрации. Уравнение (2) определяет в пространстве (u, х, у) сферу S радиуса 1 с центром в начале координат (рис.1). Возьмем на сфере S точку M0(u0, х0, у0), не лежащую в плоскости Оху, т.е. такую, для которой u0 ≠ 0. Очевидно, часть сферы S, лежащая в достаточно малой окрестности точки M0, однозначно проектируется на плоскость Оху. Аналитически это означает, что если рассматривать функцию F(u, х, у) = u2 + x2 + y2 – 1 только в указанной окрестности точки M0, то уравнение (2) однозначно разрешимо относительно u и определяет единственную явную функцию u = + при u0>0 и u = -при u0<0
Если же на сфере S взять точку M1(0, х1, у1), лежащую в плоскости Оху (см. рис. 1),то очевидно, что часть сферы S, лежащая в любой окрестности M1 неоднозначно проектируется на плоскость Оху. Аналитически это означает, что если рассматривать функцию F(u, х, у) = u2 + x2 + y2 – 1 в любой окрестности точки M1, то уравнение (2) не является однозначно разрешимым относительно u.
Обратим внимание на то, что частая производная функции F(u, х, у) = u2 + x2 + y2 – 1 не обращается в нуль в точке М0 и обращается в нуль в точке М1 . Ниже мы установим, что для однозначной разрешимости в окрестности точки М0 общего функционального уравнении (1) относительно u принципиальную роль играет необращение в нуль в точке М0 частной производной Попутно мы установим условия, при которых явная функция, представляющая собой единственное решение уравнения (1), является непрерывной и дифференцируемой.
В дальнейшем мы будем обозначать пространство переменных (u, х, у, ...) символом R, а пространство переменных ( х, у, ...) символом R'. Ради сокращения записи и для удобства геометрической иллюстрации будем рассматривать две переменные х, у.
§ 2. Теорема о существовании и дифференцируемости
неявной функции и некоторые ее применения
1. Теорема о существовании и дифференцируемости неявной функции.
Теорема 1. Пусть функция F(u, х, у) дифференцируема в некоторой, окрестности точки M0(u0, х0, у0) пространства R, причем частная производная непрерывна в точке M0. Тогда, если в точке M0 функция F обращается в нуль, а частная производная не обращается в нуль, то для любого достаточно малого положительного числа ε, найдется такая окрестность точки M0’(х0, у0) пространства R', что в пределах этой окрестности существует единственная функция u = φ(х, у), которая удовлетворяет условию | u - u0 | < ε и является решением уравнения
F(u, х, у) = 0 (3)
причем эта функция u = φ(х, у) непрерывна и дифференцируема в указанной окрестности точки M0’.
З а м е ч а н и е 1. В условиях теоремы 1 можно опустить требование непрерывности частной производной в точке M0, но тогда придется дополнительно потребовать, чтобы эта производная не обращалась в нуль не только в самой точке M0, но и в некоторой окрестности этой точки и сохраняла определенный знак в этой окрестности.
Д о к а з а т е л ь с т в о теоремы 1.
1.Прежде всего докажем, что для достаточно малого ε>0 в окрестности точки M0’(х0, у0) существует единственная функция u = φ(х, у), которая удовлетворяет условию | u - u0 | < ε и является решением уравнения (3). Чтобы сделать доказательство более наглядным, будем сопровождать его геометрической иллюстрацией. Из аналитической геометрии известно, что уравнение (3) определяет в пространстве R некоторую поверхность S (рис. 2), причем, в силу условия F(M0) = 0, точка M0 лежит на этой поверхности. С геометрической точки зрения однозначная разрешимость уравнения (3) относительно u означает, что часть поверхности S, лежащая в непосредственной близости к точке M0, может быть однозначно спроектирована на координатную плоскость Оху.
Ради определенности будем считать, что частная производная положительна в точке M0. Тогда из непрерывности указанной производной в M0 и из теоремы об устойчивости знака непрерывной функции вытекает, что найдется такая окрестность точки M0, всюду в пределах которой положительна. Эту окрестность мы можем взять в виде шара Ω достаточно малого радиуса с центром в точке M0. Фиксируем далее положительное число ε настолько малым, чтобы каждая из точек M1(u0 - ε, х0, у0) и M2(u0 + ε, х0, у0) лежала внутри шара Ω (для этого достаточно взять ε меньшим радиуса шара Ω). Подчеркнем, что при этом снизу ε ограничено лишь нулем, и мы можем брать его как угодно малым — это будет использовано нами ниже.
Рассмотрим функцию F(u, х0, у0) одной переменной на сегменте u0 – ε ≤ u ≤ u0 + ε. С геометрической точки зрения это означает, что мы рассматриваем функцию трех переменных F(u, х, у) вдоль отрезка М1М2 (рис. 2). Так как производная u, х0, у0) положительна на сегменте u0 – ε ≤ u ≤ u0 + ε то функция F(u, х0, у0) возрастает на этом сегменте. Но тогда, поскольку эта функция равна нулю в середине указанного сегмента (т. е. при u = u0), то F(u, х0, у0) имеет отрицательное значение на левом конце и положительное значение на правом конце указанного сегмента, т. е.
F(M1) < 0, F(M2) > 0
Далее рассмотрим функции F(u - ε, х, у) и F(u + ε, х, у) двух переменных х и у, т. е., выражаясь геометрическим языком, рассмотрим функцию F(u, х, у) на двух плоскостях, параллельных координатной плоскости Оху, первая из которых проходит через точку M1 а вторая - через точку M2. Поскольку F(M1) < 0, F(M2) > 0 и функция F(u, х, у) непрерывна всюду в шаре Ω, то по теореме об устойчивости знака непрерывной функции на указанных плоскостях найдутся такие окрестности точек M1 и M2, в пределах которых функция F сохраняет те же знаки, что и в точках M1 и M2. Эти окрестности мы можем взять в виде открытых квадратов с центрами в точках M1 и M2 и с достаточно малой стороной 2δ (на рис. 2 указанные квадраты заштрихованы). Аналитически тот факт, что функция F(u, х, у) сохраняет постоянный знак на указанных квадратах, выражается неравенствами
F(u0 – ε, х, у) < 0
При | x – x0 | < δ, | y – y0 | < δ (4)
F(u0 + ε, х, у) > 0
Выбор стороны указанных квадратов мы подчиним и еще одному условию: возьмем δ столь малым, чтобы оба указанных квадрата лежали внутри шара Ω (это заведомо можно сделать, ибо центры квадратов M1 и M2 являются внутренними точками шара Ω). При таком выборе δ любая точка пространства (u, х, у), координаты которой удовлетворяют неравенствам
| x – x0 | < δ, | y – y0 | < δ, | u – u0 | < ε (5)
будет лежать внутри шара Ω. С геометрической точки зрения неравенства (5) определяют открытый прямоугольный параллелепипед с центром в точке M0 и со сторонами, параллельными осям координат u, х, у и соответственно равными 2ε, 2δ и 2δ. Этот параллелепипед мы будем обозначать символом П. Так как параллелепипед П лежит внутри шара Ω, то всюду в параллелепипеде П (включая открытые квадраты, лежащие в его основаниях) производная положительна. Кроме того, в силу неравенств (4), функция F(u, х, у) отрицательна на нижнем основании и положительна на верхнем основании П.
Докажем теперь, что уравнение (3) однозначно разрешимо относительно u, если функцию F(u, х, у) рассматривать лишь для значений u, х, у, лежащих внутри параллелепипеда П. Уясним, что требуется доказать. Пусть M’(х, у) - любая точка пространства R', координаты которой удовлетворяют неравенствам
| x – x0 | < δ, | y – y0 | < δ (6)
Иначе говоря, пусть M’(х, у) - любая точка плоскости Оху, лежащая внутри квадрата с центром в точке M0’(х0, у0) и со сторонами, равными 2δ. Требуется доказать, что для координат х, у точки М' найдется, и притом единственное, число u из интервала u0 – ε < u < u0 + ε такое, что F(u, х, у) = 0. (С геометрической точки зрения это означает, что любая прямая, параллельная оси u и пересекающая параллелепипед П, пересекает поверхность S внутри параллелепипеда П только в одной точке.)
Зафиксировав значения х и у, удовлетворяющие неравенствам (6), рассмотрим функцию F(u, х, у) аргумента u на сегменте u0 – ε ≤ u ≤ u0 + ε, т. е. рассмотрим функцию F(u, х, у) на отрезке M1’M2’ где M1’ и M2’ - точки пересечения прямой, проходящей через точку M’(х, у) и параллельной оси Ou, с основаниями параллелепипеда П(см. рис. 2). Так как производная u, х, у) положительна на сегменте u0 – ε ≤ u ≤ u0 + ε, то функция F(u, х, у) возрастает на этом сегменте (или, что тоже самое, возрастает на отрезке M1’M2’). Но тогда из условий F(M1’) < 0, F(M2’) > 0 вытекает, что внутри сегмента u0 – ε ≤ u ≤ u0 + ε найдется одно единственное значение u такое, что F(u, х, у) = 0 (или, выражаясь геометрически, внутри отрезка M1’M2’ найдется единственная точка М, лежащая на поверхности S).
Пусть теперь функция u = φ( х, у) символизирует то правило, посредством которого каждой точке M’(х, у) из окрестности (6) ставится в соответствие единственное число u из интервала u0 – ε < u < u0 + ε, для которого F(u, х, у) = 0. Мы доказали, что в окрестности (6) существует единственная функция u = φ( х, у), удовлетворяющая условию | u – u0 | < ε и являющаяся решением уравнения (3).
2.Докажем теперь, что функция u = φ( х, у) непрерывна в любой точке M’(х, у) окрестности (6). Так как для любой точки M’(х, у) из окрестности (6) выполнены те же условия (а именно любой точке M’(х, у) из окрестности (6) соответствует точка M(u, х, у) пространства R такая, что функция F(u, х, у) обращается в нуль в точке М, дифференцируема в некоторой окрестности точки М и имеет в этой окрестности отличную от нуля частную производную ), что и для точки M0’(х0, у0), то достаточно доказать непрерывность функции u = φ( х, у) лишь в точке M0’(х0, у0). Требуется доказать, что для любого достаточно малого положительного ε существует положительное число δ такое, что для любых х и у, удовлетворяющих неравенствам | x – x0 | < δ, | y – y0 | < δ, справедливо неравенство | u – u0 | < ε где u = φ( х, у), u0 = φ( х0, у0). Если взять в качестве ε то число, которое выбрано выше при рассмотрении пункта 1, то существование δ обеспечивается неравенствами (5). Остается заметить, что в рассуждениях пункта 1 положительное число ε может быть взято как угодно малым (это отмечалось в пункте 1).
Тем самым непрерывность функции u = φ( х, у) установлена. Запишем условие непрерывности функции u = φ( х, у) в точке M0’(х0, у0) в разностной форме. Обозначая через Δu полное приращение функции u = φ( х, у) в точке M0’(х0, у0), соответствующее приращениям Δx и Δy, мы получим, что Δu→0 при
3.Остается доказать дифференцируемость функции u = φ( х, у) в любой точке M’(х, у) окрестности (6). В силу замечания, сделанного в пункте 2, достаточно доказать дифференцируемость функции u = φ( х, у) в самой точке M0’(х0, у0). Чтобы это сделать, вычислим полное приращение Δu функции u = φ( х, у) в точке M0’(х0, у0), соответствующее приращениям аргументов Δx и Δy. Поскольку F(u0, х0, у0) = 0 и F(u0 + Δu, х0 + Δx, у0 + Δy) = 0, то полное приращение ΔF функции F(u, х, у) в точке M0’(х0, у0), соответствующее приращениям аргументов Δu, Δx и Δy, равно нулю. Но в силу условия дифференцируемости функции F(u, х, у) в точке M0(u0, х0, у0) это полное приращение имеет вид
Здесь все частные производные , и берутся в точке M0(u0, х0, у0); α, β и γ→0 при
Итак, мы получаем
(7)
Согласно разностной форме условия непрерывности функции u = φ( х, у) в точке M0’(х0, у0) Δu→0 при образом, можно утверждать, что α, β и γ→0 лишь при условии
По условию теоремы частная производная отлична от нуля в точке M0. Поскольку γ→0 при при достаточно малых Δx и Δy выражение не обращается в нуль. В таком случае формулу (7) можно поделить на в результате чего мы получим
(8)
По теореме о предельном значении частного двух функций можем утверждать, что
(9)
где μ и υ→0 при
Сопоставляя формулы (8) и (9), окончательно получим
(10)
Формула (10) доказывает дифференцируемость функции u = φ( х, у) в точке M0’(х0, у0). Тем самым теорема 1 полностью доказана.
З а м е ч а н и е 2. Приведенное доказательство без всяких затруднений переносится на случай неявной функции, зависящей не от двух, а от любого конечного числа аргументов x1, х2, …, xm (и, в частности, от одного аргумента). Случай двух аргументов х и у имеет лишь то преимущество, что допускает наглядную геометрическую иллюстрацию в пространстве (u, х, у).
2.Вычисление частных производных неявно заданной функции. Остановимся на вычислении частных производных функции, неявно заданной посредством уравнения (3). Пусть выполнены условия теоремы 1. Тогда для полного приращения функции u = φ(х, у) справедливо представление (10). Это представление позволяет утверждать, что частные производные функции u = φ(х, у) определяются формулами
(11)
Аналогичные формулы справедливы и для случая, когда неявно заданная функция зависит не от двух, а от любого конечного числа аргументов x1, х2, …, xm. В этом случае (k = 1, 2, …, m)
Если мы хотим обеспечить существование у неявно заданной функции u = φ( х, у) частных производных второго порядка, то, естественно, приходится усилить требования, наложенные на функцию F(u, х, у) в теореме 1, именно приходится дополнительно требовать, чтобы функция F(u, х, у) была два раза дифференцируема в рассматриваемой точке. В этих предположениях остановимся на вычислении частных производных второго порядка.
Введем полезное в дальнейшем понятие полной частной производной функции. Предположим, что нам дана дифференцируемая функция трех аргументов Ф(u, х, у), причем один из этих аргументов u сам является дифференцируемой функцией двух других аргументов х и у. Тогда функцию Ф(u, х, у) можно рассматривать как сложную функцию двух аргументов х, у. Частные производные этой сложной функции по х и у будем называть полными частными производными функции Ф(u, х, у) по х и у и обозначать символами и
По правилу дифференцирования сложной функции мы получим следующие формулы для указанных полных частных производных:
Переходим к вычислению частных производных второго порядка неявно заданной функции. Ради определенности вычислим производную у и принимая во внимание, что каждая из частных производных и зависит от трех аргументов u, х, у, первый из которых сам является функцией х и у, будем иметь
Вставляя в полученную формулу выражение , определяемое второй из формул (11), окончательно будем иметь
(12)
Совершенно аналогично вычисляются частные производные и быть вычислены и частные производные третьего и последующих порядков (при условии, что функция F(u, х, у) дифференцируема в данной точке соответствующее число раз).
П р и м е р ы. 1) Вычислить частную производную функции u = φ( х, у), заданной посредством уравнения x + y + u – e - ( x + y + u ) = 0 .
Прежде всего, пользуясь формулами (11), вычислим частные производные первого порядка = 0.
2) Тот же вопрос для функции, заданной уравнением u2 + x2 + y2 - a2 = 0. Используя формулы (11), получим , . Далее, будем иметь
3.Особые точки поверхности и плоской кривой. Рассмотрим некоторую поверхность S (плоскую кривую L), определяемую в заданной декартовой прямоугольной системе координат уравнением F(х, у, z)=0 (F(х, у,)=0). Относительно функции F(х, у, z) (F(х, у,)) предположим, что она имеет непрерывные частные производные первого порядка по всем аргументам всюду в некоторой окрестности любой точки поверхности S (кривой L). Будем называть данную точку поверхности S (кривой L) особой, если в этой точке обращаются в нуль все частные производные первого порядка функции F(х, у, z) (F(х, у,)). В окрестности особой точки нельзя применить к уравнению F(х, у, z)=0 (F(х, у,)=0) теорему 1, т. е. нельзя утверждать, что это уравнение разрешимо хотя бы относительно одной из переменных х, у, z (х, у). Таким образом, участок поверхности S (кривой L), прилегающей к особой точке, может не допускать однозначного проектирования ни на одну из координатных плоскостей (ни на одну из осей координат). Структура поверхности S (кривой L) в окрестности особой точки может быть очень сложной и требует дополнительного исследования.
Точки поверхности S (кривой L), не являющиеся особыми, принято называть обыкновенными. В окрестности обыкновенной точки действует теорема 1, так что прилегающий к обыкновенной точке участок поверхности S (кривой L) допускает однозначное проектирование хотя бы на одну из координатных плоскостей (хотя бы на одну из осей координат), что существенно облегчает исследование этого участка.
П р и м е р ы. 1) Найти особые точки кругового конуса x2 + y2 – z2 = 0.
Поскольку F(х, у, z) = x2 + y2 – z2, то , , . Единственной особой точкой является начало координат. Хорошо известно, что в окрестности этой точки поверхность конуса не может быть однозначно спроектирована ни на одну из координатных плоскостей (рис. 15.3).
2) Тот же вопрос в отношении плоской кривой x2 - y2 + x3 = 0.
Частные производные имеют вид , . Обе частные производные обращаются в нуль в двух точках плоскости (0, 0) и (- . Из этих двух точек только первая принадлежит рассматриваемой кривой, т. е. является особой. Построив кривую x2 - y2 + x3 = 0 в окрестности точки (0, 0), мы убедимся в том, что эта точка является точкой самопересечения графика (рис. 15.4). Ясно, что в окрестности этой точки кривую нельзя однозначно спроектировать ни на ось Ох, ни на ось Оу.
4.Условия, обеспечивающие существование для функции y=f(x) обратной функции. Применим теорему 1 для выяснения условий, при выполнении которых функция y=f(x) имеет в некоторой окрестности точки x0 обратную функцию x=f-1(y), определенную в некоторой окрестности точки y0, где y0= f(x0). Будем рассматривать функцию y=f(x) как функцию, определяемую функциональным уравнением вида F(х, y) = f(x) – у = 0.
Тогда вопрос о существовании обратной функции совпадает с вопросом о разрешимости относительно х указанного функционального уравнения. Как следствие теоремы 1 и замечания 1 перед доказательством этой теоремы, мы получим следующее утверждение: если функция y=f(x) имеет отличную от нуля производную в некоторой окрестности точки х0, то для этой функции в окрестности х0 существует обратная функция x=f-1(y), определенная и дифференцируемая в некоторой окрестности точки у0, где y0= f(x0). Производная указанной обратной функции в точке y0 в силу второй из формул (11) равна