microbik.ru
1

Часть 1.Функции многих переменных

Вопрос. Дать определение предела функции многих переменных, повторных пределов. Теорема о равенстве повторных пределов двойному.

Ответ.

Определение. Число А называют пределом функции при (), если

,

или

.

Геометрически это означает следующее. Пусть около значения А мы взяли сколь угодно малый отрезок . Тогда найдется такой параллелепипед с центром в точке а и со сторонами, равными 2, что как только точка х попадет в этот параллелепипед, так значение функции попадет в отрезок .



Рис. 10.4

Втрое определение отличается от первого тем, что вместо параллелепипеда фигурирует шар с центром в точке а и радиусом , и попадание точки х внутрь этого шара приводит к тому, что значение f(x) попадет в отрезок .

В силу доказанной теоремы о том, что во всякий параллелепипед можно вписать шар и, наоборот, во всякий шар можно вписать параллелепипед, эти определения эквивалентны.

Этому понятию можно дать и такое истолкование. Пусть мы приближаемся к точке а по какой-то траектории, например, по последовательности точек xi, i=1, 2, 3, … Тогда, независимо от того, по какой траектории мы приближаемся к точке а, предел последовательности (xn) будет один и тот же, и он будет равен А.

Кроме того понятия предела, которое дано выше, и которое обобщает понятие предела для функции одного переменного, для функции многих переменных существует и еще одно специфическое понятие, которого не было раньше – так называемые повторные пределы. Опишем его на примере функции двух переменных .

Пусть задана функция двух переменных х и у. Пусть точка (х, у) стремится к точке с координатами (а, b), то есть (х, у)  (а, b). Это означает, что ха и уb.



Рис. 10.5

Будем подходить к точке (а, b) двумя путями. Первый путь выглядит так: Сначала из точки (ху) перейдем в точку (хb), двигаясь параллельно оси OY, а затем из этой точки перейдем в точку (аb), двигаясь параллельно оси OX. В приложении к функции это означает, что сначала мы перешли к пределу получив некоторую функцию , а затем уже нашли , получив так называемый повторный предел

.



Рис. 10.6

Теперь пойдем от точки (ху) к точке (аb) по такой траектории: сначала перейдем в точку (ау) двигаясь параллельно оси ОХ. Тем самым мы найдем , который будет функцией от у. Затем из точки (ау), двигаясь параллельно оси OY, перейдем в точку (аb), вычисляя теперь уже . Тем самым мы нашли другой повторный предел



Таким образом, кроме двойного предела существуют еще два повторных предела и .

Встает вопрос о том, какова связь между этими величинами. Ответ на него дает следующая теорема.

Теорема. Если

1. Существует двойной предел ;

2. у существует ,

то существует и повторный предел и он равен двойному пределу, то есть =.

Доказательство.

Пусть . Это означает, что

.

Перейдем в этой строке к пределу ха. Тогда выписывать неравенство не будет необходимости, так как . Далее, так как у существует , то

,

и наша строчка кванторов примет вид

.

По определению предела функции одной переменной это и означает, что существует

.

Следствие. Если к ограничениям теоремы добавить еще, что

3. х существует ,

то существуют оба повторных предела, и они равны друг другу (так как оба они равны двойному пределу)

.


Вопрос. Полное приращение и дифференциал функции многих переменных. Теорема о том, что . Выражение через .

Ответ.

Пусть имеется функция п переменных . Изменим значение i-й переменной с xi на xi+xi. Величина



называется частным приращением функции f (x) по i-й переменной.

Величина



называется частной производной от функции f (x) по переменной xi и обозначается либо символом , либо символом .

Отметим главное: при вычислении частной производной по какой-либо переменной все остальные переменные выступают как константы.

Вектор с компонентами



называется градиентом функции f (x) и обозначается символом .

Полное приращение и дифференциал функции

Изменим теперь все переменные, заменяя на , на , …, на . Величина



называется полным приращением функции (x).

Определение 1. Если f представима в виде

, ,

то функция (x) называется дифференцируемой в точке х, а комбинация



называется дифференциалом (или, точнее, полным дифференциалом) функции (x) и обозначается d f (x).

Можно дать и другое определение дифференцируемой функции.

Определение 2. Если f представима в виде

,

где при , то функция (x) называется дифференцируемой в точке х.

Можно доказать, что эти два определения эквиваленты.

Теорема 1. Если (x) дифференцируема в точке х, то у нее в этой точке существуют все частные производные и .

Доказательство. Дадим приращение хi только одной переменной хi , а остальные переменные оставим без изменения. Тогда

,

где при хi0. Деля на хi



и устремляя к нулю, получим

,

что и требовалось доказать. 

Если взять , то , а при ji . Тогда из общего выражения для дифференциала получим, что . Окончательно, выражение для дифференциала функции (x) приобретает вид

.

Если ввести вектор , то d f можно представить в виде

.


Вопрос. Производные от сложной функции.

Ответ.

Пусть , а аргументы этой функции хi сами являются функциями переменной , то есть

, .

Мы имеем, таким образом, дело со сложной функцией

.

Наша задача – научиться вычислять частные производны от z по tk, то есть .

Будем считать, что все частные производные и , существуют и непрерывны. Отсюда будет следовать, что и и все дифференцируемы.

Изменим только одну из компонент из переменной t, скажем, tk, сделав ей приращение tk. Но тогда уже все xi изменятся на величины

.

В силу дифференцируемости , можно записать

,

где все i0 при 0. Заметим, что поэтому и все xi0 при 0.

Но раз все xi изменились на величину xi, то z изменится на величину

,

и, в силу дифференцируемости , можно записать

,

где i0 когда все xi0. Но так как при 0 как раз все xi0, то можно сказать, что все i0 когда 0.

Подставляя сюда выражение для xi, получим



.

Но так как при 0 все i и i стремятся к нулю, то и величина



стремится к нулю при 0.

Окончательно имеем

,

откуда получаем

,

что и дат формулу для вычисления производной от сложной функции от многих переменных

.


Вопрос. Производная по направлению

Ответ.

Пусть задана функция , зависящая от п-мерной переменной и пусть в нашем п-мерном пространстве задан вектор единичной длины, то есть .



Рис. 10.7

Представим себе, что из точки х, двигаясь по вектору (или в противоположном направлении) мы перешли в точку . При этом мы сместились на расстояние (см. рис. 10.7).

Тогда производной от по направлению вектора называется величина

.

Знак «+» перед берется в том случае если мы двигались по направлению вектора , знак «–» – если мы двигались против вектора .

Выведем формулу для . Так как вектор коллинеарен вектору , то их компоненты пропорциональны, то есть

.

Обозначая это общее отношение через t, получим

.

Находя , получим

,

так как . Правильный знак перед учтен тем, что записан как t.

Тогда



.

Используя формулу для производной от сложной функции и учитывая, что , получим

.

Вспоминая выражение для градиента, можно написать, что

.

Таким образом, производная от функции по какому-то направлению равна проекции градиента на это направление (см. рис. 10.8).



Рис. 10.8

Вспоминая, что и обозначая через  угол между векторами и grad f, можно записать, что

.

Так как , то

(получается при  = 0),

(получается при  = ).

Глядя на эти формулы можно сказать следующее:

вектор указывает нам, в каком направлении функция возрастает быстрее всего: функция быстрее всего возрастает при движении по направлению вектора градиента и быстрее всего убывает при движении против направления градиента.

Заметим, в заключение, что если вектор имеет произвольную длину, то

,

так как вектор имеет единичную длину и направлен в ту же сторону, что и вектор .


Вопрос. Производные от неявных функций

Ответ.

Если явно функция одной переменной х задается выражением , то ее неявное задание имеет вид уравнения , не разрешенного относительно у.

Аналогично, если у зависит от , то неявное задание этой функции имеет вид уравнения

,

не разрешенного относительно у.

В общем случае можно сразу задавать m функций в виде системы из m уравнений вида

.

Покажем, как вычисляются производные от неявно заданных функций.

Начнем со случая функции одной переменной, задаваемой уравнением . Представим себе, что мы каким-то образом решили это уравнение и нашли явную зависимость у от х: у = у(х). Если мы эту зависимость подставим в исходное уравнение, то получим тождество

.

Продифференцируем это соотношение по х. Заметим, что в левую часть аргумент х входит в двух видах: сам по себе и как аргумент у у(х). Так как справа при любых х стоит 0, то получим

,

откуда

.

Аналогично, в случае уравнения , если бы нам удалось найти явный вид зависимости и подставить его в исходное уравнение, то мы получили бы тождество

.

Дифференцируя по хi, получим

,

откуда

.

В случае системы уравнений, определяющих , если бы удалось выразить их явно, то есть найти , то, после подстановки их обратно в систему, мы получили бы систему тождеств

.

Дифференцируя каждое из тождеств, скажем, по хi, с учетом того, что хi входит как само по себе, так и через , получим

.

Эту систему можно рассматривать как систему линейных уравнений относительно , , …,. Решив ее обычными методами, можно найти сразу все частные производные.


Вопрос. Безусловный экстремум функции многих переменных. Необходимое и достаточное условие экстремума.

Ответ.

Рассмотрим вопрос о нахождении экстремума функции от п переменных .

Определение. Говорят, что в точке х0 функция имеет локальный максимум (минимум), если существует такой шар с центром в точке х0 и радиуса  > 0, что

.

Термины «локальный максимум» и «локальный минимум» объединяют в один термин «локальный экстремум»

^ Необходимое условие экстремума.

Пусть в точке функция имеет, скажем, локальный максимум. Будем отходить от точки х0 меняя лишь координату х1. Тогда

,

то есть имеет локальный максимум по координате х1. Но тогда, как это изучалось для функции одной переменной, в точке х0 должно выполняться условие

.

Аналогично модно рассуждать и в отношении всех остальных переменных. Рассматривая переменную хi, запишем

,

откуда следует, что .

Таким образом, в очке локального экстремума должно выполняться условие

; ; …; . (2)

Эти условия дают систему п уравнений с п неизвестными . Решая ее, найдем точки, «подозрительные» на экстремум, то есть точки, где может быть локальный максимум или минимум.

Заметим, что необходимые условия локального экстремума (2) можно коротко записать так: в точке локального экстремума должно выполняться условие

.

^ Достаточные условия локального экстремума.

Пусть выполнены условия (2). Во-первых, это еще не означает, что в точке х0 имеет место локальный экстремум. Во-вторых, даже если там и имеется локальный экстремум, то надо установить его тип – максимум это или минимум. Ответить на этот вопрос помогают достаточные условия экстремума.

Для их вывода напомним сначала некоторые сведения из курса алгебры по вопросу о положительной и отрицательной определенности матрицы.

Пусть имеется симметричная квадратная матрица , в которой п строк и п столбцов. Пусть, далее, есть произвольные числа. Тогда выражение



называется квадратичной формой, соответствующей матрице А.

Матрица ^ А называется положительно определенной матрицей, если Q > 0 когда хотя бы одно из чисел отлично от нуля и Q = 0 может быть тогда и только тогда, когда все . Если при тех же условиях Q < 0, то матрица А называется отрицательно определенной. Если  такие, что ^ Q > 0 и  такие, что Q < 0, то матрица А называется неопределенной.

Для определения типа матрицы А существует так называемый критерий Сильвестра. Пусть

.

Рассмотрим ее миноры

; , ; … ;

.

Если выполнено условие

; ; ; …; ,

то матрица А положительно определенная. Если выполнено условие

; ; ; …,

то есть все нечетные миноры меньше нуля, а все четные – больше нуля, то матрица ^ А отрицательно определенная. Во всех остальных случаях расстановки знаков  и  матрица А неопределенная.

Заметим только, что при возникновении ситуации, когда для какого-то i Ai = 0, вопрос о типе матрицы А критерий Сильвестра не решает.

Конкретизируем теперь вид матрицы ^ А. Пусть элементы матрицы А имеют вид

, (3)

где все производные вычисляются в точке х0 предполагаемого экстремума.

Теорема. Если матрица А положительно определенная, то в точке х0 локальный минимум.

Если матрица ^ А отрицательно определенная, то в точке х0 локальный максимум.

Если матрица А неопределенная, то в точке х0 нет ни локального максимума, ни локального минимума.

Доказательство. Мы докажем эту теорему не слишком строго.

Разложим в ряд Тейлора в окрестности точки х0. Обозначая и вспоминая, что в точке х0 имеет место , получим

,

где аij определены в (3).

Пусть теперь матрица положительно определенная. Тогда , когда хотя бы одно из . Но тогда, по крайней мере в некоторой окрестности точки х0, будет выполнено условие и в точке х0 будет локальный минимум.

Если же матрица А отрицательно определенная, то , и, по крайней мере в некоторой окрестности точки х0, будет выполнено условие и в точке х0 будет локальный максимум.

Если же матрица А неопределенная, то такие, что , и тогда , но и такие, что , и тогда . Поэтому в данном случае в точке х0 нет ни максимума, ни минимума. 

В заключение еще раз отметим, что мы пренебрегли следующим членом в разложении в ряд Тейлора. Поэтому все эти рассуждения верны лишь в некоторой окрестности точки х0 и наши возможные минимум и максимум являются лишь локальными.


Вопрос. Условный экстремум. Метод Лагранжа.

Ответ.

В жизни всегда приходится подчиняться каким-то ограничениям, наложенным на нас природой, обществом, финансами и т.д. Математически эта ситуация формализуется как задача нахождения экстремума некоторой функции п переменных при наличии ограничений. Эти ограничения могут иметь самый разнообразный вид, но ниже будет рассмотрена лишь простейшая ситуация, когда задача выглядит так: найти максимум или минимум функции



при наличии ограничений на переменные вида



Наличие ограничений (условий) дает и имя этой задачи: она называется задачей на условный экстремум.

Подобные задачи принято решать так называемым методом неопределенных множителей Лагранжа, который дает лишь необходимые условия экстремума. Не вдаваясь в его общий вывод, рассмотрим его основные идеи на простейшей ситуации.

Итак, пусть нужно найти максимум функции двух переменных при наличии единственного ограничения , то есть решить задачу



Будем рассуждать следующим образом: Условие «вырезает» на плоскости некоторую кривую, и мы можем двигаться лишь по этой кривой (см. рис. 10.10).



Рис. 10.10

Пусть мы находимся в какой-то точке . Построим в этой точке вектор градиента и спроектируем его на касательную к этой кривой. Вспомним, что проекция градиента на какое-то направление дает производную по этому направлению. Поэтому, если мы желаем увеличить , мы должны двигаться по кривой в том направлении, куда указывает проекция градиента.

До каких же пор наше движение будет приводить к увеличению ? Очевидно, что это увеличе­ние окончится тогда, когда производ-

ная по направлению касательной будет равна нулю. Это произойдет тогда, когда будет перпендикулярен касательной, то есть будет параллелен нормали к кривой.

Но вектор нормали . Условие, что коллинеарен нормали, приводит к условию

.

Обозначая это отношение через , придем к системе уравнений



В этой системе три уравнения, неизвестных также три – это х, у и . Так что, решив эту систему, мы получим точку, «подозрительную» на экстремум. Значение  можно выбросить.

В общем случае рассуждения выглядят следующим образом: пусть надо решить задачу

,



Направление возрастания функции указывает вектор . С другой стороны, условие вырезает из нашего п-мерного пространства некоторую гиперповерхность размерности п  1. Вектор нормали к этой гиперповерхности имеет вид

.

Рассмотрим линейное многообразие, образованное этими векторами, то есть совокупность векторов вида

.

Тогда точки, «подозрительные на экстремум, должны определяться тем условием, что вектор градиента принадлежит этому многообразию, то есть такие, что

.

В компонентах это выглядит так:

(4)

Добавляя сюда ограничения задачи

(5)

мы получим систему из п  т уравнений относительно п  т неизвестных , , решая которую и найдем возможные точки экстремума.

Формально это выглядит так: составляется так называемая функция Лагранжа

.

Появляющиеся здесь сомножители называются неопределенными множителями Лагранжа. Система уравнений, определяющая возможные точки экстремума, выглядит так



Уравнения дают систему (4), уравнения  систему (5).

В более общем виде этот метод превращается в так называемую теорему Куна-Таккера, изложение которой выходит за рамки этого курса.