Экстремумы функций многих переменных.

Содержание:

  1. Необходимые условия экстремума.
  2. Достаточные условия экстремума.

Необходимые условия экстремума.

Пусть функция \(f(x)\) определена в области \(G \subset \boldsymbol{R}^{n}\) и пусть \(x^{0} = (x_{1}^{0}, \ldots, x_{n}^{0}) \in G\). Назовем \(x_{0}\) точкой (локального) минимума функции \(f(x)\), если найдется такой шар \(S_{\delta}(x^{0}) \subset G\), что для всех \(x \subset S_{\delta}(x^{0})\) выполнено неравенство \(f(x) \geq f(x^{0})\). Назовем точку \(x^{0}\) точкой строгого минимума функции \(f(x)\), если найдется такой шар \(S_{\delta}(x^{0}) \in G\), что для всех \(x \in S_{\delta}(x^{0})\) (т. е. для всех точек шара, не совпадающих с его центром) выполнено неравенство \(f(x) \geq f(x^{0})\).

Аналогично определяются точки максимума (строгого максимума) функции \(f(x)\). Точки максимума и минимума функции называются точками экстремума.


Теорема 1.

Если в точке экстремума \(x^{0}\) функции \(f(x)\) существует частная производная \(\displaystyle\frac{\partial f}{\partial x_{k}} (x^{0})\), то она равна нулю.

Доказательство.

\(\circ\) Пусть, например, существует \(\displaystyle\frac{\partial f}{\partial x_{1}} (x^{0})\). Рассмотрим функцию одной переменной
$$
\varphi(x_{1}) = f(x_{1}, x_{2}^{0}, \ldots, x_{n}^{0}).\nonumber
$$

Так как \(x^{0}\) — точка экстремума (пусть, например, минимума), то существует шар \(S_{\delta}(x^{0})\) такой, что \(f(x) \geq f(x^{0})\) для всех точек этого шара. В частности, для любого \(x_{1} \in (x_{1}^{0} - \delta, x_{1}^{0} + \delta)\) должно быть выполнено неравенство
$$
\varphi(x_{1}) = f(x_{1}, x_{2}^{0}, \ldots, x_{n}^{0}) \geq f(x_{1}^{0}, \ldots, x_{n}^{0}) = \varphi(x_{1}^{0}).\nonumber
$$
Функция одной переменной \(\varphi(x_{1})\) имеет в точке \(x_{1}^{0}\) минимум. Поэтому
$$
\frac{d\varphi}{dx_{1}} (x_{1}^{0}) = 0,\ \mbox{т. е.}\ \frac{\partial f}{\partial x_{1}} (x^{0}) = 0.\ \bullet\nonumber
$$


Следствие.

Если в точке экстремума \(x^{0}\) функция \(f(x)\) дифференцируема, то
$$
df(x^{0}) = \sum_{i=1}^{n} \frac{\partial f}{\partial x_{i}} (x^{0}) dx_{i} = 0.\label{ref1'}
$$

\(\circ\) Действительно, так как в точке \(x^{0}\) функция \(f(x)\) дифференцируема, то в этой точке существуют частные производные \(\displaystyle\frac{\partial f}{\partial x_{i}} (x^{0})\), \(i = \overline{1, n}\), а так как \(x^{0}\) есть точка экстремума, то \(\displaystyle\frac{\partial f}{\partial x_{i}} (x^{0}) = 0\). Отсюда следует равенство \eqref{ref1'}. \(\bullet\)


Если функция \(f(x)\) дифференцируема в точке \(x^{0}\) и \(df(x^{0}) = 0\), то точка \(x^{0}\) называется стационарной точкой функции \(f(x)\). Точка экстремума дифференцируемой функции в силу необходимых условий экстремума будет стационарной точкой. Обратное утверждение неверно. Стационарная точка может не быть точкой экстремума.

Пример 1.

Показать, что (0,0) является стационарной точкой функции \(f(x, y) = xy\), но (0,0) не есть точка экстремума этой функции.

Решение.

\(\vartriangle\) Так как \(df (x, y) = y\ dx + x\ dy\), то \(df(0, 0) = 0\) и (0, 0) есть стационарная точка функции \(f(x, y)\). Но для любого \(\delta\;>\;0\) точки \((\delta, \delta)\) и \((\delta, -\delta)\) лежат в круге \(S_{2\delta}(0, 0)\) и
$$
f(\delta, \delta) = \delta^{2}\;>\;f(0, 0) = 0,\quad f(\delta, -\delta) = -\delta^{2}\;<\;f(0, 0) = 0.\nonumber
$$

Поэтому (0, 0) не есть точка экстремума функции \(f(x, y)\). График функции \(z = xy\) изображен на рис. 59.1. \(\blacktriangle\)

Рис. 59.1
Рис. 59.1

Лемма 1.

Если функция одной переменной \(\varphi(t)\) имеет производные первого и второго порядков в точке минимума \(t = 0\), то \(\varphi''(0) \geq 0\).

Доказательство.

\(\circ\) Пусть \(t = 0\) является точкой минимума функции \(\varphi(t)\). Тогда найдется число \(\varepsilon\;>\;0\) такое, что для всех \(|t|\;<\;\varepsilon\) выполняется неравенство \(\varphi(t) - \varphi(0) \geq 0\). Применяя разложение функции \(\varphi(t)\) по формуле Тейлора с остаточным членом в форме Пеано, получаем, воспользовавшись тем, что в точке минимума \(\varphi'(0) = 0\):
$$
0 \leq \frac{\varphi(t) - \varphi(0)}{t^{2}} = \frac{1}{t^{2}} \left[\varphi'(0)t + \varphi''(0)\frac{t^{2}}{2} + o(t^{2})\right] = \frac{1}{2} \varphi''(0) + o(1)\label{ref1}
$$
при \(t \rightarrow 0\).

Переходя в этом неравенстве к пределу при \(t \rightarrow 0\), получаем, что \(\varphi''(0) \geq 0\). \(\bullet\)


Теорема 2 (необходимое условие минимума).

Пусть функция \(f(x)\) имеет в окрестности точки минимума \(x^{0} \in \boldsymbol{R}^{n}\) непрерывные частные производные первого и второго порядка. Тогда
$$
df(x^{0}) = 0,\quad d^{2}f(x^{0}) = \sum_{i=1}^{n} \sum_{j=1}^{n} \frac{\partial^{2}f}{\partial x_{i} \partial x_{j}} (x^{0}) dx_{i} dx_{j} \geq 0.\label{ref2}
$$

Доказательство.

\(\circ\) Пусть \(x^{0}\) — точка минимума функции \(f(x)\). Тогда найдется шар \(S_{\delta}(x^{0})\) такой, что при всех \(\xi \in S_{\delta}(x^{0})\) выполнено неравенство \(f(\xi) - f(x^{0}) \geq 0\). Пусть \(x \in \boldsymbol{R}^{n}\) и \(x \neq x^{0}\), тогда \(|\Delta x| = \rho (x, x^{0})\;>\;0\). При любом \(t\) таком, что \(|t|\;<\;\displaystyle\frac{\delta}{|\Delta x|}\), точка \(x^{0} + t\Delta x \in S_{\delta}(x^{0})\), и поэтому \(\varphi(t) = f(x^{0} + t\Delta x) - f(x^{0}) \geq 0\). Функция \(\varphi(t)\) определена в окрестности точки \(t = 0\) и имеет при \(t = 0\) минимум. В силу формул (4) и (5), § 58 функция \(\varphi(t)\) имеет в точке \(t = 0\) производные первого и второго порядков, причем
$$
\varphi'(0) = \sum_{i=1}^{n} \frac{\partial f}{\partial x_{i}} (x^{0}) dx_{i} = df(x^{0}),\nonumber
$$
$$
\varphi''(0) = \sum_{i=1}^{n} \sum_{j=1}^{n} \frac{\partial^{2}f(x^{0})}{\partial x_{i} \partial x_{j}}  dx_{i} dx_{j} = d^{2} f(x^{0}).\nonumber
$$
Так как в силу леммы 1 должно выполняться неравенство \(\varphi''(0) \geq 0\), то \(d^{2} f(x^{0}) \geq 0\). \(\bullet\)


Аналогично доказывается, что для функции \(f(x)\), дважды непрерывно дифференцируемой в окрестности точки максимума \(x^{0}\), выполняются условия
$$
df(x^{0}) = 0,\quad d^{2} f(x^{0}) \leq 0.\nonumber
$$


Замечание.

Условия \(df(x^{0}) = 0\) и \(d^{2} f(x^{0}) \geq 0\) необходимы, но не достаточны для того, чтобы точка \(x^{0}\) была точкой минимума. Например, функция \(f(x, y) = x^{3} + y^{3}\) имеет единственную стационарную точку \(x = y = 0\), и в этой точке \(d^{2}f(0, 0) = 0\). Легко убедиться, что функция \(f(x, y)\) не имеет экстремума в точке (0,0).


Достаточные условия экстремума.

При доказательстве достаточных условии потребуются некоторые сведения о квадратичных формах. Напомним, что квадратичная форма
$$
\Phi(\xi) = \sum_{i=1}^{n} \sum_{j=1}^{n} a_{ij}\xi_{i}\xi_{j},\label{ref3}
$$
где \(\xi = (\xi_{1}, \ldots, \xi_{n}) \in \boldsymbol{R}^{n}\), \(a_{ij} = a_{ji}\), называется:

  1. положительно определенной, если \(\Phi(\xi)\;>\;0\) для любого \(\xi \neq 0\);
  2. отрицательно определенной, если \(\Phi(\xi)\;<\;0\) для любого \(\xi \neq 0\);
  3. неопределенной, если существуют \(\xi\) и \(\xi'\) такие, что \(\Phi(\xi)\;>\;0\), а \(\Phi(\xi')\;<\;0\).

Квадратичная форма положительно определена в том и только том случае, когда все главные миноры ее матрицы положительны (критерий Сильвестра положительной определенности квадратичной формы), т. е.
$$
\Delta_{1} = a_{11}\;>\;0,\quad \Delta_{2} = \begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix} >0, \ldots,\quad \Delta_{n} = \begin{vmatrix}a_{11}&\ldots& a_{1n}\\....&....&....\\a_{n1}&\ldots&a_{nn}\end{vmatrix}\;>\;0.\label{ref4}
$$

Заметим также, что квадратичная форма \(\Phi(\xi)\) отрицательно определена в том и только том случае, когда квадратичная форма \(-\Phi(\xi)\) положительно определена.


Лемма 2.

Если квадратичная форма \(\Phi(\xi)\) положительно определена, то найдется такое положительное число \(\gamma\), что
$$
\Phi(\xi) \geq \gamma|\xi|^{2},\ \mbox{где}\ |\xi| = \sqrt{\xi_{1}^{2} + \ldots + \xi_{n}^{2}}.\label{ref5}
$$
\(\circ\) Рассмотрим квадратичную форму \(\Phi(\eta)\) на сфере
$$
S = \{\eta: \eta_{1}^{2} + \ldots + \eta_{1}^{2} = 1\}.\nonumber
$$

Так как точка \(0 \notin S\), а квадратичная форма положительно определена, то \(\Phi(\eta)\;>\;0\) в любой точке \(\eta \in S\).

Очевидно, что \(S\) есть замкнутое и ограниченное множество в \(\boldsymbol{R}^{n}\). Непрерывная на компакте \(S\) функция \(\Phi(\eta)\) принимает в некоторой точке \(\overline{\eta} \in S\) свое наименьшее на \(S\) значение (теорема Вейерштрасса). Поэтому, полагая \(\gamma = \Phi(\overline{\eta})\), получаем, что \(\gamma\;>\;0\) и что для любой точки \(\eta \in S\) выполняется неравенство \(\Phi(\eta) \geq \gamma\).

Если \(\xi \neq 0\), то точка \(\xi/|\xi|\) принадлежит сфере \(S\). Поэтому
$$
\Phi \left(\frac{\xi}{|\xi|}\right) \geq \gamma.\nonumber
$$

Пользуясь однородностью квадратичной формы, получаем
$$
\frac{1}{|\xi|^{2}} \Phi(\xi) = \Phi \left(\frac{\xi}{|\xi|}\right) \geq \gamma.\ \bullet\nonumber
$$


Теорема 3 (достаточные условия экстремума).

Пусть функция \(f(x)\) имеет в окрестности точки \(x^{0} \in \boldsymbol{R}^{n}\) непрерывные частные производные второго порядка, и пусть \(df(x^{0}) = 0\). Тогда если второй дифференциал \(d^{2}f(x^{0})\) есть положительно определенная квадратичная форма (см. формулу \eqref{ref2}), то \(x^{0}\) — точка строгого минимума функции \(f(x)\), если \(d^{2}f(x^{0})\) — отрицательно определенная квадратичная форма, то \(x^{0}\) — точка строгого максимума функции \(f(x)\), если \(d^{2}f(x^{0})\) — неопределенная квадратичная форма, то функция \(f(x)\) не имеет экстремума в точке \(x^{0}\).

Доказательство.

\(\circ\) Воспользуемся формулой (6) из § 58 при \(m = 2\). Учитывая, что \(df(x^{0}) = 0\), получаем
$$
f(x) - f(x^{0}) = \frac{1}{2} d^{2}f(x^{0}) + o(|\Delta x|^{2})\ \mbox{при}\ |\Delta x| \rightarrow 0,\label{ref6}
$$
где
$$
|\Delta x|^{2} = \Delta x_{1}^{2} + \ldots + \Delta x_{n}^{2}.\nonumber
$$
Пусть
$$
d^{2}f(x^{0}) = \sum_{i=1}^{n} \sum_{j=1}^{n} \frac{\partial^{2}f(x^{0})}{\partial x_{i} \partial x_{j}}  \Delta x_{i} \Delta x_{j}\nonumber
$$
есть положительно определенная квадратичная форма. В силу леммы 2 существует такое положительное число \(\gamma\), что
$$
d^{2}f(x^{0}) \geq \gamma |\Delta x|^{2}.\nonumber
$$
Применяя это неравенство к формуле \eqref{ref6}, получаем
$$
f(x) - f(x^{0}) = \frac{\gamma}{2} |\Delta x|^{2} + o(|\Delta x|^{2}) = \frac{\gamma}{2} |\Delta x|^{2} (1 + \alpha(\Delta x)),\label{ref7}
$$
где \(\alpha(\Delta x) \rightarrow 0\) при \(\Delta x \rightarrow 0\), откуда следует, что найдется шар \(S_{\delta}(x^{0})\) такой, что \(\forall x \in S_{\delta}(x^{0})\) выполнено неравенство \(|\alpha(\Delta x)|\;<\;\displaystyle\frac{1}{2}\).

Тогда из формулы \eqref{ref7} следует, что \(\forall x \in \dot{S}_{\delta}(x^{0})\) выполнено неравенство
$$
f(x) - f(x^{0}) \geq \frac{\gamma}{2} |\Delta x|^{2} (1 - |\alpha(\Delta x)|) \geq \frac{\gamma}{4} |\Delta x|^{2}\;>\;0.
$$
Следовательно, \(x^{0}\) — точка строгого минимума функции \(f(x)\).

Аналогично доказывается, что в том случае, когда \(d^{2}f(x^{0})\) есть отрицательно определенная квадратичная форма, \(x^{0}\) — точка строгого максимума функции \(f(x)\).

Если \(d^{2}f(x^{0})\) есть неопределенная квадратичная форма, то не выполняется необходимое условие минимума \(d^{2}f(x^{0}) \geq 0\) (см. теорему 2). Поэтому \(x^{0}\) не есть точка минимума функции \(f(x)\). Аналогично доказывается, что \(x^{0}\) не есть точка минимума функций \(-f(x)\), т. е. точка максимума функции \(f(x)\). \(\bullet\)


Пример 2.

Исследовать на экстремум функцию
$$
f(x, y, z) = x^{2} + 2xy + 4xz + 8yz + 5y^{2} + 9z^{2}.\nonumber
$$

Решение.

\(\vartriangle\) Найдем стационарные точки функции \(f(x, y, z)\). Они определяются из системы уравнений
$$
\frac{\partial f}{\partial x} = 2x + 2y + 4z = 0,\quad \frac{\partial f}{\partial y} = 2x + 10y + 8z = 0,\quad \frac{\partial f}{\partial z} = 4x + 8y + 18z = 0.\nonumber
$$
Определитель этой системы
$$
\begin{vmatrix}2&2&4\\2&10&8\\4&8&18\end{vmatrix} = 8\begin{vmatrix}1&1&2\\1&5&4\\2&4&9\end{vmatrix} = 8 \cdot 16\;>\;0.\nonumber
$$
Поэтому единственное решение однородной системы есть \(x = y = z = 0\).

Итак, функция \(f(x, y, z)\) имеет единственную стационарную точку (0,0,0). Найдем \(d^{2}f(0, 0, 0)\). Имеем
$$
d^{2}f(0, 0, 0) = 2\ dx^{2} + 4\ dx\ dy + 8\ dx\ dz + 16\ dy\ dz + 10\ dy^{2} + 18\ dz^{2}.\nonumber
$$
Так как
$$
\Delta_{1} = 2\;>\;0,\quad \Delta_{2} = \begin{vmatrix}2&2\\2&10\end{vmatrix}\;>\;0,\quad \Delta_{3} = \begin{vmatrix}2&2&4\\2&10&8\\4&8&18\end{vmatrix} = 8 \cdot 16\;>\;0,\nonumber
$$
то в силу критерия Сильвестра квадратичная форма \(d^{2}f(0, 0, 0)\) положительно определена. Точка (0,0,0) является точкой строгого минимума функции \(f(x, y, z)\). \(\blacktriangle\)