8.4. Выпуклые функции
Определение 8.2. Пусть f:E→R и промежуток (a,b)⊂E (a,b∈¯R).
Функция f называется выпуклой вниз (выпуклой) на (a,b), если ∀x1,x2,x1≠x2 ∀t∈(0,1) имеет место неравенство f((1-t)x_1 + t x_2) \leqslant (1-t)f(x_1) + tf(x_2).
Функция f называется выпуклой вверх (вогнутой) на (a, b), если \forall x_1, x_2, x_1 \neq x_2\ \forall t\in (0,1) имеет место неравенство f((1-t)x_1 + t x_2) \geqslant (1-t)f(x_1) + tf(x_2).
Если неравенства в формулах строгие, то говорят о строгой выпуклости вверх и вниз.
Замечание. Каждая точка хорды с концами (x_1, f(x_1)) и (x_2, f(x_2)) может быть записана в виде ((1-t)x_1 + t x_2, (1-t)f(x_1) + tf(x_2)), t \in [0, 1]. Тогда условие (строгой) выпуклости вниз функции f на (a, b) геометрически означает, что график f лежит не выше (строго ниже) любой его хорды (исключая концы). (figure 8.1)
Выпуклость вверх функции f очевидно равносильна выпуклости вниз функции -f. Поэтому в утверждениях можно ограничиться случаем выпуклости вниз.
Лемма 8.1. Пусть f выпукла вниз на промежутке (a, b) и дифференцируема в x_0 \in (a, b). Тогда \forall x\in (a, b) выполнено неравенство
f(x) \geqslant f(x_0) + f'(x)(x-x_0)\ \mathbf{(*)}.
\blacktriangle Пусть f выпукла вниз на (a, b) и x \in (a, b), x\neq x_0 (при x=x_0 (*) верно). При t\in (0, 1) условие выпуклости вниз f((1-t)x_1 + t x_2) \leqslant (1-t)f(x_1) + tf(x_2) перепишем в виде
(x-x_0)\frac{f(x_0 + t(x-x_0)) - f(x_0)}{t(x-x_0)} \leqslant f(x) - f(x_0).
Перейдём в полученном неравенстве к пределу при t\to 0. Тогда по Т4.10 о замене переменной в пределе
\lim \limits _{t\to 0} \frac{f(x_0 + t(x-x_0)) - f(x_0)}{t(x-x_0)} \stackrel{\scriptscriptstyle \Delta x = t(x-x_0)}{=} \lim \limits _{\Delta x\to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} = f'(x_0),
откуда следует (*). \blacksquare
Замечание. В условиях леммы 8.1 график функции f лежит не ниже касательной, проведённой в точке x_0.
Лемма 8.2. Пусть f дифференцируема на промежутке (a, b) и f' нестрого возрастает на (a, b), тогда \forall x_0, x \in (a, b), x_0\neq x выполнено неравенство (*).
\blacktriangle Рассмотрим случай x > x_0 (случай x < x_0 аналогичен). Применяя к сужению f на [x_0, x] Т. Лагранжа о среднем, получим, что для некоторой точки c \in (x_0, x) имеет место равенство:
f(x) - f(x_0) - f'(x_0)(x - x_0) = f'(c)(x - x_0) - f'(x_0)(x - x_0) = (f'(c) - f'(x_0))(x - x_0).
Поскольку f' нестрого возрастает на (a, b), c > x_0, то (f'(c) - f'(x_0))(x - x_0) \geqslant 0, значит (*) верно. \blacksquare
Замечание. Если f' строго возрастает на (a, b), то выполнено строгое неравенство
f(x) > f(x_0) + f'(x_0)(x - x_0).
Теорема 8.4. Пусть f\colon E\to \mathbb {R} дифференцируема на промежутке (a, b), тогда:
f выпукла вниз на (a, b) \Leftrightarrow f' нестрого возрастает на (a, b).
Если f' строго возрастает на (a, b), то f' строго выпукла вниз на (a, b).
\blacktriangle (\Rightarrow ) Пусть f выпукла вниз на (a, b), x_1, x_2 \in (a, b) и x_1 < x_2. Применяя неравенство (*) (по Л8.1), имеем:
f(x_2) \geqslant f(x_1) + f'(x_1)(x_2 - x_1),
f(x_1) \geqslant f(x_2) + f'(x_2)(x_1 - x_2).
Складывая эти неравенства, получим: 0 \geqslant (f'(x_1) - f'(x_2))(x_2 - x_1) Т.к. x_2 > x_1, то из последнего неравенства вытекает, что f'(x_2) > f'(x_1), т.е. f' нестрого возрастает на (a, b).
(\Leftarrow ) Пусть f' нестрого возрастает на (a, b). Зафиксируем x_1, x_2 \in (a, b), x_1 \neq x_2, и t \in (0, 1). Положим x_0 = (1 - t)x_1 + t x_2. Тогда по неравенству (*) (по Л8.2) имеем:
f(x_1) \geqslant f(x_0) + f'(x_0)(x_1 - x_0) | \times (1-t),
f(x_2) \geqslant f(x_0) + f'(x_0)(x_2 - x_0) | \times t.
(1 - t)f(x_1) + tf(x_2) \geqslant f(x_0) + f'(x_0)((1-t)x_1 + tx_2 - x_0) = f((1 - t)x_1 + t x_2),
т.е. функция f выпукла вниз на (a, b).
Утверждение пункта 2 вытекает из замечания к Л8.2. \blacksquare
Следствие. Пусть f\colon E\to \mathbb {R} дважды дифференцируема на промежутке (a, b), тогда f выпукла вниз на (a, b) \Leftrightarrow f'' \geqslant 0 на (a, b).
Вопрос: Верно ли утверждение 2) в Т8.4 в обратную сторону? Ответ: Верно.
\blacktriangle Пусть f строго выпукла на (a, b) \Rightarrow f' нестрого возрастает на (a, b). Пусть \exists x_1, x_2 \in (a, b)\colon x_1 < x_2 и f'(x_1) = f'(x_2), тогда f' постоянна на (x_1, x_2), т.е. f'(x) = k\ \forall x \in (x_1, x_2). Рассмотрим g = f(x) - kx, т.к. g'(x) = 0 на (x_1, x_2) \Rightarrow g(x) = b, т.е. f(x) = kx+b на (x_1, x_2). Противоречие (f — строго выпукла на (x_1, x_2)). \blacksquare
Замечание. Таким образом, выполняется следующее условие:
f строго выпукла на (a, b) \Leftrightarrow f' строго возрастает на (a, b).
Из последних двух замечаний следует, что если f дифференцируема на (a, b) и строго выпукла вниз, то \forall x, x_0 \in (a, b), x\neq x_0\colon f(x) > f(x_0) + f'(x_0)(x - x_0).
Пример: а) f(x) = e^ x, f'(x) = e^ x, f''(x) = e^ x > 0 на \mathbb {R}\Rightarrow f строго выпукла вниз на \mathbb {R}, тогда e^ x > 1 + x, x \neq 0.
б) f(x) = \ln (1 + x), f'(x) = \frac1{1+x}, f''(x) = -\frac1{(1+x)^2} < 0 \Rightarrow f строго выпукла вверх на \mathbb {R}, тогда \ln (1 + x) < x, x > -1, x\neq 0.
Определение 8.3. Точка x_0 называется точкой перегиба f\colon E\to \mathbb {R}, если
f непрерывна в некоторой окрестности B_\delta (x_0) \subset E,
\exists f'(x_0) \in \overline{\mathbb {R}},
f выпукла вверх (вниз) на (x_0-\delta , x_0) и выпукла вниз (вверх) на (x_0, x_0+\delta ).
Теорема 8.5. Пусть f\colon E\to \mathbb {R} непрерывна в точке x_0, \exists f'(x_0)\in \overline{\mathbb {R}} и дважды дифференцируема в B_\delta '(x_0). Если при переходе через x_0 f'' меняет знак, то x_0 — точка перегиба функции f.
\blacktriangle Вытекает из определения точки перегиба и следствия Т8.4. \blacksquare