Пусть отображение f:X→Yинъективно, то есть не склеивает
точки. Если представить себе его в виде картинки со стрелочками (см.
рис. 18.1 слева), это будет
означать, что нет двух стрелочек, приходящих в один и тот же элемент множества
Y. Обратим направления всех стрелочек (тот же рис. справа).
Теперь из некоторых (но может быть не
всех) точек множества Y выходит по одной стрелочке, ведущей в X. Так мы
получили новое отображение. Оно называется обратным к отображению f и
обозначается f−1.
Не нужно путать верхний индекс −1, который здесь используется, с обычной
минус первой степенью. Иными словами,
f−1(x)≠1f(x).
Какова область определения f−1? Это множество всех точек X, в которые
входит стрелочка, соответствующая отображению f. Иными словами, это множество
тех точек, в которые переходят какие-то точки из X, то есть полный образ
X под действием f. Он обозначается f(X):
f(X):={f(x)∣x∈X}⊂Y;f−1:f(X)→X.
Если отображение fбиективно, то f(X)=Y и обратное
действует из Y в X.
Как записать формально, что значит, что мы «обратили стрелочки»? Возьмём любую
точку x∈X. Подействуем на неё отображеним f, получим точку f(x)∈Y.
Теперь подействуем на f(x) отображением f−1. Мы обязаны вернуться в x.
Итак, можно дать формальное определение.
Определение 1. Пусть f:X→Y — некоторое инъективное отображение. Отображение
g:f(X)→X называется обратным к отображению f, если для
всякого x∈X
g(f(x))=x.
В этом случае g обозначается через f−1.
Замечание 1. Если отображение f биективно, то для всех y∈Y
f(f−1(y))=y,(18.1)
то есть f является обратным к f−1. Иными словами, f является
обратным отображением к своему обратному отображению. Если f не является
биективным, но является инъективным, равенство (18.1) выполняется
для всех y∈f(X).
Рассмотрим функцию f, заданную графиком. Как понять, является ли она обратимой
(то есть инъективной)? Для этого надо провести всевозможные горизонтальные
прямые и посмотреть на их точки пересечения с графиком y=f(x), см.
18.2. Если есть горизонтальные прямые, пересекающие график
в двух и более точках, функция необратима. Действительно, пусть прямая y=c
пересекает график y=f(x) в двух точках: (x1,c) и (x2,c), x1≠x2. Тогда, по определению графика, это означает, что f(x1)=c и f(x2)=c, и
значит функция необратима.
Если же все горизонтальные прямые пересекают график не более, чем в одной точке,
обратная функция существует, см. рис. 18.3. Если прямая
y=c не пересекает график функции f вообще, это означает, что точка c не
лежит в области значений f и обратная функция в ней не определена. Если прямая
y=c пересекает график ровно в одной точке, обозначим эту точку через (x1,c). Тогда f(x1)=c и стало быть f−1(c)=x1. Таким образом, мы однозначно
определили f−1 во всех точках, в которых эта функция определена.
Пример 1. Рассмотрим функцию f:R→R, f(x)=x2. Является
ли эта функция обратимой? Нет, не является: например, прямая y=1
пересекает график в двух точках: (−1,1) и (1,1), см.
рис. 18.4 слева.
Рис. 18.4: Функция f(x)=x2 не является обратимой всюду, но становится
обратимой, если её ограничить на неотрицательные числа
Однако, можно рассмотреть ограничение функции f на подмножество [0,+∞), то есть рассмотреть новую функцию ~f, заданную следующим
образом:
~f:[0,+∞)→R,∀x∈[0,+∞):~f(x)=f(x).
Обозначают ~f=f|[0,+∞).
Графиком ~f будет правая ветвь параболы (см. тот же рисунок,
справа), и, в отличие от исходной функции f, функция ~f является
обратимой. Её обратной является квадратный корень (вернее, арифметический
квадратный корень): ~f−1(y)=√y. Областью определения
обратной является множество [0,+∞), поскольку квадраты вещественных
чисел неотрицательны.
Вопрос 1. Найдите обратную к функции f|(−∞,0], то есть ограничению f на
множество неположительных чисел.
Неверный ответ.
Нет. Подсказка: область определения обратной должна совпадать с областью
значения исходной функции, а область значений исходной функции
— все неотрицательные числа.
Неверный ответ.
Нет. Подсказка: область определения обратной должна совпадать с областью
значения исходной функции, а область значений исходной функции
— все неотрицательные числа.
Верный ответ.
Так и есть! При неотрицательных x равенство верно, а при x<0,
x2=(−x)2 и √x2=√(−x)2=−x (поскольку корень
обязан принимать неотрицательные значения). Значит,
√x2=|x|.
Пример 2. Функция f(x)=sinx также не является обратимой на всей области
определения, но её ограничение на отрезок [−π/2,π/2] обратимо.
Обратная к этому ограничению называется арксинусом:
arcsin:[−1,1]→[−π/2,π/2].
import matplotlib.pyplot as plt
import numpy as np
import qqmbr.odebook as ob
# see https://github.com/ischurov/qqmbr/blob/master/qqmbr/odebook.py
plt.figure(figsize=(5, 2))
x = np.linspace(-5, 5, 200)
plt.plot(x, np.sin(x))
x_prime = np.linspace(-np.pi / 2, np.pi / 2, 200)
plt.plot(x_prime, np.sin(x_prime))
ob.center_spines(grid=False, minor_ticks=False)
ob.settle_axes(xmin=-5.2, xmax=5.2, ymin=-1.3, ymax=1.3,
xlabel="x", ylabel="y", axlabelshift=1.3)
plt.yticks([-1, 1])
plt.xticks([-np.pi, -np.pi/2, np.pi/2, np.pi],
[r"$-\pi$", r"$-\pi/2$", r"$\pi/2$", r"$\pi$"])
Рис. 18.5: Синус не является обратимой функцией, но его ограничение на
[−π/2,π/2] обратимо
Вопрос 3. Найдите обратную к функции sin|[−3π/2,−π/2].
Неверный ответ.
Множеством значений обратной функции является область
определения исходной. Например, если подставить y=0, получится
π, что лежит вне области определения нашей функции.
Верный ответ.
Верно! Наверное, самый разумный способ понять, какой ответ
правильный, такой: построить график, провести горизонтальную
прямую y=c и отметить две точки на графике: одна соответствует
arcsin(c), а другая — искомой обратной функции. И понять, как
связаны их x-координаты.
Если выбрать одинаковые масштабы горизонтальной и вертикальной оси и нарисовать
на одной и той же картинке графики функций y=x2, x≥0 и y=√x, мы
увидим, что они получаются друг из друга отражением относительно прямой y=x,
см. рис. 18.6 слева.
Это неудивительно: чтобы превратить график x2 в √x, нужно поменять
ролями вертикальную и горизонтальную оси, и отражение относительно y=x делает
именно это. Можно представить себе, что наша картинка нарисована на прозрачной
плёнке. Мы подняли её и повернули вокруг оси вращения, проходящей через прямую
y=x, а затем снова положили на стол. При этом координатная ось Ox легла на
место координатной оси Oy и наоборот, а кусочек параболы лёг на место графика
квадратного корня. То же самое происходит и с арксинусом (см. тот же рисунок,
справа).
import matplotlib.pyplot as plt
import numpy as np
import qqmbr.odebook as ob
# see https://github.com/ischurov/qqmbr/blob/master/qqmbr/odebook.py
plt.figure(figsize=(6, 3))
plt.subplot(121)
x = np.linspace(0, np.sqrt(2), 200)
y = np.linspace(0, 2)
plt.plot(x, x ** 2, label='$y=x^2$')
plt.plot(y, np.sqrt(y), label=r'$y=\sqrt{x}$')
plt.plot(y, y, label='$y=x$')
plt.legend(loc=4)
plt.axis('equal')
ob.center_spines(grid=False, minor_ticks=False)
ob.settle_axes(xmin=-1.5, xmax=2.3, ymin=-1.5, ymax=2.3,
xlabel="x", ylabel="y", axlabelshift=2.3)
plt.xticks([])
plt.yticks([])
plt.subplot(122)
x = np.linspace(-np.pi / 2, np.pi / 2, 200)
x_large = np.linspace(-2.2, 2.2, 200)
y = np.linspace(-1, 1, 200)
plt.plot(x_large, np.sin(x_large), color='lightgray')
plt.plot(x, np.sin(x), label=r"$y=\sin x$")
plt.plot(y, np.arcsin(y), label=r"$y=\arcsin x$")
plt.plot(x, x, label=r"$y=x$")
plt.legend(loc=4)
plt.axis('equal')
ob.center_spines(grid=False, minor_ticks=False)
ob.settle_axes(xmin=-2.2, xmax=2.2, ymin=-2.2, ymax=2.2,
xlabel="x", ylabel="y", axlabelshift=1.8)
plt.xticks([])
plt.yticks([])
Утверждение 1. Аналогичное утверждение будет верным и для любых других пар взаимно обратных
функций f и f−1.
Доказательство. Для формального доказательства нам понадобится немножко школьной
планиметрии, см. рис. 18.7.
Рис. 18.7: Иллюстрация к доказательству утверждения о симметрии графиков
Возьмём любую точку P=(x0,f(x0)) на графике y=f(x). Точка P′=(f(x0),x0)
будет принадлежать графику обратной функции, поскольку f−1(f(x))=x.
Пусть A=(0,f(x0)) и A′=(f(x0),0). Рассмотрим треугольники OPA и
OP′A′. Это прямоугольные треугольники, они равны по двум сторонам
(|OA|=|OA′|, |AP|=|A′P′|). Значит, |OP|=|OP′| и треугольник OPP′
равнобедренный. Прямая y=x является биссектрисой угла POP′, поскольку
она является биссектрисой прямого угла AOA′ и углы AOP и A′OP′ равны.
Значит, она является медианой и высотой треугольника OPP′. Значит отрезок
PP′ перпендикулярен бисектрисе и разбивается ей на равные отрезки. Это и
означает, что точки P и P′ симметричны относительно прямой y=x.∎
Утверждение 2. Пусть функция f строго возрастает (убывает) и обратима. Тогда обратная
функция строго возрастает (убывает).
Доказательство. Рассмотрим случай когда f строго возрастает (обратный случай
рассматривается аналогично). Пусть f−1 не является строго возрастающей
функцией. Тогда найдутся точки y1 и y2, y2>y1, для которых
f−1(y2)<f−1(y1) (равенства быть не может в силу обратимости).
Но в силу возрастания f тогда
f((f−1(y2))<f(f−1(y1)).
По определению обратной функции (см. замечание 1),
f(f−1)(y2)=y2 и f(f−1)(y1)=y1. Значит y2<y1 вопреки
предположению.∎
Утверждение 3. Пусть функция непрерывна на [a,b] и обратима. Тогда f строго
монотонна на [a,b].
Доказательство. От противного. Пусть f(b)>f(a), обратный случай рассматривается аналогично.
Поскольку функция по предположению не является монотонной, она в частности не является
строго возрастающей.
Значит, найдутся такие точки x1,x2∈[a,b], что x2>x1 и
f(x2)≤f(x1). Равенства на самом деле быть не может в силу
инъективности f. Таким образом, f(x2)<f(x1). Возможно два
варианта.
Рис. 18.8: Иллюстрация к доказательству утверждения о монотонности обратимых
непрерывных функций
Пусть f(x1)>f(a), см. рис. 18.8 слева.
Пусть y∗∈(max(f(a),f(x2)),f(x1)). По теореме о
промежуточном значении на [a,x1]
найдётся такая точка c1, что f(c1)=y∗. По той же теореме на
[x1,x2] найдётся такая точка c2, что f(c2)=y∗.
Противоречие с обратимостью.
Пусть f(x1)<f(a) (см. тот же рисунок, справа). Тогда аналогичное
рассуждение можно применить к точкам x1, x2, b. (Примените!)
Вопрос 4. На каком интервале нужно выбирать y∗ при рассмотрении второго случая?
Верный ответ.
Да! Заметим, что тут не нужен аналог взятия максимума
max(f(a),f(x2)). По предположению, f(x2)<f(x1).
При этом f(x1)<f(a) (в нашем случае) и f(a)<f(b)
(снова по предположению). Значит, f(x1)<f(b).
Следовательно, любая y∗ точка из интервала (f(x2),f(x1)) нам подходит: график обязательно пересечёт прямую
y=y∗ на интервале (x1,x2) и потом снова пересечёт на
интервале (x2,b), поскольку должен подняться выше уровня
y=f(x1) и значит выше y=y∗.
∎
Следствие 1. Пусть областью определения функции f является отрезок [a,b], функция
непрерывна и обратима и [x1,x2]⊂[a,b]. Тогда образом отрезка
[x1,x2] под действием f является отрезок с концами в точках f(x1)
и f(x2) (то есть [f(x1),f(x2)] или [f(x2),f(x1)], в зависимости
взаимного расположения f(x1) и f(x2)).
Доказательство. Нам нужно доказать два утверждения:
Все точки y между f(x1) и f(x2) являются образами каких-то
точек x∈[x1,x2].
Никакие другие точки не являются образами точек x∈[x1,x2].
Докажем первое утверждение. Все значения y между f(x1) и f(x2) принимаются по
теореме о промеужточном значении. Доказали.
Докажем второе. Если x1≤x≤x2 и функция строго возрастает, то
f(x1)≤f(x)≤f(x2), а если строго убывает,то f(x1)≥f(x)≥f(x2). В обоих случаях f(x) принадлежит отрезку с концами в точках
f(x1) и f(x2), и это верно для всякого x∈[x1,x2]. Тоже
доказали.∎
Замечание 2. Утверждение следствия 1 останется справедливым, если заменить
отрезок [x1,x2] на интервал (x1,x2), а отрезок с концами в точках
f(x1) и f(x2) на интервал с концами в тех же точках. (Докажите!)
Следствие 2. Пусть областью определения функции f являтеся отрезок [a,b], функция
непрерывна и обратима. Пусть также [y1,y2] лежит в области значений f.
Тогда прообразом этого отрезка под действием f, то есть множеством
f−1([y1,y2]):={x∈[a,b]:f(x)∈[y1,y2]}
будет отрезок I с концами в точках f−1(y1) и f−1(y2).
Верный ответ.
По утверждению 3, f строго монотонна, а следовательно
(по утверждению 2) обратная функция тоже строго монотонна. Значит
для всех y∈[y1,y2], f−1(y) лежит между точкам f−1(y1) и
f−1(y2). То есть у любой точки y есть единственный прообраз (это
следует из обратимости), и он лежит на отрезке I (это следует из
монотонности). Значит, никакая точка вне этого отрезка не лежит в
f−1([y1,y2]). Наоборот, любая точка x∈I под действием f
переходит в точку отрезка [y1,y2] (в силу монотонности f), и значит
все такие точки x лежат в f−1([y1,y2]).
Упражнение 1. Приведите контрпримеры, демонстрирующие, что требования непрерывности и
обратимости являются существенными для двух доказанных выше следствий, то
есть что если хотя бы одно из них нарушается, утверждения перестают быть
верными. Пока вы этого не сделали, вы не можете считать, что понимаете
доказательства.
Утверждение 4. Пусть f непрерывна на [a,b] и обратима. Тогда f−1 также
непрерывна.
Доказательство. Пусть для определённости f(b)>f(a) (обратный случай рассматривается
аналогично). Тогда функция обязана возрастать: она будет монотонной в силу
обратимости, но убывать не может. Рассмотрим точку y0∈(f(a),f(b)) и
докажем, что f−1 непрерывна в y0 (односторонняя непрерывность в
концах отрезка доказывается аналогично). Пусть y0=f(x0). Мы хотим
доказать, что
limy→y0f−1(y)=f−1(y0)=x0.
Рис. 18.9: Иллюстрация к доказательству утверждения о непрерывности обратной к
непрерывной функции
Для всякого ε>0 рассмотрим интервал Uε(x0)=(x0−ε,x0+ε), см. рис. 18.9. Нам нужно доказать, что
найдётся такая окрестность ˚Uδ(y0), что все точки из этой
окрестности перейдут в Uε(x0) под действием обратного отображения
f−1. (Поскольку мы рассматриваем обратное отображение, мы, вопреки
обыкновению, ε-окрестности рисуем на горизонтальной оси, а
δ-окрестности — на вертикальной.) Будем считать, что ε
достаточно мало, чтобы Uε целиком лежал в интервале (a,b). По
следствию 1 и замечанию 2, образом
Uε под действием f является интервал V:=(f(x0−ε),f(x0+ε))
(он непуст, поскольку мы рассматриваем случай, когда f возрастает, и
значит правый конец будет правее левого). Поскольку y0=f(x0), y0∈V (в силу монотонности функции f), то есть V является окрестностью
точки y0. Поскольку под действием f окрестность Uε(x0) переходит
в окрестность V, то под действием обратного отображения f−1
окрестность (f(x0−ε),f(x0+ε)) перейдёт назад в Uε(x0).
Итак, мы получили окрестность точки f(x0), все точки из которой переходят
в ε-окрестность точки x0 под действием f−1. Это почти то, что
нам нужно. Давайте впишем в неё какую-то симметричную окрестность — она и
будет искомой δ-окрестностью (это немножко технический шаг, но в
определении предела мы используем симметричные окрестности, и нам формально
нужно получить именно такую).
Пусть δ=min(|y0−f(x0−ε)|,|y0−f(x0+ε)|)>0.
Тогда Uδ(y0)⊂(f(x0−ε),f(x0+ε)) и
f−1(Uδ(y0))⊂(x0−ε,x0+ε)=Uε(x0). (Если
всё множество V отображалось под действием f−1 в Uε(x0), то
подмножество V отображается в некоторое подмножество Uε(x0).
Таким образом, для любого y∈Uδ(y0), f−1(y)∈Uε(x0). Тем самым, построенная нами δ
удовлетворяет условию в определении искомого предела.∎
Пример 3. Мы знаем, что функция f(x)=expx=ex непрерывна и строго монотонна, её
областью определения является вся прямая и она принимает все положительные
значения. Значит, у неё существует непрерывная обратная. Она называется
натуральным логарифмом:
ln:(0,+∞)→R.
Для всех x∈R, lnex=x. Наоборот, для всех y>0, elny=y. Натуральный логарифм, так же, как и экспонента, монотонно возрастает.
import matplotlib.pyplot as plt
import numpy as np
import qqmbr.odebook as ob
# see https://github.com/ischurov/qqmbr/blob/master/qqmbr/odebook.py
plt.figure(figsize=(4, 4))
x = np.linspace(-2, 1.3, 200)
plt.plot(x, np.exp(x), label=r'$y=e^x$')
y = np.linspace(np.exp(x[0]), np.exp(x[-1]), 200)
plt.plot(y, np.log(y), label=r'$y=\ln x$')
plt.plot(np.linspace(-1.8, 3), np.linspace(-1.8, 3), label=r'$y=x$')
plt.legend()
ob.center_spines(grid=False, minor_ticks=False)
ob.settle_axes(xmin=-2.2, xmax=3.8, ymin=-2.2, ymax=3.8,
xlabel="x", ylabel="y", axlabelshift=1.3)
Рис. 18.10: Графики экспоненты и натурального логарифма
Рассмотрим две оси, x и y. Пусть f(x0)=y0. Рассмотрим небольшой отрезок
I=[x0,x0+Δx] на оси x и его образ под действием f: отрезок
f(I)=[f(x0),f(x0+Δx)] на оси y. (Для иллюстрации будем считать,
что f возрастает и Δx>0.) Тогда производная f′(x0) показывает, во
сколько (примерно) раз f(I) длиннее I, то есть во сколько раз отрезок I
растягивается отображением f, то есть f′(x0)≈|f(I)|/|I|.
Рис. 18.11: Производная функции f показывает, во сколько раз растягивается
маленький отрезок. Если f растягивает, то f−1 будет сжимать, то
есть производная обратной функции обратна к производной прямой функции.
Главное — разобраться, в каких точках эти производные нужно считать.
Посмотрим теперь на обратное отображение f−1. Оно переводит отрезок f(I)
назад в отрезок I. Когда I маленький, f(I) тоже маленький. Поэтому
(f−1)′(y0)≈|I|/|f(I)|. Обратите внимание: нам нужно брать
производную в точке, которая является концом отрезка f(I), то есть в точке
y0. Но y0=f(x0). Таким образом, можно ожидать, что
Теорема 1. Пусть функция f непрерывна в окрестности точки x0 и дифференцируема
в x0. Пусть также f′(x0)≠0 и f обратима. Тогда f−1
дифференцируема в точке y0=f(x0) и
(f−1)′(f(x0))=1f′(x0).
Поскольку x0=f−1(y0), это равенство можно записать так:
(f−1)′(y0)=1f′(f−1(y0)).
Доказательство. Для упрощения формул будем обозначать f−1 через g.
Рассмотрим предел, используемый в определении производной функции
g в точке y0:
limΔy→0g(y0+Δy)−g(y0)Δy.(18.2)
Рассмотрим функцию
Δg(Δy)=g(y0+Δy)−g(y0).
В силу непрерывности g, Δg(Δy)→0 при Δy→0. Также Δg(Δy)≠0 при Δy≠0, иначе у одной точки x0 было бы два образа под действием f.
Заметим, что справедливо тождество (см. рис. 18.12):
Δy=f(x0+Δg(Δy))−f(x0).
Рис. 18.12: Иллюстрация к доказательству теоремы о производной обратной функции
Обратные функции часто встречаются на практике — всегда, когда нам нужно найти
решение уравнения f(x)=c, нам нужно использовать обратную функцию. Однако,
далеко не всегда это можно сделать явно — даже алгебраические уравнения (где f
— многочлен) степени выше четвертой не имеют явных формул (использующих
элементарные функции) для своего решения (мы не просто не знаем этих формул
— можно доказать, что их не существует). Тем не менее, очень часто они и не
нужны, потому что нас интересуют не формулы, а то, как ведут себя
функции, и это часто можно понять и без формулы. Именно это демонстрирует
теорема, которую мы доказали — она позволяет находить производную обратной
функции, не имея явного вида самой этой обратной функции.