На предыдущей лекции мы ввели понятие определенного интеграла (интеграла
Римана), который геометрически определяется как площадь под графиком функции.
Оказывается, задача отыскания площади тесно связана с задачей дифференцирования
функции. Можно сказать, что эти задачи обратны друг другу. Что точно это значит,
мы обсудим в этой лекции.
Пусть мы решаем такую задачу: нам известно, что скорость роста некоторой
величины описывается функцией f(x)=x2. Что можно сказать про саму величину?
Иными словами, нам известно, что у некоторой функции F производная равна
F′(x)=x2. Как найти F?
Можно попробовать угадать. Производная является степенной функцией. Мы знаем,
что производной степенной функции является снова степенная функция (с точностью
до умножения на некоторый коэффициент), так что можно предположить, что F(x)
будет задаваться в похожем виде: степенная функция умножить на что-то. При
дифференцировании степень уменьшается на один — значит, можно ожидать, что
степень F на единицу больше степени F′, то есть равна 3. Возьмём функцию
y=x3, её производная равна 3x2 — это почти то, что нам нужно, только
коэффициент 3 мешается. Однако мы знаем, что если поделить исходную функцию на
какую-то константу, то её производная тоже поделится на такую же константу.
Чтобы избавиться от тройки, нужно поделить исходную функцию на три, то есть
можно взять
F(x)=x33.
Дифференцированием проверяется, что F′(x)=x2, тем самым такое решение
подходит. Но является ли оно единственным? Очевидно, нет. Как минимум, можно
прибавлять к x3/3 любую константу — при дифференцировании она обнулится и на
производную не повлияет. Таким образом, любая функция вида
F(x)=x33+C
является решением нашей задачи. Чуть позже мы покажем, что других решений нет.
import matplotlib.pyplot as plt
import numpy as np
import qqmbr.odebook as ob
# see https://github.com/ischurov/qqmbr/blob/master/qqmbr/odebook.py
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(6, 6), sharex=True)
x = np.linspace(-2, 2, 200)
ax1.plot(x, x ** 2, label='$y=x^2$')
ob.center_spines(grid=False, minor_ticks=False, ax=ax1)
ob.settle_axes(xmin=-1.7, xmax=1.7, ymin=-1.2, ymax=2.8,
xlabel="x", ylabel="y", ax=ax1)
ax1.legend()
ax1.set_xticks([])
ax1.set_yticks([])
ax2.plot(x, x ** 3 / 3, label='$y=x^3/3$', color='C1')
ax2.plot(x, x ** 3 / 3 + 0.5, label='$y=x^3/3+1/2$', color='C2')
ax2.plot(x, x ** 3 / 3 + 1, label='$y=x^3/3+1$', color='C3')
ax2.plot(x, x ** 3 / 3 - 0.5, label='$y=x^3/3-1/2$', color='C4')
ax2.set_yticks([])
ax2.legend()
ob.center_spines(grid=False, minor_ticks=False, ax=ax2)
ob.settle_axes(xmin=-1.7, xmax=1.7, ymin=-2.2, ymax=2.8,
xlabel="x", ylabel="y", ax=ax2)
Рис. 25.1: Различные первообразные функции x2 отличаются друг от друга
добавлением константы, что соответствует вертикальному сдвигу графика
Определение 1. Пусть функция f непрерывна на отрезке [a,b]. Её первообразной
(англ. antiderivative) называется такая функция F, что для всякого
x∈[a,b],
F′(x)=f(x),(25.1)
где производные на концах отрезка понимаются в смысле односторонних
производных.
Пример 1. Любая функция вида x3/3+C является первообразной для функции x2. Любая
функция вида −cosx+C является первообразной к функции sinx. Любая
функция вида ex+C является первообразной к функции ex.
Утверждение 1. Пусть F и G — две первообразные одной и той же функции f на отрезке
[a,b]. Тогда
существует такая константа C, что для всех x∈[a,b]:
G(x)=F(x)+C.
Иными словами, все различные первообразные одной и той же функции отличаются
друг от друга только выбором прибавляемой константы.
Доказательство. Пусть F и G — две первообразные одной и той же функции f на отрезке
[a,b]. Тогда для всех x∈[a,b]:
F′(x)=f(x)=G′(x).
Рассмотрим функцию H(x)=G(x)−F(x). Мы хотим доказать, что она является
константой. Действительно, найдём её производную. Для всякого x∈[a,b]
Таким образом, H(x)=H(a), то есть функция H во всех точках принимает
одно и то же значение, и значит является константой. Можно обозначить
C:=H(a) и получить искомое равенство.∎
Замечание 1. В нашем определении первообразной требуется, чтобы функция f была
определена и непрерывна на отрезке [a,b] и равенство
(25.1) выполнялось во всех точках отрезка [a,b]. Если бы
мы требовали соблюдения равенства (25.1) на области
определения функции f, и допускали, что функция f может быть не
определена в каких-то точках, заключение утверждения 1 могло
бы быть неверным. Например, найдите все возможные функции, удовлетворяющие
условию F′(x)=1/x2 при всех x≠0. Их больше, чем кажется!
Пусть функция f непрерывна на отрезке [a,b]. Тогда, как мы знаем,
функция интегрируема на этом отрезке и для всякого t∈[a,b] определён
следующий интеграл:
∫taf(x)dx.(25.2)
Интеграл (25.2) называется интегралом с переменным верхним
пределом. Его значение зависит от t, то есть он задаёт функцию от переменной
t. Обозначим эту функцию через G(t).
Пример 2. Пусть f(x)=3 и a=1. Тогда при t>1 интеграл
G(t)=∫t13dx
равен площади прямоугольника шириной (t−1) и высотой 3. Значит,
G(t)=3(t−1)=3t−3.
Пример 3. Пусть f(x)=x и a=2. Тогда при t>2 интеграл
∫taf(x)dx
равен площади трапеции высотой t−2 и основаниями 2 и t. Из геометрии
мы знаем, что площадь такой трапеции равна произведению высоты на полусумму
оснований, то есть
G(t)=(t−2)t+22=t2−42=t22−2.
25.2.2Формулировка и доказательство формулы Ньютона — Лейбница
Теорема 1. (Формула Ньютона — Лейбница.) Пусть f непрерывна на отрезке [a,b] и
G(t):=∫taf(x)dx.
Тогда справедливы два утверждения:
G является первообразной f, то есть для всех x0∈[a,b],
G′(x0)=f(x0).(25.3)
Для любой первообразной F функции f справедливо утверждение:
∫baf(x)dx=F(b)−F(a).(25.4)
Доказательство. Докажем первое утверждение: интеграл как функция своего верхнего предела
является первообразной подынтегральной функции (звучит немножко как
заклинание, но если прочитать его медленно и вдумчиво, вы увидите, что это
правда то, что написано в первом утверждении).
Приращение функции.
Запишем определение производной для функции G в некоторой точке x0∈(a,b) (на концах нужно взять соответствующую одностороннюю производную):
G′(x0)=limΔx→0G(x0+Δx)−G(x0)Δx.(25.5)
G′(x0)==limΔx→0G(x0+Δx)−G(x0)Δx.(25.5)
Числитель (приращение функции G) можно переписать следующим образом:
G(x0+Δx)−G(x0)=∫x0+Δxaf(x)dx−∫x0af(x)dx.(25.6)
G(x0+Δx)−G(x0)==∫x0+Δxaf(x)dx−−∫x0af(x)dx.(25.6)
Это разница площадей двух фигур, которая равна интегралу по отрезку [x0,x0+Δx]. Формально можно заметить, что в силу аддитивности
интеграла (см. (24.5)),
Эта формула действует и при положительных, и при отрицательных Δx. В
дальнейшем для простоты мы будем считать, что Δx положительно, хотя
все рассуждения легко адаптируются на случай отрциательных Δx.
Ключевая идея. Заметим, что интеграл (25.7) — это
площадь узкой полоски шириной Δx, которая близка к площади
прямоугольника шириной Δx и высотой f(x0). Полоска
не является идеальным прямоугольником, потому что значение функции меняется,
и её верхняя граница не является горизонтальной прямой. Однако, в силу
непрерывности, на маленьком отрезке длиной [x0,x0+Δx] значения
функции близки к f(x0), и отклонение площади полоски от площади
соответствующего отрезка небольшое — оно маленькое по сравнению с Δx. Если теперь поделить площадь этого прямоугольника на Δx, то есть
на его ширину, останется как раз его высота, то есть f(x0).
Оценки сверху и снизу. Аккуратное рассуждение выглядит так. На
отрезке [x0,x0+Δx] функция f является непрерывной, и
следовательно принимает свои максимальные и минимальные значения. Для разных
значений Δx эти значения и точки, в которых они принимаются, могут
быть разными. Обозначим соответствующие значения через M(Δx) и
m(Δx), а точки, в которых они принимаются, через xmax(Δx) и xmin(Δx):
По определению минимума и максимума, для всех x∈[x0,x0+Δx],
m(Δx)≤f(x)≤M(Δx).(25.10)
Неравенства можно интегрировать (см. утверждение 3 из
предыдуещй лекции). Проинтегрируем (25.10) по отрезку [x0,x0+Δx]. Получим:
∫x0+Δxx0m(Δx)dx≤∫x0+Δxx0f(x)dx≤∫x0+Δxx0M(Δx)dx.
∫x0+Δxx0m(Δx)dx≤≤∫x0+Δxx0f(x)dx≤≤∫x0+Δxx0M(Δx)dx.
В самой левой и самой правой частях неравенства подынтегральные функции
— константы (они зависят от Δx, но интегрирование происходит по
переменной x, и с точки зрения этого интегрирования, они константы).
Соответствующие интегралы — это просто площади прямоугольников, они равны
m(Δx)Δx и M(Δx)Δx соответственно. Значит
m(Δx)Δx≤∫x0+Δxx0f(x)dx≤M(Δx)Δx.(25.11)
m(Δx)Δx≤≤∫x0+Δxx0f(x)dx≤≤M(Δx)Δx.(25.11)
Геометрически это соответствует тому, что мы ограничили нашу узкую полоску
двумя прямоугольниками: она содержится целиком внутри прямоугольника, высота
которого равна M(Δx), а прямоугольник с высотой m(Δx)
содержится внутри неё. Значит, её площадь находится между площадями этих
двух прямоугольников.
Предельный переход. Разделим неравенство (25.11) на
Δx (мы сейчас предполагаем, что Δx>0, обратный случай
рассматривается аналогично):
m(Δx)≤1Δx∫x0+Δxx0f(x)dx≤M(Δx).(25.12)
m(Δx)≤≤1Δx∫x0+Δxx0f(x)dx≤≤M(Δx).(25.12)
Посередине написано выражение, стоящее под знаком предела в определении
производной функции G (см. (25.5) с учётом (25.6)).
Согласно (25.8),
M(Δx)=f(xmax(Δx))
и x0≤xmax(Δx)≤x0+Δx. По теореме о двух
милиционерах, из этого следует, что xmax(Δx)→x0 при Δx→0. В силу непрерывности функции f по теореме о пределе сложной
функции, отсюда следует, что
M(Δx)=f(xmax(Δx))→f(x0)
при Δx→0. Аналогичное
утверждение справедливо и для m(Δx):
Выражение посередине является производной G′(x0), и в силу полученных
неравенство, G′(x0)=f(x0), как и ожидалось.
Интеграл как разность значений первообразной.
Докажем теперь второе утверждение — это гораздо проще. Мы уже знаем, что G
является первообразной функции f на отрезке [a,b]. Мы также знаем, что
F — какая-то другая её первообразная, и значит (согласно
утверждению 1) она отличается от G на константу, то есть
существует такая константа C, что для всех x∈[a,b]
G(x)=F(x)+C.
Осталось найти эту константу. Подставим в это равенство x=a. В левой
части будет G(a) — то есть интеграл от f по отрезку от a до a. Он
равен нулю (см. (24.6)). Справа будет F(a)+C. Таким образом,
0=F(a)+C,
то есть C=−F(a). Значит для любого x∈[a,b]:
G(x)=F(x)−F(a)
и значит
∫baf(x)dx=G(b)=F(b)−F(a).
Формула Ньютона — Лейбница доказана.∎
Замечание 2. У нас есть некоторый произвол в выборе функции F — она может быть любой
первообразной для f. Однако, этот произвол не влияет на результат: все
первообразные отличаются друг от друга на константу, и если к F добавить
эту константу, то в правой части формулы (25.4) она
появится дважды с разными знаками и значение не поменяется.
25.2.3Нахождение интегралов с помощью первообразных
Формулу Ньютона — Лейбница также называют фундаментальной теоремой
анализа (англ. fundamental theorem of calculus), поскольку она связывает
два главных раздела этой науки — дифференциальное и интегральное исчисление.
Наиболее популярным её применением — по крайней мере, в учебных курсах типа
нашего — является нахождение интегралов с помощью первообразных. Приведём
несколько примеров.
Пример 4. Найдём
∫40xdx.
Заметим, что для функции f(x)=x одной из первообразных является функция
F(x)=x2/2 (проверяется дифференцированием). Значит
∫40xdx=F(4)−F(0)=422−022=8.
Можно проверить этот результат. Наш интеграл — это площадь равнобедренного
прямоугольного треугольника с катетами, равными 4. Его площадь равна
4×4/2=8. Сошлось!
Пример 5. Найдём
∫21x2dx.
Первообразной для x2 является функция F(x)=x3/3. Значит
∫21x2dx=F(2)−F(1)=233−133=73.
Тут уже через элементатную геометрию ответ не проверишь — интересующая нас
фигура не является многоугольником, её верхняя граница проходит по параболе.
Пример 6. Найдём
∫π0sinxdx.
Мы знаем, что первообразной для sinx является F(x)=−cosx. Значит
∫π0sinx=F(π)−F(0)=(−cosπ)−(−cos0)=1+1=2.
∫π0sinx=F(π)−F(0)==(−cosπ)−(−cos0)=1+1=2.
Замечание 3. При вычислении значений интегралов с помощью формулы Ньютона — Лейбница
часто приходится вычислять разность значений одной и той же функции F в
двух разных точках. Чтобы сократить запись, используют такое обозначение:
F(b)−F(a)=:F(x)|ba.
Например, решение последнего примера обычно записывается так:
Мы доказали формулу Ньютона — Лейбница, и обнаружили, что задача отыскания
площади сводится к задаче отыскания первообразной — то есть такой функции, чья
производная равна подыинтегральной функции. Как находить первообразные? До сих
пор мы это делали методом угадывания, и с совсем простыми функциями (степенными,
тригонометрическими, экспонентой) этот фокус проходил. Но что делать, если
функция, которую нужно проинтегрировать, устроена сложнее? Плохая новость:
универсальных методов отыскания первообразных не существует, и, более того,
первообразная вообще может не записываться в виде формулы, содержащей функции,
которые мы проходили до сих пор. Хорошая новость: иногда эта задача всё-таки
решается, и в следующей лекции мы обсудим некоторые методы интегрирования.