지금까지는 함수가 어떤 입력을 어떤 출력으로 보내는지 보았습니다. 이제부터는 함수가 어떻게 변하는지를 봅니다. 12강은 그 출발점입니다. 극한은 가까이 간다는 말을 수학으로 다루는 도구이고, 연속은 함수가 끊기지 않는다는 뜻을 정확히 말하는 언어이며, 미분은 바로 이 순간 얼마나 빨리 변하는가를 묻는 계산입니다.

먼저 알아둘 말

평균변화율: 두 점 사이에서 입력 변화에 비해 출력이 얼마나 변했는지를 나타내는 값이다.
극한: 어떤 값에 점점 가까이 갈 때 함수값이 어디로 가까워지는지를 보는 생각이다.
연속: 극한값과 실제 함수값이 같아서 그래프가 끊기지 않는 성질이다.
순간변화율: 아주 짧은 순간에서의 변화율이다.
미분계수: 한 점에서의 순간변화율이다.
도함수: 각 점의 미분계수를 모아 만든 새로운 함수다.

이 강의에서 답할 질문

왜 변화율을 보려면 먼저 두 점 사이의 평균변화율부터 시작해야 하는가?
극한은 왜 도착한 값보다 가까이 가는 과정을 보는가?
연속은 왜 미분보다 먼저 정의되어야 하는가?
순간변화율은 어떻게 평균변화율의 극한이 되는가?
도함수는 함수의 어떤 정보를 모아 두는가?

먼저 떠올릴 장면

자동차가 1시간 동안 60km를 갔다면 평균속도는 알 수 있지만, 출발 직후의 정확한 속도는 모릅니다.
산길에서 두 지점을 잇는 경사와 바로 지금 서 있는 지점의 경사는 다릅니다.
그래프를 펜으로 끊지 않고 그릴 수 있다면 연속이라는 말을 떠올릴 수 있습니다.

생각의 순서

먼저 두 점 사이의 평균변화율을 봅니다.
그다음 두 점을 점점 붙이며 극한이라는 생각을 만듭니다.
이어서 함수값과 극한값이 맞아떨어질 때 연속이라고 부릅니다.
그다음 평균변화율의 극한으로 순간변화율을 정의합니다.
마지막으로 도함수가 왜 함수의 변화 지도처럼 쓰이는지 연결합니다.

본문

함수가 얼마나 빨리 변하는지 알고 싶을 때 가장 먼저 할 수 있는 일은, 두 점을 비교하는 것입니다. 함수

$$ f(x) $$

가 있고 두 입력

$$ a,\ b $$

를 잡으면, 구간

$$ [a,b] $$

에서의 평균변화율은

$$ \frac{f(b)-f(a)}{b-a} $$

입니다.

이 식은 어렵지 않습니다. 입력이

$$ b-a $$

만큼 바뀌는 동안 출력이

$$ f(b)-f(a) $$

만큼 바뀌었으니, 입력 1만큼 바뀔 때 출력이 평균적으로 얼마나 바뀌는가를 보는 것입니다. 그래프에서는 두 점을 잇는 직선, 즉 할선의 기울기입니다.

하지만 우리는 종종 평균이 아니라 바로 이 점에서 얼마나 가파른가를 알고 싶습니다. 예를 들어 자동차의 평균속도는 알아도 현재 속도는 따로 알고 싶고, 산길 전체 평균 경사와 지금 발밑의 경사는 다를 수 있습니다.

그래서 한 점

$$ x $$

근처를 더 자세히 봅니다. 작은 변화량

$$ h $$

를 주면 평균변화율은

$$ \frac{f(x+h)-f(x)}{h} $$

가 됩니다.

이제 핵심 생각이 나옵니다. 만약

$$ h $$

를 0으로 딱 넣을 수는 없지만, 0에 점점 가깝게 만들 수는 있습니다. 바로 이때 필요한 생각이 극한입니다.

극한은 정확히 그 값이 얼마인가를 묻기 전에, 그 값으로 가까이 가면 함수가 어디로 가까워지는가를 봅니다. 예를 들어

$$ \frac{x^2-1}{x-1} $$

이라는 식은

$$ x=1 $$

에서 바로 대입하면 분모가 0이 되어 계산할 수 없습니다. 그렇다고 해서 근처에서 무슨 일이 일어나는지까지 못 보는 것은 아닙니다.

식

$$ x^2-1=(x-1)(x+1) $$

이므로

$$ x \neq 1 $$

에서는

$$ \frac{x^2-1}{x-1}=x+1 $$

입니다. 따라서

$$ x $$

가 1에 가까워질수록 함수값은 2에 가까워집니다. 그래서

$$ \lim_{x \to 1}\frac{x^2-1}{x-1}=2 $$

라고 씁니다.

이제 연속을 말할 수 있습니다. 함수가 점

$$ a $$

에서 연속이라는 말은, 그 점으로 가까이 갈 때 함수값이 실제 함수값과 자연스럽게 이어진다는 뜻입니다. 식으로는

$$ \lim_{x \to a} f(x)=f(a) $$

입니다.

즉 연속은 그래프가 안 끊긴다는 직관을 극한으로 정확하게 적은 것입니다. 만약 함수값은 따로 튀어 있고, 극한은 다른 곳으로 가면 그 점에서 함수는 연속이 아닙니다.

연속이 왜 미분보다 먼저 나와야 하는지도 여기서 보입니다. 미분은 극한을 써서 정의되고, 극한이 안정적으로 존재하려면 함수가 적어도 끊기지 않아야 하기 때문입니다. 실제로 미분가능한 함수는 연속이지만, 연속이라고 해서 항상 미분가능한 것은 아닙니다. 뾰족한 꼭짓점이 있는 그래프는 이어져 있어도 순간 기울기가 하나로 정해지지 않을 수 있습니다.

이제 다시 평균변화율로 돌아갑니다. 한 점에서의 순간변화율은

$$ h $$

를 0에 가깝게 보냈을 때의 평균변화율입니다. 즉 미분계수는

$$ f'(x)=\lim_{h \to 0}\frac{f(x+h)-f(x)}{h} $$

로 정의합니다.

이 식은 외워야 할 공식이 아니라, 두 점 사이의 기울기를 한 점의 기울기로 바꾸는 과정입니다. 그래서 미분은 변화의 언어입니다.

가장 대표적인 예로

$$ f(x)=x^2 $$

를 봅시다. 평균변화율 식에 넣으면

$$ \frac{f(x+h)-f(x)}{h} = \frac{(x+h)^2-x^2}{h} $$

입니다. 분자를 전개하면

$$ \frac{x^2+2xh+h^2-x^2}{h} = \frac{2xh+h^2}{h} =2x+h $$

이 됩니다. 이제

$$ h \to 0 $$

로 보내면

$$ f'(x)=\lim_{h \to 0}(2x+h)=2x $$

입니다.

뜻은 분명합니다. 함수

$$ x^2 $$

는 각 점에서 기울기가

$$ 2x $$

인 곡선입니다. x가 커질수록 더 가파르게 올라가고, x가 음수이면 왼쪽에서는 내려가다가 0 근처에서 평평해졌다가 다시 올라갑니다.

도함수

$$ f'(x) $$

는 이렇게 원래 함수의 각 점에서 얼마나 빨리 변하는지를 모아 둔 함수입니다. 원래 함수가 위치 지도라면, 도함수는 변화 지도입니다.

AI에서도 이 생각이 직접 쓰입니다. 손실함수는 파라미터를 조금 바꿀 때 값이 얼마나 변하는지를 알아야 줄일 수 있습니다. 경사하강법은 결국 도함수나 gradient를 이용해 지금 여기서 가장 빨리 내려가는 방향을 찾는 알고리즘입니다. 그래서 극한과 미분은 단순한 고전 수학이 아니라 학습 알고리즘의 출발점입니다.

예제

두 점 사이의 평균 기울기 구하기 문제: 함수

$$ f(x)=x^2 $$

의 구간

$$ [1,3] $$

에서 평균변화율을 구하라.

풀이:

$$ \frac{f(3)-f(1)}{3-1} = \frac{9-1}{2} =4 $$

해설: 이 값은 점

$$ (1,1) $$

과

$$ (3,9) $$

를 잇는 직선의 기울기다. 두 점 전체를 평균적으로 보면 출력은 입력 1당 4씩 늘어난다.

극한의 뜻 읽기 문제: 다음 극한값을 구하라.

$$ \lim_{x \to 1}\frac{x^2-1}{x-1} $$

풀이:

$$ \frac{x^2-1}{x-1} = \frac{(x-1)(x+1)}{x-1} =x+1 \qquad (x \neq 1) $$

이므로

$$ \lim_{x \to 1}\frac{x^2-1}{x-1} = \lim_{x \to 1}(x+1) =2 $$

해설: x가 1일 때 직접 대입은 안 되지만, 1에 가까이 갈 때 함수값이 어디로 가는지는 볼 수 있다. 이것이 극한의 핵심이다.

미분계수 계산하기 문제: 함수

$$ f(x)=x^2 $$

의 도함수를 구하라.

풀이:

$$ f'(x)=\lim_{h \to 0}\frac{(x+h)^2-x^2}{h} $$

$$ =\lim_{h \to 0}\frac{2xh+h^2}{h} =\lim_{h \to 0}(2x+h) =2x $$

해설: 평균변화율을 한 점으로 좁혀 가면 순간변화율이 된다. 도함수는 함수가 각 점에서 얼마나 빨리 변하는지를 보여 준다.

스스로 점검

평균변화율과 순간변화율의 차이를 말로 설명할 수 있는가?
극한이 왜 도착한 값이 아니라 가까이 가는 과정을 보는지 설명할 수 있는가?
연속의 정의

$$ \lim_{x \to a} f(x)=f(a) $$

를 뜻과 함께 말할 수 있는가? 4. 미분이 왜 평균변화율의 극한인지 설명할 수 있는가? 5. 도함수가 원래 함수의 어떤 정보를 모아 둔 것인지 설명할 수 있는가?