12강과 13강에서는 변화율을 보았습니다. 이제 14강에서는 그 변화가 쌓이면 전체가 얼마나 되는가를 봅니다. 적분은 넓이 계산처럼 보일 수도 있고, 누적량 계산처럼 보일 수도 있으며, 확률밀도에서 실제 확률을 만드는 계산처럼 보일 수도 있습니다. 이 셋은 서로 다른 주제가 아니라 모두 작은 조각들을 더해 전체를 복원한다는 하나의 생각입니다.

먼저 알아둘 말

리만합: 구간을 잘게 나눈 뒤 작은 조각의 값을 더해 전체를 근사하는 합이다.
적분: 작은 양들을 모두 더해 전체를 구하는 생각이다.
정적분: 어떤 구간 전체에서 쌓인 양을 하나의 수로 나타낸 것이다.
부정적분: 미분하면 원래 함수가 되는 함수를 찾는 것이다.
누적량: 시간이나 위치에 따라 계속 쌓인 총량이다.
확률밀도함수: 확률이 각 위치에 얼마나 촘촘히 분포하는지를 나타내는 함수다.
누적분포함수: 어떤 값 이하의 확률을 누적해 놓은 함수다.

이 강의에서 답할 질문

적분은 왜 잘게 나누어 더하기라는 생각에서 시작하는가?
적분이 왜 넓이와 누적량을 동시에 뜻할 수 있는가?
미분과 적분은 왜 서로 연결되는가?
확률밀도는 왜 함수값 그 자체가 아니라 구간 적분이 확률인가?
누적분포함수는 왜 적분으로 정의되는가?

먼저 떠올릴 장면

초당 2리터씩 물이 나오면 시간이 지날수록 총 물의 양이 쌓입니다.
속도계를 보면 지금의 속도를 알 수 있지만, 이동거리는 그 속도를 누적해야 나옵니다.
히스토그램 막대를 점점 더 잘게 쪼개면 매끈한 밀도 곡선처럼 보일 수 있습니다.

생각의 순서

먼저 구간을 잘게 나눠 작은 조각들을 더하는 생각을 봅니다.
그다음 그 합이 정적분이라는 개념으로 정리되는 것을 봅니다.
이어서 미분과 적분이 왜 서로 연결되는지 봅니다.
그다음 확률밀도와 구간확률의 관계를 적분으로 읽습니다.
마지막으로 누적분포함수가 왜 자연스럽게 등장하는지 연결합니다.

본문

적분을 처음 볼 때 가장 좋은 출발점은 작은 조각을 모두 더한다는 생각입니다. 예를 들어 어떤 물체가 시간에 따라 속도가 변한다고 합시다. 속도가 일정하지 않으면 단순히 속도 × 시간으로 전체 이동거리를 바로 구하기 어렵습니다. 대신 시간을 아주 잘게 나눕니다.

각 작은 구간에서는 속도가 거의 일정하다고 볼 수 있으므로, 그 조각에서 이동한 거리는 대략

$$ \text{속도} \times \text{아주 짧은 시간} $$

입니다. 이런 조각들을 모두 더하면 전체 이동거리에 가까워집니다. 이것이 적분의 핵심 직관입니다.

수학에서는 이런 합을 리만합으로 생각합니다. 구간

$$ [a,b] $$

를 잘게 나누고, 각 조각의 폭을

$$ \Delta x $$

라고 하면 전체량은 대략

$$ \sum f(x_i)\Delta x $$

처럼 쓸 수 있습니다.

이제 조각을 점점 더 잘게 만들면 근사는 점점 정확해집니다. 그 극한이 정적분입니다.

$$ \int_a^b f(x)\,dx $$

이 기호는 a부터 b까지 함수값을 작은 폭과 곱해 모두 더한 전체량을 뜻합니다.

그래서 정적분은 그래프 아래 넓이로도 읽히고, 누적된 총량으로도 읽힙니다. 넓이와 누적량이 서로 다른 것처럼 보이지만, 사실은 같은 구조입니다. 가로폭이 작은 구간마다 높이 × 폭을 더하는 것이기 때문입니다.

예를 들어

$$ f(x)=x $$

를 구간

$$ [0,2] $$

에서 적분하면

$$ \int_0^2 x\,dx $$

입니다. 그래프로 보면 원점에서 시작해 기울기 1로 올라가는 직선 아래 삼각형의 넓이이고, 누적량으로 보면 x가 커질수록 조금씩 더 많이 쌓이는 총량입니다. 두 해석은 다른 말이 아니라 같은 값을 다른 상황에 적용한 것입니다.

적분과 미분은 서로 깊게 연결됩니다. 만약 어떤 함수

$$ F(x) $$

가

$$ F'(x)=f(x) $$

를 만족한다면,

$$ \int_a^b f(x)\,dx = F(b)-F(a) $$

가 됩니다. 이것이 미적분학의 기본정리입니다.

이 식은 매우 중요합니다. 왼쪽은 작은 변화들을 전부 더한 값이고, 오른쪽은 처음과 끝의 차이입니다. 즉 순간 변화율을 모두 누적하면 전체 변화량이 됩니다. 그래서 미분은 쪼개 보는 언어, 적분은 다시 모으는 언어라고 할 수 있습니다.

이제 확률로 넘어가 봅시다. 연속확률변수에서는 한 점의 확률을 직접 말하기보다, 어느 구간에 얼마나 확률이 몰려 있는지를 말하는 것이 더 자연스럽습니다. 그때 쓰는 함수가 확률밀도함수

$$ p(x) $$

입니다.

중요한 점은

$$ p(x) $$

자체가 확률이 아니라는 것입니다. 그것은 그 근처에서 확률이 얼마나 촘촘한가를 말해 줍니다. 실제 확률은 구간에서 적분해야 얻습니다.

$$ P(a \le X \le b)=\int_a^b p(x)\,dx $$

왜 그럴까요. 확률밀도도 결국 작은 조각의 확률을 더하는 구조이기 때문입니다. 아주 짧은 구간

$$ \Delta x $$

에서는 확률이 대략

$$ p(x)\Delta x $$

처럼 생각되고, 이 조각들을 전부 더하면 구간확률이 됩니다.

전체 확률은 반드시 1이어야 하므로

$$ \int_{-\infty}^{\infty} p(x)\,dx = 1 $$

이어야 합니다. 이 식은 확률밀도가 전체적으로 정확히 100%의 확률을 나누어 가지고 있다는 뜻입니다.

누적분포함수는 이 밀도를 왼쪽부터 차곡차곡 더한 함수입니다.

$$ F(x)=P(X\le x)=\int_{-\infty}^x p(t)\,dt $$

즉 누적분포함수는 x 이하일 확률을 누적해 놓은 함수입니다. 이름 그대로 누적량입니다.

AI에서도 적분은 계속 등장합니다. 확률분포의 정규화, 기대값 계산, 연속분포 모델, 물리 기반 모델, 확산모델 해석까지 모두 적분 사고를 사용합니다. 지금 중요한 것은 공식 암기가 아니라, 적분이 잘게 나누어 더해 전체를 복원하는 언어라는 감각입니다.

예제

일정한 유량의 총량 구하기 문제: 물이 초당

$$ 2 $$

리터씩

$$ 5 $$

초 동안 나온다면 총 물의 양은 얼마인가?

풀이:

$$ \int_0^5 2\,dt = 2 \times 5 = 10 $$

해설: 유량이 일정하면 적분은 속도 × 시간과 같은 뜻이 된다. 즉 초당 양을 시간 전체에 걸쳐 누적한 값이다.

간단한 정적분 계산하기 문제: 다음 값을 구하라.

$$ \int_0^2 x\,dx $$

풀이: 원시함수는

$$ \frac{x^2}{2} $$

이므로

$$ \int_0^2 x\,dx = \left[\frac{x^2}{2}\right]_0^2 =2 $$

해설: 그래프로 보면 밑변 2, 높이 2인 삼각형의 넓이와도 같다. 넓이 해석과 누적 해석이 같은 값을 준다.

밀도에서 확률 구하기 문제: 확률밀도함수

$$ p(x)=\frac{1}{2} $$

가 구간

$$ [0,2] $$

에서만 정의될 때,

$$ P(0 \le X \le 1) $$

을 구하라.

풀이:

$$ P(0 \le X \le 1)=\int_0^1 \frac{1}{2}\,dx = \frac{1}{2} $$

해설: 밀도 함수값 자체는 확률이 아니고, 구간 위에서 적분한 값이 확률이다. 길이 1인 구간에서 높이

$$ \frac{1}{2} $$

를 누적했으므로 확률은

$$ \frac{1}{2} $$

이다.

스스로 점검

적분이 왜 작은 조각들의 합에서 시작하는지 설명할 수 있는가?
정적분이 왜 넓이와 누적량을 동시에 뜻할 수 있는지 설명할 수 있는가?
식

$$ \int_a^b f(x)\,dx = F(b)-F(a) $$

가 왜 미분과 적분의 연결을 보여 주는지 설명할 수 있는가? 4. 확률밀도함수의 함수값이 왜 직접 확률이 아닌지 설명할 수 있는가? 5. 누적분포함수

$$ F(x)=\int_{-\infty}^x p(t)\,dt $$

의 뜻을 말로 설명할 수 있는가?