콘텐츠로 이동

이 강의는 순서 있게 놓인 숫자들의 나열을 수열로 읽고, 그 나열을 차례대로 더한 것을 급수로 읽고, 긴 반복덧셈을 시그마 기호로 짧게 적는 법을 배우는 강의입니다. 뒤에서 평균, 손실합, 확률합, 배치 단위 계산을 읽을 때 모두 이 언어가 다시 등장합니다.

먼저 알아둘 말

  • 수열: 순서가 있는 숫자들의 나열이다.
  • 항: 수열 안에 있는 각각의 숫자다.
  • 일반항: 몇 번째 항인지 알면 바로 그 값을 구할 수 있게 적은 식이다.
  • 점화식: 앞의 항을 이용해 다음 항을 정하는 식이다.
  • 급수: 수열의 항들을 차례대로 더한 것이다.
  • 부분합: 앞에서부터 몇 개 항만 더한 값이다.
  • 시그마: 반복해서 더하는 과정을 짧게 적는 기호다.

이 강의에서 답할 질문

  • 수열은 왜 그냥 숫자 모음이 아니라 순서 있는 대상인가?
  • 수열과 급수는 무엇이 다른가?
  • 부분합은 왜 따로 보는가?
  • 시그마는 어떤 긴 덧셈을 짧게 적어 주는가?
  • 평균과 손실합을 읽을 때 시그마가 왜 자연스럽게 나오는가?

먼저 떠올릴 장면

매일 공부한 시간을 적는다고 해 봅시다. 첫째 날 1시간, 둘째 날 2시간, 셋째 날 3시간처럼 기록하면 이것은 단순히 숫자 세 개가 아니라 "순서가 있는 기록"입니다.

이때 하루하루의 기록은 수열처럼 볼 수 있고, 지금까지 총 몇 시간을 공부했는지는 그 수열을 더한 급수처럼 볼 수 있습니다.

즉 수열은 목록이고, 급수는 그 목록을 누적해서 더한 결과입니다.

수열은 왜 순서가 중요할까

아래 두 목록을 보겠습니다.

$$ 2,\ 4,\ 6,\ 8,\ \dots $$

$$ 8,\ 6,\ 4,\ 2,\ \dots $$

들어 있는 숫자 종류는 비슷해 보여도, 순서가 다르므로 다른 수열입니다. 수열은 단지 어떤 숫자가 들어 있는가만 보는 것이 아니라, 몇 번째 자리에 어떤 숫자가 오는가를 함께 봅니다.

그래서 수열을 읽을 때는 항상 "첫째 항, 둘째 항, 셋째 항..."처럼 위치를 같이 생각해야 합니다.

항과 일반항은 무엇을 말하는가

수열 안의 숫자 하나하나를 항이라고 합니다. 예를 들어 아래 수열에서

$$ 2,\ 4,\ 6,\ 8,\ \dots $$

첫째 항은 2, 둘째 항은 4, 셋째 항은 6입니다.

이 수열은 매번 2씩 커집니다. 그래서 n번째 항은 다음처럼 쓸 수 있습니다.

$$ a_n = 2n $$

이 식을 일반항이라고 합니다. 일반항은 "몇 번째 항인지 알면 바로 값을 구할 수 있게 해 주는 식"입니다.

예를 들어 다섯째 항은

$$ a_5 = 2 \cdot 5 = 10 $$

이 됩니다.

점화식은 앞의 항으로 다음 항을 만든다

모든 수열을 일반항으로 바로 쓰는 것은 아닙니다. 어떤 수열은 앞의 항을 이용해 다음 항을 정하는 방식이 더 자연스럽습니다.

예를 들어 아래처럼 시작한다고 해 봅시다.

$$ a_1 = 2 $$

그리고 다음 항은 항상 바로 앞 항에 2를 더해 만든다고 하면

$$ a_{n+1} = a_n + 2 $$

라고 적을 수 있습니다.

이런 식을 점화식이라고 합니다. 일반항은 위치에서 바로 값을 읽는 방식이고, 점화식은 앞의 값을 이어 받아 다음 값을 만드는 방식입니다.

급수는 수열과 무엇이 다른가

수열과 급수는 이름이 비슷하지만 전혀 다른 대상입니다.

수열은 나열입니다.

$$ 2,\ 4,\ 6,\ 8,\ \dots $$

급수는 그 항들을 더한 것입니다.

$$ 2 + 4 + 6 + 8 + \dots $$

즉 수열은 목록이고, 급수는 누적합입니다. 이 차이를 분명히 알아야 뒤에서 평균과 총합을 헷갈리지 않습니다.

부분합은 왜 중요한가

무한히 계속되는 수열을 한 번에 다 더할 수는 없습니다. 그래서 앞에서부터 몇 개까지만 더한 값을 먼저 봅니다. 이것이 부분합입니다.

예를 들어 아래 수열을 보겠습니다.

$$ 2,\ 4,\ 6,\ 8,\ \dots $$

앞의 네 항만 더하면

$$ 2 + 4 + 6 + 8 = 20 $$

입니다. 이 값이 네 번째 부분합입니다.

부분합을 보면 "지금까지 얼마나 쌓였는가"를 알 수 있습니다. 뒤에서 손실을 미니배치마다 합치거나, 평균을 내기 전 총합을 구할 때도 이 감각이 그대로 쓰입니다.

시그마는 긴 덧셈을 짧게 적는 기호다

반복해서 더하는 식이 길어지면 매번 전부 적는 것이 불편합니다. 예를 들어 아래 합을 보겠습니다.

$$ 1 + 2 + 3 + 4 + 5 $$

이것을 시그마로 적으면

$$ \sum_{i=1}^{5} i $$

가 됩니다.

이 식에서 아래쪽 i = 1은 시작점을 뜻하고, 위쪽 5는 끝점을 뜻합니다. 가운데 i는 "더할 식의 모양"을 나타냅니다.

즉 시그마는 "어디서 시작해서 어디까지, 어떤 모양으로 더할 것인가"를 한 줄로 적는 기호입니다.

시그마를 실제 덧셈으로 펼쳐 읽기

시그마는 기호만 보면 추상적으로 느껴질 수 있습니다. 그래서 처음에는 반드시 펼쳐서 읽어야 합니다.

아래 식을 보겠습니다.

$$ \sum_{i=1}^{3} i $$

이것은 다음 뜻입니다.

$$ 1 + 2 + 3 $$

따라서 값은

$$ 6 $$

입니다.

또 아래 식은

$$ \sum_{k=1}^{4} 2k $$

다음처럼 펼쳐집니다.

$$ 2 \cdot 1 + 2 \cdot 2 + 2 \cdot 3 + 2 \cdot 4 $$

$$ 2 + 4 + 6 + 8 = 20 $$

입니다.

시그마를 읽을 때는 바로 계산하려 하지 말고, 먼저 어떤 항들이 차례대로 더해지는지 펼쳐 보는 것이 중요합니다.

평균식은 왜 시그마와 자연스럽게 이어지는가

평균은 "모든 값을 더한 뒤 개수로 나눈 것"입니다. 이 말은 매우 익숙하지만, 시그마로 쓰면 다음과 같습니다.

$$ \frac{1}{n}\sum_{i=1}^{n} x_i $$

이 식은 새 내용이 아니라, 우리가 이미 알고 있는 평균을 압축해서 쓴 것입니다.

예를 들어 세 값 3, 5, 7의 평균은

$$ \frac{3+5+7}{3} $$

이고, 시그마로 쓰면

$$ \frac{1}{3}\sum_{i=1}^{3} x_i $$

처럼 적을 수 있습니다. 여기서 x_1 = 3, x_2 = 5, x_3 = 7이라고 보면 됩니다.

즉 평균식은 어려운 새 공식이 아니라, 반복합을 짧게 적은 식입니다.

AI 수학에서 시그마가 자주 나오는 이유

머신러닝에서는 데이터 하나하나에 대해 값이 생기고, 그것들을 모두 더하거나 평균내는 일이 매우 많습니다.

예를 들어 데이터 n개에 대한 손실을 모두 더하면 아래처럼 씁니다.

$$ \sum_{i=1}^{n} L_i $$

평균 손실을 보려면

$$ \frac{1}{n}\sum_{i=1}^{n} L_i $$

처럼 씁니다.

즉 시그마는 어려운 이론 기호가 아니라, "하나씩 계산한 값을 전부 모으는 법"을 적는 실무 언어입니다.

예제

  1. 일반항 찾기 문제: 아래 수열의 일반항을 구하라.

$$ 2,\ 4,\ 6,\ 8,\ \dots $$

풀이: n번째 항은 항상 2n배이므로

$$ a_n = 2n $$

이다.

해설: 일반항은 몇 번째 항인지 알면 바로 값을 계산할 수 있게 해 주는 식이다.

  1. 부분합 구하기 문제: 아래 수열의 앞 네 항의 합을 구하라.

$$ 2,\ 4,\ 6,\ 8,\ \dots $$

풀이: 앞 네 항을 더하면

$$ 2 + 4 + 6 + 8 = 20 $$

이다.

해설: 수열은 나열이고, 그 나열을 더한 결과가 급수이며, 앞에서 몇 개만 더한 값은 부분합이다.

  1. 시그마 펼쳐 읽기 문제: 아래 시그마를 계산하라.

$$ \sum_{i=1}^{3} i $$

풀이: 먼저 펼친다.

$$ 1 + 2 + 3 $$

따라서

$$ 6 $$

이다.

해설: 시그마를 읽을 때는 시작점, 끝점, 더할 식의 모양을 먼저 확인해야 한다.

  1. 평균을 시그마로 읽기 문제: 수 3, 5, 7의 평균을 구하고, 그것이 시그마와 어떻게 연결되는지 설명하라.

풀이: 평균은

$$ \frac{3+5+7}{3} = 5 $$

이다.

시그마로는

$$ \frac{1}{3}\sum_{i=1}^{3} x_i $$

처럼 쓸 수 있다.

해설: 평균은 특별한 새 공식이 아니라, 전체 합을 개수로 나눈 것이다. 시그마는 그 전체 합을 짧게 적어 준다.

스스로 점검

연습 문제

  1. 아래 수열의 일반항을 구하라.

$$ 2,\ 4,\ 6,\ 8,\ \dots $$

  1. 아래 수열의 다섯째 항을 구하라.

$$ a_n = 2n $$

  1. 아래 시그마를 계산하라.

$$ \sum_{k=1}^{4} 2k $$

  1. 3, 5, 7의 평균을 구하라.

  2. 언어모델에서 토큰별 손실을 모두 더하는 식에 시그마가 왜 자연스럽게 쓰이는지 설명하라.

복습 질문

  1. 수열과 급수는 왜 다른가?
  2. 일반항과 점화식은 각각 어떤 방식으로 수열을 설명하는가?
  3. 부분합은 왜 누적된 양을 보는 데 중요한가?
  4. 시그마의 아래와 위는 각각 무엇을 뜻하는가?
  5. 평균식이 왜 시그마와 자연스럽게 이어지는가?

체크포인트

  1. 수열, 급수, 부분합을 구분할 수 있다.
  2. 일반항과 점화식의 차이를 말할 수 있다.
  3. 시그마를 실제 덧셈으로 펼쳐 읽을 수 있다.
  4. 평균과 손실합을 반복합 관점으로 설명할 수 있다.