콘텐츠로 이동

이 강의는 여러 수를 하나의 대상처럼 묶어 다루는 이유를 배우고, 그 묶음을 기준 벡터들의 조합으로 읽는 법을 익히는 강의입니다. 벡터, 기저, 차원이라는 말을 처음부터 추상적으로 외우기보다, 점과 방향을 적는 언어가 왜 필요한지에서 시작하는 것이 중요합니다.

먼저 알아둘 말

  • 벡터: 여러 수를 순서 있게 묶어 하나의 대상으로 보는 표현이다.
  • 성분: 벡터를 이루는 각각의 숫자다.
  • 스칼라: 벡터를 몇 배 할 때 쓰는 보통의 수다.
  • 선형결합: 벡터들을 몇 배씩 한 뒤 더해서 만드는 것이다.
  • 기저: 다른 벡터들을 만들어 내는 기준 벡터 묶음이다.
  • 차원: 공간을 설명하는 데 필요한 독립적인 기준 벡터의 개수다.
  • 좌표: 기준 벡터를 얼마씩 썼는지 적은 숫자다.
  • 벡터공간: 벡터를 더하고 스칼라배해도 같은 종류의 벡터로 남는 공간이다.

이 강의에서 답할 질문

  • 왜 여러 수를 하나의 덩어리처럼 다루어야 하는가?
  • 벡터는 단순한 숫자 목록과 무엇이 다른가?
  • 좌표는 왜 기저가 정해져야 의미가 생기는가?
  • 차원은 정확히 무엇을 세는 말인가?
  • 벡터공간이라는 말은 왜 필요한가?

먼저 떠올릴 장면

평면의 한 점을 생각해 보겠습니다. 오른쪽으로 3, 위로 2만큼 간 위치를 적으려면 보통 이렇게 씁니다.

$$ (3, 2) $$

이 표현은 숫자 두 개의 목록처럼 보이지만, 실제로는 하나의 위치를 나타냅니다. 즉 두 숫자를 따로따로 보기보다, 함께 움직이는 하나의 대상으로 보는 것이 더 자연스럽습니다.

AI에서도 비슷합니다. 어떤 단어를 여러 특징 숫자로 나타내면, 그 숫자들은 따로 노는 것이 아니라 함께 한 대상을 설명합니다. 이럴 때 벡터라는 말이 필요해집니다.

왜 여러 수를 하나의 대상으로 묶는가

숫자 하나로는 한 방향의 크기만 적을 수 있습니다. 하지만 위치나 방향, 여러 특징을 동시에 적으려면 숫자 여러 개가 필요합니다.

예를 들어 평면의 위치를 적으려면 가로 방향 숫자와 세로 방향 숫자가 함께 있어야 합니다.

$$ (x, y) $$

이 두 숫자는 각각 따로 의미가 있는 동시에, 합쳐서 하나의 점이나 방향을 나타냅니다. 그래서 우리는 이런 묶음을 벡터로 봅니다.

즉 벡터는 "숫자가 여러 개 있다"는 사실보다 "그 숫자들이 함께 한 대상을 설명한다"는 점이 핵심입니다.

벡터는 점이기도 하고 방향이기도 하다

아래 벡터를 봅시다.

$$ (3, 2) $$

이 벡터는 원점에서 오른쪽으로 3, 위로 2만큼 간 점처럼 볼 수 있습니다. 동시에 "오른쪽으로 3, 위로 2만큼 움직이는 방향"처럼 볼 수도 있습니다.

즉 벡터는 위치를 적는 언어이기도 하고, 이동을 적는 언어이기도 합니다.

이 두 관점은 뒤에서 모두 중요합니다. 데이터 한 개를 임베딩 벡터로 볼 때는 특징 위치처럼 읽고, 기울기를 볼 때는 변화 방향처럼 읽게 됩니다.

벡터의 덧셈은 무엇을 뜻하는가

벡터를 더한다는 것은 각 성분을 따로 더하는 것입니다.

예를 들어

$$ v = (2, 1), \quad w = (1, 3) $$

라면

$$ v + w = (2+1, 1+3) = (3, 4) $$

입니다.

이것을 이동 관점에서 보면, 먼저 v만큼 움직이고 다시 w만큼 움직인 결과를 한 번에 적은 것이 v+w입니다.

즉 벡터 덧셈은 숫자 놀이가 아니라, 여러 방향 효과를 합치는 방법입니다.

스칼라배는 몇 배 늘리거나 줄이는 것이다

벡터를 수로 곱하는 것을 스칼라배라고 합니다.

예를 들어

$$ 2(3, 2) = (6, 4) $$

입니다.

이 뜻은 방향은 같고 길이만 두 배가 되었다는 뜻입니다. 반대로

$$ \frac{1}{2}(3, 2) = \left(\frac{3}{2}, 1\right) $$

은 같은 방향으로 절반만 간다는 뜻으로 읽을 수 있습니다.

즉 스칼라배는 벡터의 "강도"를 조절하는 연산입니다.

선형결합은 벡터를 조합해 만드는 방식이다

벡터를 몇 배씩 해서 더하면 새로운 벡터를 만들 수 있습니다. 이것을 선형결합이라고 합니다.

예를 들어 아래 두 벡터를 생각해 봅시다.

$$ e_1 = (1, 0), \quad e_2 = (0, 1) $$

그러면

$$ 3e_1 + 2e_2 $$

$$ 3(1,0) + 2(0,1) = (3,0) + (0,2) = (3,2) $$

가 됩니다.

(3,2)e_1e_2를 적절히 조합해서 만든 벡터입니다. 이 생각이 기저를 이해하는 핵심입니다.

기저는 왜 필요한가

어떤 공간의 모든 벡터를 만들 수 있는 기준 벡터들이 있으면, 우리는 그 기준을 바탕으로 모든 벡터를 적을 수 있습니다. 이 기준 벡터 묶음을 기저라고 합니다.

평면에서는 가장 익숙한 기저가 아래 두 벡터입니다.

$$ e_1 = (1,0), \quad e_2 = (0,1) $$

이 기저를 쓰면 모든 평면 벡터는

$$ (x, y) = xe_1 + ye_2 $$

처럼 쓸 수 있습니다.

즉 기저는 "벡터를 읽는 기준 축"입니다. 기저가 있어야 좌표도 의미를 갖습니다.

좌표는 왜 기저가 정해져야 의미가 있을까

숫자 (3,2)만 보면 그 자체로는 무엇을 기준으로 적은 것인지 숨겨져 있습니다. 보통은 표준기저

$$ e_1 = (1,0), \quad e_2 = (0,1) $$

를 당연하게 쓰기 때문에 바로 이해할 뿐입니다.

하지만 기준 벡터를 다른 것으로 잡으면, 같은 벡터도 다른 숫자로 적힐 수 있습니다.

즉 좌표는 벡터 자체가 아니라, "어떤 기저를 얼마나 썼는가"를 적은 표현입니다. 그래서 기저를 먼저 정해야 좌표도 의미가 생깁니다.

차원은 무엇을 세는가

차원은 좌표에 숫자가 몇 개 들어가는가만 세는 말이 아닙니다. 더 정확하게는, 그 공간의 벡터들을 만들기 위해 필요한 독립적인 기준 벡터가 몇 개인가를 세는 말입니다.

평면에서는 두 개의 기준 벡터가 필요합니다.

$$ e_1 = (1,0), \quad e_2 = (0,1) $$

그래서 2차원입니다.

공간에서는 보통 세 개가 필요합니다.

$$ (x, y, z) $$

그래서 3차원입니다.

즉 차원은 "공간을 설명하는 데 필요한 독립적인 방향의 수"를 세는 말입니다.

벡터공간이라는 말은 왜 필요한가

이제 벡터공간이라는 말을 붙일 수 있습니다. 벡터공간은 벡터들을 모아 놓은 공간인데, 중요한 조건은 두 가지입니다.

벡터 둘을 더해도 그 공간 안에 있어야 하고,

$$ v + w $$

벡터를 수로 몇 배 해도 그 공간 안에 있어야 합니다.

$$ cv $$

즉 더하기와 스칼라배를 해도 같은 종류의 대상으로 남는 공간을 벡터공간이라고 부릅니다.

예를 들어 평면의 모든 벡터 집합은 벡터공간입니다. 두 평면 벡터를 더해도 여전히 평면 벡터이고, 몇 배 해도 여전히 평면 벡터이기 때문입니다.

벡터공간이라는 말은 "이 공간에서는 선형결합을 마음 놓고 할 수 있다"는 뜻을 한 번에 담아 줍니다.

임베딩은 왜 벡터로 보는가

AI에서 임베딩은 대상을 여러 특징 숫자로 적은 표현입니다. 예를 들어 어떤 단어를 길이 d의 숫자 목록으로 적으면 다음처럼 볼 수 있습니다.

$$ (x_1, x_2, \dots, x_d) $$

이것은 단순한 목록이 아니라, d개의 특징 축 위에서 한 대상을 적은 벡터입니다.

그래서 임베딩은 벡터 덧셈, 길이, 방향, 유사도 같은 개념으로 자연스럽게 다룰 수 있습니다. 뒤에서 어텐션이나 표현학습을 읽을 때도 이 감각이 바탕이 됩니다.

예제

  1. 기저로 표현하기 문제: 아래 벡터를 표준기저

$$ e_1 = (1,0), \quad e_2 = (0,1) $$

로 표현하라.

$$ (3,2) $$

풀이: e_1을 세 번, e_2를 두 번 쓰면 된다.

$$ (3,2) = 3e_1 + 2e_2 $$

해설: 표준기저에서는 좌표가 곧 각 기저를 몇 번 썼는지를 말한다.

  1. 벡터 더하기 문제: 아래 두 벡터의 합을 구하라.

$$ v = (2,1), \quad w = (1,3) $$

풀이: 성분끼리 더하면 된다.

$$ v+w = (2+1, 1+3) = (3,4) $$

해설: 벡터 덧셈은 여러 이동 효과를 한 번에 합치는 계산으로 읽을 수 있다.

  1. 스칼라배 읽기 문제: 아래 값을 구하라.

$$ 2(3,2) $$

풀이: 각 성분을 두 배 한다.

$$ 2(3,2) = (6,4) $$

해설: 스칼라배는 방향은 유지하면서 크기를 조절하는 연산이다.

  1. 차원 설명하기 문제: 3차원이라는 말의 뜻을 설명하라.

풀이: 그 공간의 벡터를 만들고 설명하는 데 서로 독립적인 기준 벡터가 세 개 필요하다는 뜻이다.

해설: 차원은 좌표 칸 수를 세는 말처럼 보이지만, 실제로는 필요한 기준 방향의 수를 세는 말이다.

스스로 점검

연습 문제

  1. 아래 두 벡터의 합을 구하라.

$$ (1,2) + (3,4) $$

  1. 아래 벡터를 표준기저의 선형결합으로 쓰라.

$$ (5,-1) $$

  1. 아래 값을 구하라.

$$ 3(1,-2) $$

  1. 차원이 3이라는 말의 뜻을 설명하라.

  2. 임베딩을 벡터라고 부르는 이유를 기준 축과 좌표라는 말로 설명하라.

복습 질문

  1. 벡터는 왜 여러 수를 하나의 대상으로 보는 언어인가?
  2. 좌표는 왜 기저가 정해져야 의미가 생기는가?
  3. 선형결합은 무엇을 뜻하는가?
  4. 차원은 무엇을 세는 값인가?
  5. 벡터공간이라는 말은 왜 필요한가?

체크포인트

  1. 벡터를 점과 방향의 언어로 설명할 수 있다.
  2. 벡터 덧셈과 스칼라배를 계산할 수 있다.
  3. 기저와 좌표의 관계를 말할 수 있다.
  4. 차원을 기준 벡터 개수의 관점에서 설명할 수 있다.
  5. 임베딩을 벡터 관점으로 이해할 수 있다.