8강에서 행렬을 여러 가중합을 한꺼번에 계산하는 표로 읽었습니다. 9강에서는 그 행렬을 한 단계 더 깊게 읽습니다. 행렬은 단순한 숫자표가 아니라 벡터를 다른 벡터로 보내는 규칙, 즉 선형변환으로 볼 수 있습니다. 그리고 그 변환 속에는 방향이 바뀌지 않는 특별한 축이 숨어 있는데, 그것이 고유벡터와 고유값입니다.
먼저 알아둘 말
- 변환: 한 대상을 다른 대상으로 보내는 규칙이다.
- 선형변환: 더하기와 스칼라배 구조를 보존하는 변환이다.
- 불변방향: 변환을 받아도 같은 직선 위에 남는 방향이다.
- 고유벡터: 변환 뒤에도 방향이 바뀌지 않는 벡터다.
- 고유값: 그 고유벡터가 몇 배가 되는지를 나타내는 수다.
- 대각화: 기저를 잘 잡아 변환을 축별 늘림과 줄임으로 읽는 방식이다.
- 특성방정식: 고유값을 찾기 위해 세우는 방정식이다.
이 강의에서 답할 질문
- 행렬을 선형변환으로 본다는 말은 정확히 무슨 뜻인가?
- 왜 어떤 벡터는 변환 뒤에도 방향이 바뀌지 않을까?
- 고유값과 고유벡터는 어떻게 찾는가?
- 고유값의 크기와 부호는 변환의 어떤 성질을 말해 주는가?
- 왜 반복변환, 안정성, PCA에서 고유값이 중요할까?
먼저 떠올릴 장면
- 종이에 정사각형 격자를 그려 놓고, 가로로 늘이거나 세로로 줄이는 변환을 상상해 봅시다.
- 대부분의 화살표는 변환을 거치며 길이도 달라지고 방향도 바뀝니다.
- 그런데 어떤 축은 꺾이지 않고 그대로 늘어나거나 줄어듭니다.
- 복잡한 변환을 이해하려면 바로 이
방향이 안 바뀌는 축을 먼저 찾는 것이 핵심입니다.
생각의 순서
- 먼저 행렬을 선형변환으로 읽습니다.
- 그다음 선형변환이 왜 더하기와 스칼라배를 보존하는지 봅니다.
- 그 안에서 방향이 바뀌지 않는 벡터를 고유벡터로 정의합니다.
- 고유값 방정식을 세워 실제로 찾는 방법을 봅니다.
- 마지막으로 반복변환, 안정성, 차원축소에서 왜 중요한지 연결합니다.
본문
행렬을 단순히 숫자표로만 보면 계산은 가능하지만 의미가 잘 보이지 않습니다. 그러나 행렬을 벡터를 다른 벡터로 보내는 규칙으로 보면, 행렬은 공간을 바꾸는 기계처럼 읽힙니다.
예를 들어
$$ A= \begin{bmatrix} 2 & 0 \ 0 & 1 \end{bmatrix} $$
라고 합시다. 이 행렬을 벡터
$$ \begin{bmatrix} x \ y \end{bmatrix} $$
에 곱하면
$$ A \begin{bmatrix} x \ y \end{bmatrix} = \begin{bmatrix} 2x \ y \end{bmatrix} $$
가 됩니다.
이 식은 첫째 성분은 2배로 늘리고, 둘째 성분은 그대로 둔다는 뜻입니다. 즉 이 행렬은 평면 전체를 가로로만 두 배 늘리는 변환입니다. 이제 행렬은 숫자표가 아니라 공간을 바꾸는 규칙으로 보입니다.
선형변환은 아무 변환이나 다 되는 것이 아닙니다. 두 가지 약속을 지켜야 합니다.
첫째, 벡터를 먼저 더한 뒤 변환한 결과와, 각각 변환한 뒤 더한 결과가 같아야 합니다.
$$ T(u+v)=T(u)+T(v) $$
둘째, 벡터를 먼저 스칼라배한 뒤 변환한 결과와, 먼저 변환한 뒤 같은 스칼라를 곱한 결과가 같아야 합니다.
$$ T(cu)=cT(u) $$
이 두 성질은 벡터의 선형 구조를 망가뜨리지 않는다는 뜻입니다. 그래서 선형변환은 원점을 원점으로 보내고, 직선을 완전히 휘어 버리기보다 선형적인 구조를 유지합니다.
이제 핵심 질문이 생깁니다. 대부분의 벡터는 변환을 거치면 방향이 바뀝니다. 그런데 어떤 특별한 벡터는 방향은 그대로이고 길이만 변합니다. 이런 벡터를 고유벡터라고 합니다.
벡터
$$ v \neq 0 $$
가 고유벡터이고,
$$ \lambda $$
가 그에 대응하는 고유값이라는 말은 다음 식으로 씁니다.
$$ Av=\lambda v $$
이 식을 한 문장으로 읽으면 행렬 A가 벡터 v를 같은 방향 위에 남기고, 단지 \lambda배만 한다는 뜻입니다. 즉 고유벡터는 변환 속에서 끝까지 방향을 지키는 벡터이고, 고유값은 그 방향이 얼마나 늘어나거나 줄어드는지를 나타냅니다.
가장 쉬운 예는 대각행렬입니다.
$$ A= \begin{bmatrix} 2 & 0 \ 0 & 3 \end{bmatrix} $$
를 봅시다. 표준기저 벡터
$$ e_1= \begin{bmatrix} 1 \ 0 \end{bmatrix}, \qquad e_2= \begin{bmatrix} 0 \ 1 \end{bmatrix} $$
에 작용시키면
$$ Ae_1= \begin{bmatrix} 2 \ 0 \end{bmatrix} = 2e_1, \qquad Ae_2= \begin{bmatrix} 0 \ 3 \end{bmatrix} = 3e_2 $$
가 됩니다.
즉
$$ e_1,\ e_2 $$
는 고유벡터이고, 고유값은 각각
$$ 2,\ 3 $$
입니다. 대각행렬은 축을 서로 섞지 않기 때문에 고유값과 고유벡터를 가장 쉽게 읽을 수 있습니다.
하지만 일반 행렬에서는 눈으로 바로 보이지 않습니다. 그래서 실제로는 어떤 \lambda가 가능할까?를 먼저 묻습니다. 식
$$ Av=\lambda v $$
를 왼쪽으로 모으면
$$ Av-\lambda v=0 $$
입니다. 여기서
$$ \lambda v $$
는
$$ \lambda I v $$
로 쓸 수 있으므로
$$ (A-\lambda I)v=0 $$
를 얻습니다.
이제 중요한 점이 나옵니다. 우리는
$$ v \neq 0 $$
인 해를 원합니다. 그런데
$$ (A-\lambda I)v=0 $$
이 영벡터가 아닌 해를 가지려면
$$ A-\lambda I $$
가 역행렬을 가지면 안 됩니다. 즉 determinant가 0이어야 합니다.
$$ \det(A-\lambda I)=0 $$
이것이 특성방정식입니다. 이 방정식을 풀어 얻는
$$ \lambda $$
들이 고유값입니다. 그다음 각 고유값을 다시
$$ (A-\lambda I)v=0 $$
에 넣어 풀면 고유벡터를 구할 수 있습니다.
예를 들어
$$ A= \begin{bmatrix} 4 & 1 \ 0 & 2 \end{bmatrix} $$
라면
$$ A-\lambda I= \begin{bmatrix} 4-\lambda & 1 \ 0 & 2-\lambda \end{bmatrix} $$
이므로
$$ \det(A-\lambda I) =(4-\lambda)(2-\lambda) $$
입니다. 따라서 고유값은
$$ \lambda=4,\ 2 $$
입니다. 그다음 각 값을 대입해 고유벡터를 찾으면 됩니다. 즉 계산 순서는 고유값 먼저, 고유벡터 나중입니다.
고유값의 해석도 중요합니다. 고유값이
$$ 2 $$
면 그 방향은 두 배로 늘어납니다. 고유값이
$$ \frac{1}{2} $$
면 절반으로 줄어듭니다. 고유값이 음수면 방향이 반대로 뒤집히면서 크기도 조절됩니다. 고유값이
$$ 0 $$
이면 그 방향 성분은 완전히 눌려 사라집니다.
이제 왜 중요한지 봅시다. 만약
$$ Av=\lambda v $$
라면 한 번 더 적용했을 때
$$ A^2v=A(Av)=A(\lambda v)=\lambda Av=\lambda^2 v $$
가 됩니다. 같은 방식으로
$$ A^k v=\lambda^k v $$
입니다.
즉 고유벡터 방향에서는 복잡한 행렬의 반복 작용이 단순한 거듭제곱으로 바뀝니다. 그래서 고유값은 반복 시스템의 안정성, 동역학의 성장과 감쇠, 마코프 연쇄의 장기 거동, PCA의 주축 분석 등에서 핵심 역할을 합니다.
특히 PCA에서는 공분산행렬의 고유벡터가 분산이 큰 방향을 주고, 고유값은 그 방향의 분산 크기를 말해 줍니다. 즉 고유값 문제는 단순한 선형대수 연습이 아니라, 데이터를 어떤 축에서 가장 잘 볼 수 있는가를 결정하는 도구이기도 합니다.
결국 고유벡터는 변환을 이해하기 위한 자연스러운 기준축이고, 고유값은 그 축마다 변환이 얼마나 강하게 작용하는지 알려 주는 수입니다. 행렬을 고유벡터 방향에서 읽기 시작하면, 복잡한 변환도 방향별 늘림과 줄임의 조합으로 보이기 시작합니다.
예제
- 대각행렬에서 고유값 읽기 문제: 다음 행렬의 고유값과 대응하는 쉬운 고유벡터를 구하라.
$$ A= \begin{bmatrix} 2 & 0 \ 0 & 3 \end{bmatrix} $$
풀이: 표준기저 벡터를 넣어 보면 된다.
$$ A \begin{bmatrix} 1 \ 0 \end{bmatrix} = \begin{bmatrix} 2 \ 0 \end{bmatrix} = 2 \begin{bmatrix} 1 \ 0 \end{bmatrix} $$
$$ A \begin{bmatrix} 0 \ 1 \end{bmatrix} = \begin{bmatrix} 0 \ 3 \end{bmatrix} = 3 \begin{bmatrix} 0 \ 1 \end{bmatrix} $$
따라서 고유값은
$$ 2,\ 3 $$
이고, 대응하는 고유벡터는 각각
$$ \begin{bmatrix} 1 \ 0 \end{bmatrix}, \qquad \begin{bmatrix} 0 \ 1 \end{bmatrix} $$
이다. 해설: 대각행렬은 각 축을 서로 섞지 않기 때문에 고유값 문제를 가장 쉽게 보여 주는 예다.
- 특성방정식 세우기 문제: 다음 행렬의 특성방정식을 세우고 고유값을 구하라.
$$ A= \begin{bmatrix} 4 & 1 \ 0 & 2 \end{bmatrix} $$
풀이: 먼저
$$ A-\lambda I= \begin{bmatrix} 4-\lambda & 1 \ 0 & 2-\lambda \end{bmatrix} $$
이고,
$$ \det(A-\lambda I) =(4-\lambda)(2-\lambda) $$
이므로
$$ \det(A-\lambda I)=0 $$
에서
$$ \lambda=4,\ 2 $$
를 얻는다. 해설: 일반 행렬에서는 고유벡터를 바로 찾기보다, determinant로 고유값을 먼저 찾는 순서가 핵심이다.
- 반복변환의 효과 보기 문제: 어떤 벡터
$$ v $$
가
$$ Av=3v $$
를 만족한다고 하자. 그렇다면
$$ A^2v,\ A^3v $$
를 구하라. 풀이:
$$ A^2v=A(Av)=A(3v)=3Av=9v $$
$$ A^3v=A(A^2v)=A(9v)=9Av=27v $$
이다. 해설: 고유벡터 방향에서는 행렬의 반복 작용이 고유값의 거듭제곱으로 단순해진다.
스스로 점검
연습 문제
- 선형변환이 무엇을 보존하는 변환인지 설명하라.
- 고유벡터와 고유값의 관계를 식으로 쓰고, 그 뜻을 한 문장으로 설명하라.
- 왜
$$ \det(A-\lambda I)=0 $$
이 고유값을 찾는 식이 되는지 설명하라. 4. 고유값이 음수이거나 0일 때 변환이 어떻게 해석되는지 설명하라. 5. 왜 고유벡터 방향에서는
$$ A^k $$
의 계산이 쉬워지는지 설명하라.
복습 질문
- 행렬을 변환으로 읽는다는 것은 무엇을 본다는 뜻인가?
- 고유벡터는 왜 특별한 방향이라고 불릴 수 있는가?
- 고유값의 크기와 부호는 변환의 어떤 성질을 말해 주는가?
- PCA에서 고유값 문제가 왜 다시 등장하는가?
체크포인트
- 행렬을 선형변환으로 설명할 수 있다.
- 고유벡터와 고유값의 뜻을 식과 말로 모두 설명할 수 있다.
- 특성방정식을 왜 세우는지 이해한다.
- 반복변환과 안정성에서 고유값이 중요한 이유를 설명할 수 있다.