콘텐츠로 이동

문제 해설 - 06. 머신러닝 이론

이 페이지는 06. 머신러닝 이론 단계의 모든 연습문제 해설을 모아 둔 페이지입니다. - 정답만 보는 대신 어떤 정의와 원리를 써야 하는지까지 함께 적었습니다. - 손으로 먼저 풀어 본 뒤 해설을 읽고, 막힌 지점을 표시하며 복기하는 용도로 씁니다.

27. 선형회귀와 최소제곱

문제 1

  • 문제: 선형회귀를 한 문장으로 설명하라.
  • 해설: 입력 변수들의 선형결합으로 출력 값을 예측하는 모델이다.

문제 2

  • 문제: 잔차 제곱합을 줄인다는 말의 의미를 설명하라.
  • 해설: 예측값과 실제값 차이의 제곱을 모두 더한 값을 작게 만들어 전체 오차를 줄인다는 뜻이다.

문제 3

  • 문제: y = 3x - 2에서 x=4일 때 예측값을 구하라.
  • 해설: 10이다.

문제 4

  • 문제: 선형회귀가 좋은 baseline인 이유를 설명하라.
  • 해설: 단순하고 해석이 쉬우며, 데이터 관계가 선형에 가까운 경우 surprisingly 강력하기 때문이다.

28. 로지스틱 회귀와 지수족

문제 1

  • 문제: 로지스틱 회귀와 선형회귀의 가장 큰 차이를 설명하라.
  • 해설: 선형회귀는 연속값을 예측하고, 로지스틱 회귀는 시그모이드를 통해 이진 확률을 예측한다.

문제 2

  • 문제: 시그모이드 함수가 필요한 이유를 설명하라.
  • 해설: 선형결합 결과를 0과 1 사이 확률값으로 바꾸기 위해서다.

문제 3

  • 문제: 로짓이란 무엇인가?
  • 해설: 확률의 odds에 로그를 취한 값으로, 로지스틱 회귀에서는 이 값을 선형식으로 모델링한다.

문제 4

  • 문제: 이진 분류에서 BCE 손실이 쓰이는 이유를 설명하라.
  • 해설: 정답 확률을 높이고 잘못된 확신을 강하게 벌주며, Bernoulli 모델의 음의 로그우도와 연결되기 때문이다.

29. PCA와 잠재공간

문제 1

  • 문제: PCA의 핵심 목적을 한 문장으로 설명하라.
  • 해설: 데이터 분산을 가장 많이 설명하는 축을 찾아 차원을 줄이는 것이다.

문제 2

  • 문제: 주성분이란 무엇인가?
  • 해설: 데이터 분산을 가장 많이 설명하는 방향이다.

문제 3

  • 문제: 잠재공간이 필요한 이유를 설명하라.
  • 해설: 관측 데이터의 복잡한 구조를 더 적은 차원과 더 해석 가능한 표현으로 요약할 수 있기 때문이다.

문제 4

  • 문제: PCA와 투영의 관계를 설명하라.
  • 해설: PCA는 찾은 주성분 축 위로 데이터를 투영해 새로운 좌표계에서 표현한다.

30. 커널방법과 RKHS 직관

문제 1

  • 문제: 커널트릭의 핵심 아이디어를 설명하라.
  • 해설: 고차원 특징벡터를 직접 만들지 않고도 내적 값을 통해 같은 효과를 얻는 것이다.

문제 2

  • 문제: 커널값이 유사도와 연결되는 이유를 설명하라.
  • 해설: 커널은 특징공간에서의 내적을 계산하는 함수로 볼 수 있어, 두 입력이 얼마나 비슷한지를 나타내기 때문이다.

문제 3

  • 문제: 비선형 문제를 선형처럼 푼다는 말의 의미를 설명하라.
  • 해설: 원래 입력공간이 아니라 더 높은 특징공간으로 보낸 뒤 সেখানে 선형 경계나 선형 연산을 적용한다는 뜻이다.

문제 4

  • 문제: RKHS를 왜 함수공간 관점으로 이해하면 좋은가?
  • 해설: 함수 자체를 벡터처럼 다뤄 내적과 노름, 일반화 개념을 확장할 수 있기 때문이다.

31. 그래픽모델, EM, 잠재변수

문제 1

  • 문제: 잠재변수가 무엇인지 설명하라.
  • 해설: 직접 관측되지는 않지만 관측 데이터를 설명하는 숨은 변수다.

문제 2

  • 문제: EM의 E-step에서는 무엇을 하는가?
  • 해설: 현재 파라미터로 잠재변수의 posterior나 기대값을 추정한다.

문제 3

  • 문제: 그래픽모델이 주는 장점을 한 가지 설명하라.
  • 해설: 변수들 사이의 의존성과 독립 관계를 시각적으로 명확하게 표현할 수 있다.

문제 4

  • 문제: 조건부독립이 중요한 이유를 설명하라.
  • 해설: 복잡한 결합확률을 더 작은 조각으로 분해해 계산을 단순화할 수 있기 때문이다.

사용법

  • 먼저 문제를 풀고 답을 적은 뒤 해설을 본다.
  • 해설을 읽을 때는 어떤 정의를 먼저 떠올려야 하는지 표시한다.
  • 틀린 문제는 다시 풀어 보고, 같은 유형을 다음 강의 전에 한 번 더 복습한다.