문제 해설 - 04. 확률과 통계
이 페이지는 17강부터 21강까지의 연습문제를 다시 확인하는 해설 페이지입니다. 확률과 통계 문제는 숫자 계산보다 무엇을 먼저 정해야 하는가가 더 중요하므로, 각 해설도 그 순서를 그대로 따릅니다.
해설을 읽는 순서
- 전체 기준이 무엇인지 먼저 정합니다.
- 관심 있는 대상이 무엇인지 그다음 정합니다.
- 필요한 정의와 공식을 떠올립니다.
- 계산 후에는 결과를 말로 다시 해석합니다.
17. 조합론과 확률
문제 1
- 문제: 동전 두 개를 던질 때 표본공간은 무엇인가?
- 해설:
(앞,앞),(앞,뒤),(뒤,앞),(뒤,뒤)다.
문제 2
- 문제: 순서가 중요한 경우와 중요하지 않은 경우의 차이는 무엇인가?
- 해설: 순서가 중요하면 같은 대상도 배열이 다르면 다른 경우로 세고, 중요하지 않으면 같은 묶음으로 본다.
문제 3
- 문제: 주사위를 한 번 던질 때 짝수가 나올 확률은 얼마인가?
- 해설: 전체 6가지 중 짝수는 3가지이므로
1/2다.
문제 4
- 문제: 조건이 붙으면 왜 다시 세어야 하는가?
- 해설: 조건이 붙으면 표본공간 자체가 바뀌기 때문이다.
18. 확률변수와 주요 분포
문제 1
- 문제: 확률변수는 왜 필요한가?
- 해설: 무작위 결과를 숫자로 바꾸어 평균, 분산, 분포 계산을 가능하게 하기 때문이다.
문제 2
- 문제: 이산값과 연속값의 차이는 무엇인가?
- 해설: 이산값은 셀 수 있게 나뉘어 있고, 연속값은 구간 안에서 이어진다.
문제 3
- 문제: 동전 한 번 던지기는 왜 베르누이 상황인가?
- 해설: 가능한 결과가 성공과 실패 두 값뿐이기 때문이다.
문제 4
- 문제: 동전 여러 번의 성공 횟수는 왜 이항분포로 읽는가?
- 해설: 같은 시도를 여러 번 반복하고 성공 횟수를 세기 때문이다.
19. 기대값, 분산, 공분산
문제 1
- 문제: 평균만으로는 무엇을 놓치기 쉬운가?
- 해설: 값들이 얼마나 퍼져 있는지와 두 값이 함께 움직이는 관계를 놓치기 쉽다.
문제 2
- 문제: 분산이 0이라는 뜻은 무엇인가?
- 해설: 모든 값이 중심과 같아 퍼짐이 전혀 없다는 뜻이다.
문제 3
- 문제: 공분산이 양수라는 뜻은 무엇인가?
- 해설: 한 값이 커질 때 다른 값도 함께 커지는 경향이 있다는 뜻이다.
문제 4
- 문제: 상관은 왜 필요한가?
- 해설: 공분산은 단위 영향을 받기 쉬워서, 비교하기 쉬운 척도로 바꿀 필요가 있기 때문이다.
20. 통계적 추정, MLE, MAP, 베이즈
문제 1
- 문제: 표본과 모수의 차이는 무엇인가?
- 해설: 표본은 실제로 본 데이터이고, 모수는 그 데이터를 만들어 낸 모집단의 성질을 나타내는 값이다.
문제 2
- 문제: MLE는 무엇을 고르는 방법인가?
- 해설: 데이터를 가장 잘 설명하는 모수를 고르는 방법이다.
문제 3
- 문제: MAP는 MLE와 무엇이 다른가?
- 해설: MAP는 데이터뿐 아니라 사전정보까지 함께 본다.
문제 4
- 문제: 베이즈 업데이트는 왜 필요한가?
- 해설: 새 데이터를 만날 때 기존 믿음을 고쳐 써야 하기 때문이다.
21. 가설검정, 신뢰구간, 실험설계
문제 1
- 문제: 귀무가설과 대립가설의 차이는 무엇인가?
- 해설: 귀무가설은 차이가 없다는 기본 가설이고, 대립가설은 차이가 있다는 가설이다.
문제 2
- 문제: 무작위 배정이 왜 중요한가?
- 해설: 두 집단이 처음부터 다르지 않도록 하여 비교를 공정하게 만들기 때문이다.
문제 3
- 문제: 신뢰구간은 왜 필요한가?
- 해설: 추정값 하나만으로는 불확실성을 알 수 없기 때문에 범위를 함께 보여 주어야 한다.
문제 4
- 문제: 데이터가 있어도 바로 결론 내리면 안 되는 이유는 무엇인가?
- 해설: 우연한 차이일 가능성을 따지지 않으면 잘못된 판단을 내릴 수 있기 때문이다.
사용법
- 문제를 다시 풀기 전에
전체 기준,관심 대상,정의를 먼저 적어 봅니다. - 계산보다 순서를 먼저 확인합니다.
- 해설을 읽은 뒤에는 반드시 말로 다시 설명해 봅니다.