콘텐츠로 이동

do4ai Obsidian

문제 해설 - 06. 머신러닝 이론

do4ai Obsidian

do4ai Obsidian
Data Sources
Data Sources
- [UL]
  [UL]
  - Rows
    Rows
    
    상품이란
- 새 데이터베이스
  새 데이터베이스
  - Rows
    Rows
    
    김현우
- 새 데이터베이스 31fe313f
  새 데이터베이스 31fe313f
SenseCore AI LAB, AI융합학부
SenseCore AI LAB, AI융합학부
- Convention
  Convention
- Domains
  Domains
  - Domain Template
    
    Domain Template
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - OAuth 2.0
    
    OAuth 2.0
  - 논문 검사 솔루션
    
    논문 검사 솔루션
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - 에이전트 플랫폼
    
    에이전트 플랫폼
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - 자동차 경매
    
    자동차 경매
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
- Guide
  Guide
  - 00. SCAI LAB Guide 사용법
    
    00. SCAI LAB Guide 사용법
  - 10. 연구실 운영 개요
    
    10. 연구실 운영 개요
  - 20. 계정과 접근
    
    20. 계정과 접근
  - 30. 연구실 업무 도구
    
    30. 연구실 업무 도구
  - 40. 연구 개발 환경
    
    40. 연구 개발 환경
  - 50. 인프라와 플랫폼
    
    50. 인프라와 플랫폼
    
    ArgoCD 운영 흐름 가이드
    
    ArgoCD 운영 흐름 가이드
    
    GitOps 운영 모델 가이드
    
    GitOps 운영 모델 가이드
    
    Infisical 시크릿 관리 가이드
    
    Infisical 시크릿 관리 가이드
    
    Kubernetes 기본 구조 가이드
    
    Kubernetes 기본 구조 가이드
    
    Observability 운영 가이드
    
    Observability 운영 가이드
    
    k3s GitOps 운영 클러스터 초보자 가이드
    
    k3s GitOps 운영 클러스터 초보자 가이드
    
    K3s 운영 구조 가이드
    
    K3s 운영 구조 가이드
  - 60. 서비스 운영
    
    60. 서비스 운영
  - 70. 데이터, 관측, 보안
    
    70. 데이터, 관측, 보안
    
    k3s 운영 장애 Discord 리포트 설계
    
    k3s 운영 장애 Discord 리포트 설계
    
    운영 장애 Discord 리포트 솔루션 리서치
    
    운영 장애 Discord 리포트 솔루션 리서치
  - 80. 협업과 커뮤니케이션
    
    80. 협업과 커뮤니케이션
  - 90. 장애 대응과 운영 판단
    
    90. 장애 대응과 운영 판단
- Lecture
  Lecture
  - AI를 위한 수학
    
    AI를 위한 수학
    
    01. 숫자와 계산의 감각
    
    01. 숫자와 계산의 감각
    
    1. 문자와 식, 다항식의 구조
    
    1. 문자와 식, 다항식의 구조
    
    2. 방정식과 부등식
    
    2. 방정식과 부등식
    
    3. 함수와 그래프
    
    3. 함수와 그래프
    
    4. 지수와 로그
    
    4. 지수와 로그
    
    5. 수열, 급수, 시그마
    
    5. 수열, 급수, 시그마
    
    6. 삼각함수와 복소수
    
    6. 삼각함수와 복소수
    
    문제 해설 01. 숫자와 계산의 감각
    
    문제 해설 01. 숫자와 계산의 감각
    
    02. 벡터와 행렬의 시작
    
    02. 벡터와 행렬의 시작
    
    10. 직교성, 투영, 최소제곱
    
    10. 직교성, 투영, 최소제곱
    
    11. 특이값분해와 저랭크 근사
    
    11. 특이값분해와 저랭크 근사
    
    7. 벡터공간과 기저
    
    7. 벡터공간과 기저
    
    8. 행렬연산과 선형시스템
    
    8. 행렬연산과 선형시스템
    
    9. 선형변환과 고유값
    
    9. 선형변환과 고유값
    
    문제 해설 02. 식과 방정식의 언어
    
    문제 해설 02. 식과 방정식의 언어
    
    03. 그래프와 함수의 시야
    
    03. 그래프와 함수의 시야
    
    12. 극한, 연속, 미분
    
    12. 극한, 연속, 미분
    
    13. 다변수미분과 Jacobian
    
    13. 다변수미분과 Jacobian
    
    14. 적분, 누적량, 확률밀도
    
    14. 적분, 누적량, 확률밀도
    
    15. Taylor 전개와 근사
    
    15. Taylor 전개와 근사
    
    16. 미분방정식과 동역학
    
    16. 미분방정식과 동역학
    
    문제 해설 03. 미적분과 해석
    
    문제 해설 03. 미적분과 해석
    
    04. 경우의 수, 확률, 통계의 기초
    
    04. 경우의 수, 확률, 통계의 기초
    
    17. 조합론과 확률
    
    17. 조합론과 확률
    
    18. 확률변수와 주요 분포
    
    18. 확률변수와 주요 분포
    
    19. 기대값, 분산, 공분산
    
    19. 기대값, 분산, 공분산
    
    20. 통계적 추정, MLE, MAP, 베이즈
    
    20. 통계적 추정, MLE, MAP, 베이즈
    
    21. 가설검정, 신뢰구간, 실험설계
    
    21. 가설검정, 신뢰구간, 실험설계
    
    문제 해설 04. 확률과 통계
    
    문제 해설 04. 확률과 통계
    
    05. 최적화와 정보이론
    
    05. 최적화와 정보이론
    
    22. 볼록성, 제약최적화, 라그랑주
    
    22. 볼록성, 제약최적화, 라그랑주
    
    23. 경사하강법, 모멘텀, Adam
    
    23. 경사하강법, 모멘텀, Adam
    
    24. 수치선형대수와 자동미분
    
    24. 수치선형대수와 자동미분
    
    25. 엔트로피, cross entropy, KL divergence
    
    25. 엔트로피, cross entropy, KL divergence
    
    26. 일반화, 정규화, bias variance
    
    26. 일반화, 정규화, bias variance
    
    문제 해설 05. 최적화와 정보이론
    
    문제 해설 05. 최적화와 정보이론
    
    06. 머신러닝 이론
    
    06. 머신러닝 이론
    
    27. 선형회귀와 최소제곱
    
    27. 선형회귀와 최소제곱
    
    28. 로지스틱 회귀와 지수족
    
    28. 로지스틱 회귀와 지수족
    
    29. PCA와 잠재공간
    
    29. PCA와 잠재공간
    
    30. 커널방법과 RKHS 직관
    
    30. 커널방법과 RKHS 직관
    
    31. 그래픽모델, EM, 잠재변수
    
    31. 그래픽모델, EM, 잠재변수
    
    문제 해설 06. 머신러닝 이론
    
    문제 해설 06. 머신러닝 이론
    
    07. 딥러닝과 생성모델
    
    07. 딥러닝과 생성모델
    
    32. 신경망, 계산그래프, backprop
    
    32. 신경망, 계산그래프, backprop
    
    33. 초기화, 정규화, residual, optimization tricks
    
    33. 초기화, 정규화, residual, optimization tricks
    
    34. self supervised learning과 표현학습
    
    34. self supervised learning과 표현학습
    
    35. variational inference, ELBO, VAE
    
    35. variational inference, ELBO, VAE
    
    36. 확률과정, score matching, diffusion
    
    36. 확률과정, score matching, diffusion
    
    문제 해설 07. 딥러닝과 생성모델
    
    문제 해설 07. 딥러닝과 생성모델
    
    08. LLM, VLM, 멀티모달 AI 수학
    
    08. LLM, VLM, 멀티모달 AI 수학
    
    37. Attention, Transformer, positional math
    
    37. Attention, Transformer, positional math
    
    38. LLM pretraining, scaling laws, tokenization
    
    38. LLM pretraining, scaling laws, tokenization
    
    39. Alignment SFT, RLHF, DPO
    
    39. Alignment SFT, RLHF, DPO
    
    40. CLIP, contrastive learning, multimodal alignment
    
    40. CLIP, contrastive learning, multimodal alignment
    
    41. VLM, multimodal generation, fusion architectures
    
    41. VLM, multimodal generation, fusion architectures
    
    42. Frontier topics optimal transport, graphs, manifolds, mechanistic interpretability, 최신 논문 독해
    
    42. Frontier topics optimal transport, graphs, manifolds, mechanistic interpretability, 최신 논문 독해
    
    문제 해설 08. LLM, VLM, 멀티모달 AI 수학
    
    문제 해설 08. LLM, VLM, 멀티모달 AI 수학
  - 풀스택실전스터디
    
    풀스택실전스터디
    
    Lecture Sync Test
    
    Lecture Sync Test
    
    커리큘럼
    
    커리큘럼
- Manual
  Manual
  - 00. SCAI LAB Manual 사용법
    
    00. SCAI LAB Manual 사용법
  - 10. 계정 발급과 회수
    
    10. 계정 발급과 회수
  - 20. 외부 로그인 설정
    
    20. 외부 로그인 설정
    
    구글로그인
    
    구글로그인
    
    카카오로그인
    
    카카오로그인
  - 30. 서버와 배포 작업
    
    30. 서버와 배포 작업
    
    k3s 클러스터 접속과 GitOps 배포 점검
    
    k3s 클러스터 접속과 GitOps 배포 점검
  - 40. 운영 변경 작업
    
    40. 운영 변경 작업
    
    Ingress, 도메인, 이미지, 환경 변수 변경 절차
    
    Ingress, 도메인, 이미지, 환경 변수 변경 절차
  - 50. 모니터링 로그 작업
    
    50. 모니터링 로그 작업
    
    Grafana, Kibana, Tempo 1차 장애 확인 절차
    
    Grafana, Kibana, Tempo 1차 장애 확인 절차
  - 60. 시크릿 권한 작업
    
    60. 시크릿 권한 작업
    
    Infisical 시크릿 반영과 권한 변경 절차
    
    Infisical 시크릿 반영과 권한 변경 절차
  - 70. 서비스별 운영 작업
    
    70. 서비스별 운영 작업
    
    Do4i 배포 이상 대응 절차
    
    Do4i 배포 이상 대응 절차
    
    Palcar 배포 이상 대응 절차
    
    Palcar 배포 이상 대응 절차
    
    Papersens 배포 이상 대응 절차
    
    Papersens 배포 이상 대응 절차
    
    서비스 배포 이상 1차 대응 절차
    
    서비스 배포 이상 1차 대응 절차
- SCAI LAB의 동료들을 소개합니다
  SCAI LAB의 동료들을 소개합니다
- Wiki
  Wiki
  - Data Analysis
    
    Data Analysis
  - Design
    
    Design
  - Development
    
    Development
    
    개발
    
    개발
    
    아키텍처 디자인
    
    아키텍처 디자인
    
    3 Layer(N tier)
    
    3 Layer(N tier)
    
    EDA(Event Driven Architecture)
    
    EDA(Event Driven Architecture)
    
    Hexagonal Architecture(Ports and Adapters)
    
    Hexagonal Architecture(Ports and Adapters)
    
    MSA(Microservice Architecture)
    
    MSA(Microservice Architecture)
    
    Message Queue
    
    Message Queue
    
    도메인 주도 설계 (Domain Driven Design, DDD)
    
    도메인 주도 설계 (Domain Driven Design, DDD)
    
    Aggregate
    
    Aggregate
    
    Bounded Context (BC)
    
    Bounded Context (BC)
    
    Context Map
    
    Context Map
    
    DDD의 정의
    
    DDD의 정의
    
    Domain
    
    Domain
    
    Domain Storytelling
    
    Domain Storytelling
    
    Entity
    
    Entity
    
    Modeling
    
    Modeling
    
    Ubiquitous Language (UL)
    
    Ubiquitous Language (UL)
    
    Value Object
    
    Value Object
    
    모놀리식 아키텍처(Monolithic Architecture)
    
    모놀리식 아키텍처(Monolithic Architecture)
    
    분산 시스템
    
    분산 시스템
    
    데이터베이스
    
    데이터베이스
    
    백엔드
    
    백엔드
    
    아키텍처 디자인
    
    아키텍처 디자인
    
    인프라
    
    인프라
    
    프론트
    
    프론트
  - LLM
    
    LLM
  - Machine Learning
    
    Machine Learning
  - Planning
    
    Planning
  - Project Managing
    
    Project Managing
  - Sales
    
    Sales
  - VLM
    
    VLM
- 완료
  완료
- 진행 중
  진행 중
  - PassView
    
    PassView
    
    Feature
    
    Feature
    
    Screen
    
    Screen
  - Palcar
    
    Palcar

문제 해설 - 06. 머신러닝 이론

이 페이지는 06. 머신러닝 이론 단계의 모든 연습문제 해설을 모아 둔 페이지입니다. - 정답만 보는 대신 어떤 정의와 원리를 써야 하는지까지 함께 적었습니다. - 손으로 먼저 풀어 본 뒤 해설을 읽고, 막힌 지점을 표시하며 복기하는 용도로 씁니다.

27. 선형회귀와 최소제곱

문제 1

문제: 선형회귀를 한 문장으로 설명하라.
해설: 입력 변수들의 선형결합으로 출력 값을 예측하는 모델이다.

문제 2

문제: 잔차 제곱합을 줄인다는 말의 의미를 설명하라.
해설: 예측값과 실제값 차이의 제곱을 모두 더한 값을 작게 만들어 전체 오차를 줄인다는 뜻이다.

문제 3

문제: y = 3x - 2에서 x=4일 때 예측값을 구하라.
해설: 10이다.

문제 4

문제: 선형회귀가 좋은 baseline인 이유를 설명하라.
해설: 단순하고 해석이 쉬우며, 데이터 관계가 선형에 가까운 경우 surprisingly 강력하기 때문이다.

28. 로지스틱 회귀와 지수족

문제 1

문제: 로지스틱 회귀와 선형회귀의 가장 큰 차이를 설명하라.
해설: 선형회귀는 연속값을 예측하고, 로지스틱 회귀는 시그모이드를 통해 이진 확률을 예측한다.

문제 2

문제: 시그모이드 함수가 필요한 이유를 설명하라.
해설: 선형결합 결과를 0과 1 사이 확률값으로 바꾸기 위해서다.

문제 3

문제: 로짓이란 무엇인가?
해설: 확률의 odds에 로그를 취한 값으로, 로지스틱 회귀에서는 이 값을 선형식으로 모델링한다.

문제 4

문제: 이진 분류에서 BCE 손실이 쓰이는 이유를 설명하라.
해설: 정답 확률을 높이고 잘못된 확신을 강하게 벌주며, Bernoulli 모델의 음의 로그우도와 연결되기 때문이다.

29. PCA와 잠재공간

문제 1

문제: PCA의 핵심 목적을 한 문장으로 설명하라.
해설: 데이터 분산을 가장 많이 설명하는 축을 찾아 차원을 줄이는 것이다.

문제 2

문제: 주성분이란 무엇인가?
해설: 데이터 분산을 가장 많이 설명하는 방향이다.

문제 3

문제: 잠재공간이 필요한 이유를 설명하라.
해설: 관측 데이터의 복잡한 구조를 더 적은 차원과 더 해석 가능한 표현으로 요약할 수 있기 때문이다.

문제 4

문제: PCA와 투영의 관계를 설명하라.
해설: PCA는 찾은 주성분 축 위로 데이터를 투영해 새로운 좌표계에서 표현한다.

30. 커널방법과 RKHS 직관

문제 1

문제: 커널트릭의 핵심 아이디어를 설명하라.
해설: 고차원 특징벡터를 직접 만들지 않고도 내적 값을 통해 같은 효과를 얻는 것이다.

문제 2

문제: 커널값이 유사도와 연결되는 이유를 설명하라.
해설: 커널은 특징공간에서의 내적을 계산하는 함수로 볼 수 있어, 두 입력이 얼마나 비슷한지를 나타내기 때문이다.

문제 3

문제: 비선형 문제를 선형처럼 푼다는 말의 의미를 설명하라.
해설: 원래 입력공간이 아니라 더 높은 특징공간으로 보낸 뒤 সেখানে 선형 경계나 선형 연산을 적용한다는 뜻이다.

문제 4

문제: RKHS를 왜 함수공간 관점으로 이해하면 좋은가?
해설: 함수 자체를 벡터처럼 다뤄 내적과 노름, 일반화 개념을 확장할 수 있기 때문이다.

31. 그래픽모델, EM, 잠재변수

문제 1

문제: 잠재변수가 무엇인지 설명하라.
해설: 직접 관측되지는 않지만 관측 데이터를 설명하는 숨은 변수다.

문제 2

문제: EM의 E-step에서는 무엇을 하는가?
해설: 현재 파라미터로 잠재변수의 posterior나 기대값을 추정한다.

문제 3

문제: 그래픽모델이 주는 장점을 한 가지 설명하라.
해설: 변수들 사이의 의존성과 독립 관계를 시각적으로 명확하게 표현할 수 있다.

문제 4

문제: 조건부독립이 중요한 이유를 설명하라.
해설: 복잡한 결합확률을 더 작은 조각으로 분해해 계산을 단순화할 수 있기 때문이다.

사용법

먼저 문제를 풀고 답을 적은 뒤 해설을 본다.
해설을 읽을 때는 어떤 정의를 먼저 떠올려야 하는지 표시한다.
틀린 문제는 다시 풀어 보고, 같은 유형을 다음 강의 전에 한 번 더 복습한다.