콘텐츠로 이동

do4ai Obsidian

문제 해설 - 05. 최적화와 정보이론

do4ai Obsidian

do4ai Obsidian
Data Sources
Data Sources
- [UL]
  [UL]
  - Rows
    Rows
    
    상품이란
- 새 데이터베이스
  새 데이터베이스
  - Rows
    Rows
    
    김현우
- 새 데이터베이스 31fe313f
  새 데이터베이스 31fe313f
SenseCore AI LAB, AI융합학부
SenseCore AI LAB, AI융합학부
- Convention
  Convention
- Domains
  Domains
  - Domain Template
    
    Domain Template
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - OAuth 2.0
    
    OAuth 2.0
  - 논문 검사 솔루션
    
    논문 검사 솔루션
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - 에이전트 플랫폼
    
    에이전트 플랫폼
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - 자동차 경매
    
    자동차 경매
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
- Guide
  Guide
  - 00. SCAI LAB Guide 사용법
    
    00. SCAI LAB Guide 사용법
  - 10. 연구실 운영 개요
    
    10. 연구실 운영 개요
  - 20. 계정과 접근
    
    20. 계정과 접근
  - 30. 연구실 업무 도구
    
    30. 연구실 업무 도구
  - 40. 연구 개발 환경
    
    40. 연구 개발 환경
  - 50. 인프라와 플랫폼
    
    50. 인프라와 플랫폼
    
    ArgoCD 운영 흐름 가이드
    
    ArgoCD 운영 흐름 가이드
    
    GitOps 운영 모델 가이드
    
    GitOps 운영 모델 가이드
    
    Infisical 시크릿 관리 가이드
    
    Infisical 시크릿 관리 가이드
    
    Kubernetes 기본 구조 가이드
    
    Kubernetes 기본 구조 가이드
    
    Observability 운영 가이드
    
    Observability 운영 가이드
    
    k3s GitOps 운영 클러스터 초보자 가이드
    
    k3s GitOps 운영 클러스터 초보자 가이드
    
    K3s 운영 구조 가이드
    
    K3s 운영 구조 가이드
  - 60. 서비스 운영
    
    60. 서비스 운영
  - 70. 데이터, 관측, 보안
    
    70. 데이터, 관측, 보안
    
    k3s 운영 장애 Discord 리포트 설계
    
    k3s 운영 장애 Discord 리포트 설계
    
    운영 장애 Discord 리포트 솔루션 리서치
    
    운영 장애 Discord 리포트 솔루션 리서치
  - 80. 협업과 커뮤니케이션
    
    80. 협업과 커뮤니케이션
  - 90. 장애 대응과 운영 판단
    
    90. 장애 대응과 운영 판단
- Lecture
  Lecture
  - AI를 위한 수학
    
    AI를 위한 수학
    
    01. 숫자와 계산의 감각
    
    01. 숫자와 계산의 감각
    
    1. 문자와 식, 다항식의 구조
    
    1. 문자와 식, 다항식의 구조
    
    2. 방정식과 부등식
    
    2. 방정식과 부등식
    
    3. 함수와 그래프
    
    3. 함수와 그래프
    
    4. 지수와 로그
    
    4. 지수와 로그
    
    5. 수열, 급수, 시그마
    
    5. 수열, 급수, 시그마
    
    6. 삼각함수와 복소수
    
    6. 삼각함수와 복소수
    
    문제 해설 01. 숫자와 계산의 감각
    
    문제 해설 01. 숫자와 계산의 감각
    
    02. 벡터와 행렬의 시작
    
    02. 벡터와 행렬의 시작
    
    10. 직교성, 투영, 최소제곱
    
    10. 직교성, 투영, 최소제곱
    
    11. 특이값분해와 저랭크 근사
    
    11. 특이값분해와 저랭크 근사
    
    7. 벡터공간과 기저
    
    7. 벡터공간과 기저
    
    8. 행렬연산과 선형시스템
    
    8. 행렬연산과 선형시스템
    
    9. 선형변환과 고유값
    
    9. 선형변환과 고유값
    
    문제 해설 02. 식과 방정식의 언어
    
    문제 해설 02. 식과 방정식의 언어
    
    03. 그래프와 함수의 시야
    
    03. 그래프와 함수의 시야
    
    12. 극한, 연속, 미분
    
    12. 극한, 연속, 미분
    
    13. 다변수미분과 Jacobian
    
    13. 다변수미분과 Jacobian
    
    14. 적분, 누적량, 확률밀도
    
    14. 적분, 누적량, 확률밀도
    
    15. Taylor 전개와 근사
    
    15. Taylor 전개와 근사
    
    16. 미분방정식과 동역학
    
    16. 미분방정식과 동역학
    
    문제 해설 03. 미적분과 해석
    
    문제 해설 03. 미적분과 해석
    
    04. 경우의 수, 확률, 통계의 기초
    
    04. 경우의 수, 확률, 통계의 기초
    
    17. 조합론과 확률
    
    17. 조합론과 확률
    
    18. 확률변수와 주요 분포
    
    18. 확률변수와 주요 분포
    
    19. 기대값, 분산, 공분산
    
    19. 기대값, 분산, 공분산
    
    20. 통계적 추정, MLE, MAP, 베이즈
    
    20. 통계적 추정, MLE, MAP, 베이즈
    
    21. 가설검정, 신뢰구간, 실험설계
    
    21. 가설검정, 신뢰구간, 실험설계
    
    문제 해설 04. 확률과 통계
    
    문제 해설 04. 확률과 통계
    
    05. 최적화와 정보이론
    
    05. 최적화와 정보이론
    
    22. 볼록성, 제약최적화, 라그랑주
    
    22. 볼록성, 제약최적화, 라그랑주
    
    23. 경사하강법, 모멘텀, Adam
    
    23. 경사하강법, 모멘텀, Adam
    
    24. 수치선형대수와 자동미분
    
    24. 수치선형대수와 자동미분
    
    25. 엔트로피, cross entropy, KL divergence
    
    25. 엔트로피, cross entropy, KL divergence
    
    26. 일반화, 정규화, bias variance
    
    26. 일반화, 정규화, bias variance
    
    문제 해설 05. 최적화와 정보이론
    
    문제 해설 05. 최적화와 정보이론
    
    06. 머신러닝 이론
    
    06. 머신러닝 이론
    
    27. 선형회귀와 최소제곱
    
    27. 선형회귀와 최소제곱
    
    28. 로지스틱 회귀와 지수족
    
    28. 로지스틱 회귀와 지수족
    
    29. PCA와 잠재공간
    
    29. PCA와 잠재공간
    
    30. 커널방법과 RKHS 직관
    
    30. 커널방법과 RKHS 직관
    
    31. 그래픽모델, EM, 잠재변수
    
    31. 그래픽모델, EM, 잠재변수
    
    문제 해설 06. 머신러닝 이론
    
    문제 해설 06. 머신러닝 이론
    
    07. 딥러닝과 생성모델
    
    07. 딥러닝과 생성모델
    
    32. 신경망, 계산그래프, backprop
    
    32. 신경망, 계산그래프, backprop
    
    33. 초기화, 정규화, residual, optimization tricks
    
    33. 초기화, 정규화, residual, optimization tricks
    
    34. self supervised learning과 표현학습
    
    34. self supervised learning과 표현학습
    
    35. variational inference, ELBO, VAE
    
    35. variational inference, ELBO, VAE
    
    36. 확률과정, score matching, diffusion
    
    36. 확률과정, score matching, diffusion
    
    문제 해설 07. 딥러닝과 생성모델
    
    문제 해설 07. 딥러닝과 생성모델
    
    08. LLM, VLM, 멀티모달 AI 수학
    
    08. LLM, VLM, 멀티모달 AI 수학
    
    37. Attention, Transformer, positional math
    
    37. Attention, Transformer, positional math
    
    38. LLM pretraining, scaling laws, tokenization
    
    38. LLM pretraining, scaling laws, tokenization
    
    39. Alignment SFT, RLHF, DPO
    
    39. Alignment SFT, RLHF, DPO
    
    40. CLIP, contrastive learning, multimodal alignment
    
    40. CLIP, contrastive learning, multimodal alignment
    
    41. VLM, multimodal generation, fusion architectures
    
    41. VLM, multimodal generation, fusion architectures
    
    42. Frontier topics optimal transport, graphs, manifolds, mechanistic interpretability, 최신 논문 독해
    
    42. Frontier topics optimal transport, graphs, manifolds, mechanistic interpretability, 최신 논문 독해
    
    문제 해설 08. LLM, VLM, 멀티모달 AI 수학
    
    문제 해설 08. LLM, VLM, 멀티모달 AI 수학
  - 풀스택실전스터디
    
    풀스택실전스터디
    
    Lecture Sync Test
    
    Lecture Sync Test
    
    커리큘럼
    
    커리큘럼
- Manual
  Manual
  - 00. SCAI LAB Manual 사용법
    
    00. SCAI LAB Manual 사용법
  - 10. 계정 발급과 회수
    
    10. 계정 발급과 회수
  - 20. 외부 로그인 설정
    
    20. 외부 로그인 설정
    
    구글로그인
    
    구글로그인
    
    카카오로그인
    
    카카오로그인
  - 30. 서버와 배포 작업
    
    30. 서버와 배포 작업
    
    k3s 클러스터 접속과 GitOps 배포 점검
    
    k3s 클러스터 접속과 GitOps 배포 점검
  - 40. 운영 변경 작업
    
    40. 운영 변경 작업
    
    Ingress, 도메인, 이미지, 환경 변수 변경 절차
    
    Ingress, 도메인, 이미지, 환경 변수 변경 절차
  - 50. 모니터링 로그 작업
    
    50. 모니터링 로그 작업
    
    Grafana, Kibana, Tempo 1차 장애 확인 절차
    
    Grafana, Kibana, Tempo 1차 장애 확인 절차
  - 60. 시크릿 권한 작업
    
    60. 시크릿 권한 작업
    
    Infisical 시크릿 반영과 권한 변경 절차
    
    Infisical 시크릿 반영과 권한 변경 절차
  - 70. 서비스별 운영 작업
    
    70. 서비스별 운영 작업
    
    Do4i 배포 이상 대응 절차
    
    Do4i 배포 이상 대응 절차
    
    Palcar 배포 이상 대응 절차
    
    Palcar 배포 이상 대응 절차
    
    Papersens 배포 이상 대응 절차
    
    Papersens 배포 이상 대응 절차
    
    서비스 배포 이상 1차 대응 절차
    
    서비스 배포 이상 1차 대응 절차
- SCAI LAB의 동료들을 소개합니다
  SCAI LAB의 동료들을 소개합니다
- Wiki
  Wiki
  - Data Analysis
    
    Data Analysis
  - Design
    
    Design
  - Development
    
    Development
    
    개발
    
    개발
    
    아키텍처 디자인
    
    아키텍처 디자인
    
    3 Layer(N tier)
    
    3 Layer(N tier)
    
    EDA(Event Driven Architecture)
    
    EDA(Event Driven Architecture)
    
    Hexagonal Architecture(Ports and Adapters)
    
    Hexagonal Architecture(Ports and Adapters)
    
    MSA(Microservice Architecture)
    
    MSA(Microservice Architecture)
    
    Message Queue
    
    Message Queue
    
    도메인 주도 설계 (Domain Driven Design, DDD)
    
    도메인 주도 설계 (Domain Driven Design, DDD)
    
    Aggregate
    
    Aggregate
    
    Bounded Context (BC)
    
    Bounded Context (BC)
    
    Context Map
    
    Context Map
    
    DDD의 정의
    
    DDD의 정의
    
    Domain
    
    Domain
    
    Domain Storytelling
    
    Domain Storytelling
    
    Entity
    
    Entity
    
    Modeling
    
    Modeling
    
    Ubiquitous Language (UL)
    
    Ubiquitous Language (UL)
    
    Value Object
    
    Value Object
    
    모놀리식 아키텍처(Monolithic Architecture)
    
    모놀리식 아키텍처(Monolithic Architecture)
    
    분산 시스템
    
    분산 시스템
    
    데이터베이스
    
    데이터베이스
    
    백엔드
    
    백엔드
    
    아키텍처 디자인
    
    아키텍처 디자인
    
    인프라
    
    인프라
    
    프론트
    
    프론트
  - LLM
    
    LLM
  - Machine Learning
    
    Machine Learning
  - Planning
    
    Planning
  - Project Managing
    
    Project Managing
  - Sales
    
    Sales
  - VLM
    
    VLM
- 완료
  완료
- 진행 중
  진행 중
  - PassView
    
    PassView
    
    Feature
    
    Feature
    
    Screen
    
    Screen
  - Palcar
    
    Palcar

문제 해설 - 05. 최적화와 정보이론

이 페이지는 05. 최적화와 정보이론 단계의 모든 연습문제 해설을 모아 둔 페이지입니다. - 정답만 보는 대신 어떤 정의와 원리를 써야 하는지까지 함께 적었습니다. - 손으로 먼저 풀어 본 뒤 해설을 읽고, 막힌 지점을 표시하며 복기하는 용도로 씁니다.

22. 볼록성, 제약최적화, 라그랑주

문제 1

문제: 볼록함수의 장점을 한 문장으로 설명하라.
해설: 지역 최적해가 전역 최적해가 되어 최적화가 쉬워진다.

문제 2

문제: 제약최적화가 무엇인지 설명하라.
해설: 주어진 제약조건을 만족하는 해들 중에서 목적함수를 가장 좋게 만드는 해를 찾는 문제다.

문제 3

문제: 라그랑주 승수는 어떤 역할을 하는가?
해설: 제약조건을 목적함수에 결합해 동시에 고려할 수 있게 한다.

문제 4

문제: 왜 확률벡터에는 합이 1이라는 제약이 붙는가?
해설: 모든 사건 확률을 합치면 전체 가능성 1이 되어야 하기 때문이다.

23. 경사하강법, 모멘텀, Adam

문제 1

문제: 경사하강법에서 왜 기울기의 반대 방향으로 이동하는가?
해설: 기울기가 증가 방향을 가리키기 때문에 반대 방향으로 가야 함수값이 줄어들기 때문이다.

문제 2

문제: 모멘텀이 필요한 이유를 설명하라.
해설: 이전 이동 방향을 누적해 불안정한 지그재그를 줄이고 더 빠르게 목적점으로 가게 하기 때문이다.

문제 3

문제: Adam이 SGD보다 유리한 상황을 한 가지 설명하라.
해설: 파라미터별 gradient 크기가 매우 다를 때 Adam은 각 파라미터에 맞게 스텝 크기를 조절해 더 안정적일 수 있다.

문제 4

문제: 학습률이 너무 작을 때의 문제를 설명하라.
해설: 손실이 거의 줄지 않고 학습이 매우 느려진다.

24. 수치선형대수와 자동미분

문제 1

문제: 자동미분과 수치미분의 차이를 설명하라.
해설: 수치미분은 작은 차분으로 근사하지만 자동미분은 연산 규칙을 따라 정확한 도함수를 계산한다.

문제 2

문제: reverse mode가 딥러닝에 잘 맞는 이유를 설명하라.
해설: 출력 스칼라 하나에 대해 많은 파라미터 gradient를 효율적으로 구할 수 있기 때문이다.

문제 3

문제: 유한정밀도가 왜 문제를 만들 수 있는가?
해설: 매우 크거나 작은 수 계산에서 반올림 오차와 overflow/underflow가 생길 수 있기 때문이다.

문제 4

문제: 계산그래프가 필요한 이유를 설명하라.
해설: 복잡한 연산을 작은 단계로 나눠 저장하고, forward 값과 backward gradient를 체계적으로 전달할 수 있기 때문이다.

25. 엔트로피, cross-entropy, KL divergence

문제 1

문제: 엔트로피가 큰 분포의 특징을 설명하라.
해설: 확률이 여러 결과에 고르게 퍼져 있어 불확실성이 크다.

문제 2

문제: cross-entropy가 분류 손실로 적합한 이유를 설명하라.
해설: 정답 클래스 확률을 높일수록 손실이 줄고, 잘못된 확신에는 큰 패널티를 주기 때문이다.

문제 3

문제: KL divergence가 0이라는 뜻은 무엇인가?
해설: 두 분포가 완전히 같다는 뜻이다.

문제 4

문제: 언어모델의 next-token training을 정보이론으로 설명하라.
해설: 정답 토큰 분포와 모델 분포 사이 cross-entropy를 줄여 정답에 대한 평균 코드 길이를 최소화하는 과정으로 볼 수 있다.

26. 일반화, 정규화, bias-variance

문제 1

문제: 일반화가 무엇인지 설명하라.
해설: 보지 못한 새로운 데이터에서도 모델이 잘 작동하는 성질이다.

문제 2

문제: 과적합이 왜 문제인가?
해설: 훈련셋에서만 좋아 보이고 실제 배포 환경에서는 성능이 떨어질 수 있기 때문이다.

문제 3

문제: bias-variance trade-off를 한 문장으로 설명하라.
해설: 모델을 단순하게 하면 bias가 커지고 복잡하게 하면 variance가 커질 수 있어 둘 사이 균형을 맞춰야 한다는 뜻이다.

문제 4

문제: 정규화가 도움이 되는 이유를 설명하라.
해설: 모델 복잡도를 조절해 과적합을 줄이고 일반화 성능을 높일 수 있기 때문이다.

사용법

먼저 문제를 풀고 답을 적은 뒤 해설을 본다.
해설을 읽을 때는 어떤 정의를 먼저 떠올려야 하는지 표시한다.
틀린 문제는 다시 풀어 보고, 같은 유형을 다음 강의 전에 한 번 더 복습한다.