콘텐츠로 이동

do4ai Obsidian

문제 해설 - 07. 딥러닝과 생성모델

do4ai Obsidian

do4ai Obsidian
Data Sources
Data Sources
- [UL]
  [UL]
  - Rows
    Rows
    
    상품이란
- 새 데이터베이스
  새 데이터베이스
  - Rows
    Rows
    
    김현우
- 새 데이터베이스 31fe313f
  새 데이터베이스 31fe313f
SenseCore AI LAB, AI융합학부
SenseCore AI LAB, AI융합학부
- Convention
  Convention
- Domains
  Domains
  - Domain Template
    
    Domain Template
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - OAuth 2.0
    
    OAuth 2.0
  - 논문 검사 솔루션
    
    논문 검사 솔루션
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - 에이전트 플랫폼
    
    에이전트 플랫폼
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
  - 자동차 경매
    
    자동차 경매
    
    UL
    
    UL
    
    도메인 스토리텔링
    
    도메인 스토리텔링
    
    바운디드 컨텍스트
    
    바운디드 컨텍스트
    
    컨텍스트 맵
    
    컨텍스트 맵
- Guide
  Guide
  - 00. SCAI LAB Guide 사용법
    
    00. SCAI LAB Guide 사용법
  - 10. 연구실 운영 개요
    
    10. 연구실 운영 개요
  - 20. 계정과 접근
    
    20. 계정과 접근
  - 30. 연구실 업무 도구
    
    30. 연구실 업무 도구
  - 40. 연구 개발 환경
    
    40. 연구 개발 환경
  - 50. 인프라와 플랫폼
    
    50. 인프라와 플랫폼
    
    ArgoCD 운영 흐름 가이드
    
    ArgoCD 운영 흐름 가이드
    
    GitOps 운영 모델 가이드
    
    GitOps 운영 모델 가이드
    
    Infisical 시크릿 관리 가이드
    
    Infisical 시크릿 관리 가이드
    
    Kubernetes 기본 구조 가이드
    
    Kubernetes 기본 구조 가이드
    
    Observability 운영 가이드
    
    Observability 운영 가이드
    
    k3s GitOps 운영 클러스터 초보자 가이드
    
    k3s GitOps 운영 클러스터 초보자 가이드
    
    K3s 운영 구조 가이드
    
    K3s 운영 구조 가이드
  - 60. 서비스 운영
    
    60. 서비스 운영
  - 70. 데이터, 관측, 보안
    
    70. 데이터, 관측, 보안
    
    k3s 운영 장애 Discord 리포트 설계
    
    k3s 운영 장애 Discord 리포트 설계
    
    운영 장애 Discord 리포트 솔루션 리서치
    
    운영 장애 Discord 리포트 솔루션 리서치
  - 80. 협업과 커뮤니케이션
    
    80. 협업과 커뮤니케이션
  - 90. 장애 대응과 운영 판단
    
    90. 장애 대응과 운영 판단
- Lecture
  Lecture
  - AI를 위한 수학
    
    AI를 위한 수학
    
    01. 숫자와 계산의 감각
    
    01. 숫자와 계산의 감각
    
    1. 문자와 식, 다항식의 구조
    
    1. 문자와 식, 다항식의 구조
    
    2. 방정식과 부등식
    
    2. 방정식과 부등식
    
    3. 함수와 그래프
    
    3. 함수와 그래프
    
    4. 지수와 로그
    
    4. 지수와 로그
    
    5. 수열, 급수, 시그마
    
    5. 수열, 급수, 시그마
    
    6. 삼각함수와 복소수
    
    6. 삼각함수와 복소수
    
    문제 해설 01. 숫자와 계산의 감각
    
    문제 해설 01. 숫자와 계산의 감각
    
    02. 벡터와 행렬의 시작
    
    02. 벡터와 행렬의 시작
    
    10. 직교성, 투영, 최소제곱
    
    10. 직교성, 투영, 최소제곱
    
    11. 특이값분해와 저랭크 근사
    
    11. 특이값분해와 저랭크 근사
    
    7. 벡터공간과 기저
    
    7. 벡터공간과 기저
    
    8. 행렬연산과 선형시스템
    
    8. 행렬연산과 선형시스템
    
    9. 선형변환과 고유값
    
    9. 선형변환과 고유값
    
    문제 해설 02. 식과 방정식의 언어
    
    문제 해설 02. 식과 방정식의 언어
    
    03. 그래프와 함수의 시야
    
    03. 그래프와 함수의 시야
    
    12. 극한, 연속, 미분
    
    12. 극한, 연속, 미분
    
    13. 다변수미분과 Jacobian
    
    13. 다변수미분과 Jacobian
    
    14. 적분, 누적량, 확률밀도
    
    14. 적분, 누적량, 확률밀도
    
    15. Taylor 전개와 근사
    
    15. Taylor 전개와 근사
    
    16. 미분방정식과 동역학
    
    16. 미분방정식과 동역학
    
    문제 해설 03. 미적분과 해석
    
    문제 해설 03. 미적분과 해석
    
    04. 경우의 수, 확률, 통계의 기초
    
    04. 경우의 수, 확률, 통계의 기초
    
    17. 조합론과 확률
    
    17. 조합론과 확률
    
    18. 확률변수와 주요 분포
    
    18. 확률변수와 주요 분포
    
    19. 기대값, 분산, 공분산
    
    19. 기대값, 분산, 공분산
    
    20. 통계적 추정, MLE, MAP, 베이즈
    
    20. 통계적 추정, MLE, MAP, 베이즈
    
    21. 가설검정, 신뢰구간, 실험설계
    
    21. 가설검정, 신뢰구간, 실험설계
    
    문제 해설 04. 확률과 통계
    
    문제 해설 04. 확률과 통계
    
    05. 최적화와 정보이론
    
    05. 최적화와 정보이론
    
    22. 볼록성, 제약최적화, 라그랑주
    
    22. 볼록성, 제약최적화, 라그랑주
    
    23. 경사하강법, 모멘텀, Adam
    
    23. 경사하강법, 모멘텀, Adam
    
    24. 수치선형대수와 자동미분
    
    24. 수치선형대수와 자동미분
    
    25. 엔트로피, cross entropy, KL divergence
    
    25. 엔트로피, cross entropy, KL divergence
    
    26. 일반화, 정규화, bias variance
    
    26. 일반화, 정규화, bias variance
    
    문제 해설 05. 최적화와 정보이론
    
    문제 해설 05. 최적화와 정보이론
    
    06. 머신러닝 이론
    
    06. 머신러닝 이론
    
    27. 선형회귀와 최소제곱
    
    27. 선형회귀와 최소제곱
    
    28. 로지스틱 회귀와 지수족
    
    28. 로지스틱 회귀와 지수족
    
    29. PCA와 잠재공간
    
    29. PCA와 잠재공간
    
    30. 커널방법과 RKHS 직관
    
    30. 커널방법과 RKHS 직관
    
    31. 그래픽모델, EM, 잠재변수
    
    31. 그래픽모델, EM, 잠재변수
    
    문제 해설 06. 머신러닝 이론
    
    문제 해설 06. 머신러닝 이론
    
    07. 딥러닝과 생성모델
    
    07. 딥러닝과 생성모델
    
    32. 신경망, 계산그래프, backprop
    
    32. 신경망, 계산그래프, backprop
    
    33. 초기화, 정규화, residual, optimization tricks
    
    33. 초기화, 정규화, residual, optimization tricks
    
    34. self supervised learning과 표현학습
    
    34. self supervised learning과 표현학습
    
    35. variational inference, ELBO, VAE
    
    35. variational inference, ELBO, VAE
    
    36. 확률과정, score matching, diffusion
    
    36. 확률과정, score matching, diffusion
    
    문제 해설 07. 딥러닝과 생성모델
    
    문제 해설 07. 딥러닝과 생성모델
    
    08. LLM, VLM, 멀티모달 AI 수학
    
    08. LLM, VLM, 멀티모달 AI 수학
    
    37. Attention, Transformer, positional math
    
    37. Attention, Transformer, positional math
    
    38. LLM pretraining, scaling laws, tokenization
    
    38. LLM pretraining, scaling laws, tokenization
    
    39. Alignment SFT, RLHF, DPO
    
    39. Alignment SFT, RLHF, DPO
    
    40. CLIP, contrastive learning, multimodal alignment
    
    40. CLIP, contrastive learning, multimodal alignment
    
    41. VLM, multimodal generation, fusion architectures
    
    41. VLM, multimodal generation, fusion architectures
    
    42. Frontier topics optimal transport, graphs, manifolds, mechanistic interpretability, 최신 논문 독해
    
    42. Frontier topics optimal transport, graphs, manifolds, mechanistic interpretability, 최신 논문 독해
    
    문제 해설 08. LLM, VLM, 멀티모달 AI 수학
    
    문제 해설 08. LLM, VLM, 멀티모달 AI 수학
  - 풀스택실전스터디
    
    풀스택실전스터디
    
    Lecture Sync Test
    
    Lecture Sync Test
    
    커리큘럼
    
    커리큘럼
- Manual
  Manual
  - 00. SCAI LAB Manual 사용법
    
    00. SCAI LAB Manual 사용법
  - 10. 계정 발급과 회수
    
    10. 계정 발급과 회수
  - 20. 외부 로그인 설정
    
    20. 외부 로그인 설정
    
    구글로그인
    
    구글로그인
    
    카카오로그인
    
    카카오로그인
  - 30. 서버와 배포 작업
    
    30. 서버와 배포 작업
    
    k3s 클러스터 접속과 GitOps 배포 점검
    
    k3s 클러스터 접속과 GitOps 배포 점검
  - 40. 운영 변경 작업
    
    40. 운영 변경 작업
    
    Ingress, 도메인, 이미지, 환경 변수 변경 절차
    
    Ingress, 도메인, 이미지, 환경 변수 변경 절차
  - 50. 모니터링 로그 작업
    
    50. 모니터링 로그 작업
    
    Grafana, Kibana, Tempo 1차 장애 확인 절차
    
    Grafana, Kibana, Tempo 1차 장애 확인 절차
  - 60. 시크릿 권한 작업
    
    60. 시크릿 권한 작업
    
    Infisical 시크릿 반영과 권한 변경 절차
    
    Infisical 시크릿 반영과 권한 변경 절차
  - 70. 서비스별 운영 작업
    
    70. 서비스별 운영 작업
    
    Do4i 배포 이상 대응 절차
    
    Do4i 배포 이상 대응 절차
    
    Palcar 배포 이상 대응 절차
    
    Palcar 배포 이상 대응 절차
    
    Papersens 배포 이상 대응 절차
    
    Papersens 배포 이상 대응 절차
    
    서비스 배포 이상 1차 대응 절차
    
    서비스 배포 이상 1차 대응 절차
- SCAI LAB의 동료들을 소개합니다
  SCAI LAB의 동료들을 소개합니다
- Wiki
  Wiki
  - Data Analysis
    
    Data Analysis
  - Design
    
    Design
  - Development
    
    Development
    
    개발
    
    개발
    
    아키텍처 디자인
    
    아키텍처 디자인
    
    3 Layer(N tier)
    
    3 Layer(N tier)
    
    EDA(Event Driven Architecture)
    
    EDA(Event Driven Architecture)
    
    Hexagonal Architecture(Ports and Adapters)
    
    Hexagonal Architecture(Ports and Adapters)
    
    MSA(Microservice Architecture)
    
    MSA(Microservice Architecture)
    
    Message Queue
    
    Message Queue
    
    도메인 주도 설계 (Domain Driven Design, DDD)
    
    도메인 주도 설계 (Domain Driven Design, DDD)
    
    Aggregate
    
    Aggregate
    
    Bounded Context (BC)
    
    Bounded Context (BC)
    
    Context Map
    
    Context Map
    
    DDD의 정의
    
    DDD의 정의
    
    Domain
    
    Domain
    
    Domain Storytelling
    
    Domain Storytelling
    
    Entity
    
    Entity
    
    Modeling
    
    Modeling
    
    Ubiquitous Language (UL)
    
    Ubiquitous Language (UL)
    
    Value Object
    
    Value Object
    
    모놀리식 아키텍처(Monolithic Architecture)
    
    모놀리식 아키텍처(Monolithic Architecture)
    
    분산 시스템
    
    분산 시스템
    
    데이터베이스
    
    데이터베이스
    
    백엔드
    
    백엔드
    
    아키텍처 디자인
    
    아키텍처 디자인
    
    인프라
    
    인프라
    
    프론트
    
    프론트
  - LLM
    
    LLM
  - Machine Learning
    
    Machine Learning
  - Planning
    
    Planning
  - Project Managing
    
    Project Managing
  - Sales
    
    Sales
  - VLM
    
    VLM
- 완료
  완료
- 진행 중
  진행 중
  - PassView
    
    PassView
    
    Feature
    
    Feature
    
    Screen
    
    Screen
  - Palcar
    
    Palcar

문제 해설 - 07. 확률분포와 최적화

이 페이지는 07. 확률분포와 최적화 단계의 연습문제 해설을 모아 둔 페이지입니다. - 정답만 보는 대신 어떤 정의와 원리를 써야 하는지까지 함께 적었습니다. - 손으로 먼저 풀어 본 뒤 해설을 읽고, 막힌 지점을 표시하며 복기하는 용도로 씁니다.

32. 신경망, 계산그래프, backprop

문제 1

문제: 신경망을 합성함수라고 부르는 이유를 설명하라.
해설: 각 층이 하나의 함수이고, 전체 모델은 이 함수들을 연속해서 적용한 합성함수이기 때문이다.

문제 2

문제: 계산그래프의 역할을 설명하라.
해설: 연산 순서와 중간값, 기울기 흐름을 구조화해 forward와 backward 계산을 가능하게 한다.

문제 3

문제: backprop이 효율적인 이유를 설명하라.
해설: 중간 미분 결과를 재사용하며 출력 하나에 대한 많은 파라미터 기울기를 한 번의 backward pass로 계산할 수 있기 때문이다.

문제 4

문제: 연쇄법칙이 역전파에서 왜 핵심인가?
해설: 합성함수 전체의 미분을 각 단계 미분의 곱으로 나눠 계산하게 해 주기 때문이다.

33. 초기화, 정규화, residual, optimization tricks

문제 1

문제: 좋은 초기화가 왜 필요한지 설명하라.
해설: 초기부터 기울기가 지나치게 작거나 커지지 않게 해 안정적인 학습을 시작하게 해 주기 때문이다.

문제 2

문제: BatchNorm과 LayerNorm의 큰 차이를 설명하라.
해설: BatchNorm은 배치 축 통계를 사용하고, LayerNorm은 각 샘플의 특징 차원 통계를 사용한다.

문제 3

문제: Residual connection이 기울기 흐름을 어떻게 돕는가?
해설: identity path를 제공해 기울기가 깊은 층을 지나도 직접 전달될 수 있게 하기 때문이다.

문제 4

문제: optimization trick이 단순 요령이 아닌 이유를 설명하라.
해설: 깊은 모델의 수치적 안정성과 기울기 흐름 문제를 해결하기 위한 구조적 장치이기 때문이다.

34. self-supervised learning과 표현학습

문제 1

문제: self-supervised learning의 핵심 아이디어를 설명하라.
해설: 외부 라벨 없이 데이터 안에서 학습 신호를 만들어 표현을 학습하는 것이다.

문제 2

문제: 표현학습이 중요한 이유를 설명하라.
해설: 좋은 표현이 있으면 다양한 다운스트림 작업에서 적은 데이터와 간단한 모델로도 좋은 성능을 낼 수 있기 때문이다.

문제 3

문제: contrastive learning은 어떤 쌍을 이용해 학습하는가?
해설: 가까워져야 하는 positive pair와 멀어져야 하는 negative pair를 이용한다.

문제 4

문제: masked prediction과 contrastive learning의 차이를 설명하라.
해설: masked prediction은 일부를 가리고 맞히며 구조를 배우고, contrastive learning은 유사/비유사 쌍의 거리를 조절하며 표현을 배운다.

35. variational inference, ELBO, VAE

문제 1

문제: variational inference의 핵심 아이디어를 설명하라.
해설: 복잡한 posterior를 계산하기 쉬운 분포로 근사해 추론하는 것이다.

문제 2

문제: ELBO의 두 주요 역할을 설명하라.
해설: 데이터를 잘 재구성하게 하고, 근사 posterior가 prior와 너무 멀어지지 않도록 조절한다.

문제 3

문제: reparameterization trick이 왜 필요한가?
해설: 샘플링 연산을 미분 가능한 형태로 바꿔 encoder 파라미터에 기울기를 전달하기 위해서다.

문제 4

문제: VAE가 잠재공간 학습과 연결되는 이유를 설명하라.
해설: 입력을 연속적인 잠재분포로 압축하고 다시 복원하도록 학습하기 때문에 의미 있는 잠재공간이 형성된다.

36. 확률과정, score matching, diffusion

문제 1

문제: 확률과정을 한 문장으로 설명하라.
해설: 시간에 따라 확률적으로 상태가 변하는 과정이다.

문제 2

문제: score가 무엇인지 설명하라.
해설: 분포의 로그밀도에 대한 기울기로, 밀도가 증가하는 방향을 알려 준다.

문제 3

문제: forward diffusion의 목적을 설명하라.
해설: 복잡한 데이터분포를 점차 노이즈 분포로 보내 쉽게 다룰 수 있게 하는 것이다.

문제 4

문제: reverse process가 생성과 연결되는 이유를 설명하라.
해설: 노이즈 상태에서 시작해 데이터가 있을 법한 방향으로 되돌아가며 새로운 샘플을 만들기 때문이다.

이 해설 페이지를 읽는 법

먼저 각 문제에 대해 정의를 떠올려 보고, 식이 필요하면 직접 다시 써 봅니다.
그다음 해설을 읽으며 내가 놓친 정의, 방향, 가정이 무엇이었는지 표시합니다.
특히 35, 36강 문제는 식을 기호로 외우기보다 "무엇을 근사하는가", "어느 방향으로 움직이는가"를 문장으로 다시 설명해 보는 것이 중요합니다.

마지막 점검

32강에서는 forward와 backward의 역할을 분리해 설명할 수 있어야 합니다.
33강에서는 안정화 기법이 모두 신호와 gradient 흐름 문제를 다룬다는 점을 보여야 합니다.
34강에서는 라벨 없이 학습 신호를 만드는 원리를 말할 수 있어야 합니다.
35강에서는 posterior, 근사 posterior, ELBO의 관계를 한 흐름으로 설명할 수 있어야 합니다.
36강에서는 diffusion이 왜 "노이즈에서 되돌아오기" 문제인지 설명할 수 있어야 합니다.