papersens 배포 이상 대응 절차
문서 목적
이 문서는 papersens 서비스가 배포 후 정상 수렴하지 않거나, 대표 도메인 접근이 비정상일 때 따르는 상세 대응 절차를 정리한다.
공통 초기 대응은 서비스 배포 이상 1차 대응 절차를 먼저 적용하고, 이 문서에서는 papersens의 단일 앱 구조와 ingress 확인 포인트를 본다.
준비물
papersensnamespace 확인 권한ArgoCD와kubectl확인 권한papersens.do4ai.com또는*.ps.do4ai.com기준 URL- 최근 변경 커밋 또는 배포 시각
먼저 확인할 운영 단위
- namespace:
papersens - 핵심 workload:
papersensDeployment - 핵심 ingress:
papersens-ingress - 먼저 볼 host/path:
papersens.do4ai.com,*.ps.do4ai.com,/
절차
1. 공통 1차 대응 절차를 먼저 적용한다
먼저 아래를 확인한다.
Application상태- namespace live 상태
- 대표 로그
그 다음 papersens 특화 확인으로 내려간다.
2. 단일 deployment 수렴 여부를 먼저 본다
sudo kubectl get deploy,pods,svc,ing -n papersens
papersens는 핵심 앱이 단일 deployment 중심이므로 아래를 먼저 본다.
- deployment replica 가 수렴하는가
- pod 가
Running또는Ready로 올라오는가 - service 와 ingress 가 같이 살아 있는가
3. 앱 로그에서 startup 과 요청 실패를 본다
sudo kubectl logs deploy/papersens -n papersens --tail=100
먼저 보는 항목은 아래다.
- startup 실패
- 환경 변수 또는 secret 누락
- 외부 연동 실패
- 라우팅 또는 host 처리 오류
4. 대표 host 와 wildcard host 를 같이 확인한다
sudo kubectl describe ingress -n papersens papersens-ingress
sudo kubectl get svc -n papersens
아래를 확인한다.
papersens.do4ai.com기준 host 가 정상인가*.ps.do4ai.comwildcard host 가 기대한 대로 연결되는가- ingress backend 와 service port 가 어긋나지 않는가
5. 접근 장애가 앱 문제인지 ingress 문제인지 나눈다
아래 기준으로 먼저 분리한다.
- pod 와 service 는 정상인데 외부 접근만 안 된다: ingress 또는 host 문제 가능성
- pod 자체가 뜨지 않는다: 앱 기동 또는 설정 문제 가능성
- 특정 host 만 안 된다: wildcard 또는 host rule 문제 가능성
검증 기준
papersensdeployment 가 정상 수렴하는가- 대표 host 와 wildcard host 가 기대한 경로로 응답하는가
- ingress 와 service 연결이 유지되는가
- 앱 로그에 반복 치명 오류가 남지 않는가
Escalation 또는 롤백 기준
아래 중 하나면 즉시 공유 또는 롤백을 검토한다.
- deployment 가 계속 수렴하지 않음
- 대표 host 와 wildcard host 가 동시에 실패함
- ingress rule 변경 직후 외부 접근이 전면 실패함
- startup 실패 원인이 새 변경과 직접 연결됨
작업 후 기록
Application상태- deployment, ingress, service 확인 결과
- 대표 host 와 wildcard host 검증 결과
- 최종 조치: 관찰, 추가 조사, 롤백