ACTIVE INCIDENT
00:00 elapsed
LABLAB-INFRA-02-NGINX-502SEV-2
배포 후 502 — 원인 찾기
ELAPSED
00:00
PHASE
0 / 6
SLA
60분
⚙️ Infra-Ops
← 목록
INCIDENT RESPONSE
0 / 7 단계 완료
📚 PREREQUISITES
Labnginx-install
Theorylinux/process-management
Theorylinux/service-management
TRACK
INFRA-OPS
SLA
60분
SEV
SEV-2
PHASES
5단계
ENV
local
INCOMING TICKET
장애 모니터링 경보: "HTTP 5xx 에러율 100% — 배포 직후 502 Bad Gateway 전체 트래픽 발생"
YOUR ROLE
주니어 인프라 엔지니어 (온콜 담당)
IMPACT IF UNRESOLVED
전체 API 트래픽 502 응답. 사용자 서비스 완전 중단. 배포 직후 발생으로 롤백 또는 즉시 복구 필요
🚨INCIDENT BRIEF
오전 9시 14분, 모니터링 알람이 울렸습니다.
HTTP 5xx 에러율 100% — 즉시 확인 필요
당신은 온콜 담당자입니다. 배포 직후 502 Bad Gateway 에러가 전체 트래픽에서 발생하고 있습니다.
Nginx는 살아있는데 upstream 앱 서버에 연결을 못 하고 있습니다.
에러 로그 분석 → 프로세스 확인 → 복구의 순서로 장애를 처리합니다.
⏱ 60분📊 중급🔧 5단계#nginx#spring-boot#502#troubleshooting
MISSION
1
에러 재현 및 에러 로그 분석
502 에러 메시지를 직접 확인하고, Nginx 에러 로그에서 핵심 메시지와 upstream 주소를 파악한다
2
프로세스 상태 및 포트 확인
앱 서비스(app)의 현재 systemd 상태를 확인하고, 8080 포트가 열려 있는지 확인한다
3
Nginx upstream 설정 검증
nginx.conf의 proxy_pass 주소가 앱 실행 포트와 일치하는지 확인한다
4
서비스 복구 및 최종 확인
curl -I localhost에서 200 OK가 응답되고, Nginx 에러 로그에 새 502 에러가 없어야 한다
5
502 장애 보고서 작성
발생 시각, 영향 범위, 원인, 조치, 재발방지책을 포함한 공식 장애 경위서를 작성한다
📌 선수 지식
• [실습] nginx-install
• [이론] linux/process-management
• [이론] linux/service-management
ℹ️ 실습 환경
환경: local
필요 도구: nginx, systemctl, journalctl, curl, ss
검증 스크립트: /labs/lab-infra-02-nginx-502/scripts/verify.sh
🔒
실습 실행은 Pro 플랜 전용입니다
인시던트 브리프와 학습 자료는 지금 바로 확인할 수 있습니다. 실제 실습 진행 및 터미널 사용은 Pro 플랜에서 가능합니다.
Pro로 업그레이드 →
>_ LAB TERMINAL↔ 너비 조절
NOTES