ACTIVE INCIDENT
00:00 elapsed
LABLAB-INFRA-OPS-14-SCHEDULER-BATCHSEV-2
배치 스케줄러 장애 — cron이 "등록은 됐는데 안 도는" 이유
ELAPSED
00:00
PHASE
0 / 4
SLA
40분
⚙️ Infra-Ops
← 목록
INCIDENT RESPONSE
0 / 5 단계 완료
📚 PREREQUISITES
Lablinux-cron-setup
Theoryinfra-ops/scheduler-batch-ops
TRACK
INFRA-OPS
SLA
40분
SEV
SEV-2
PHASES
3단계
ENV
local
INCOMING TICKET
업무 보고: "어젯밤 정산 배치가 안 돌았는지 오늘 통계가 비어 있어요. cron에는 등록돼 있는데요."
YOUR ROLE
인프라 운영 엔지니어인 당신이
IMPACT IF UNRESOLVED
야간 정산/집계 배치 누락으로 데이터 공백·지표 오류. 중복 실행 시 이중 정산 등 2차 사고.
🚨INCIDENT BRIEF
"어젯밤 정산 배치가 안 돈 것 같아요. 오늘 통계가 비었어요."
crontab -l 해보니 분명히 등록돼 있습니다. 손으로 스크립트를 직접 실행하면 잘 됩니다.
그런데 cron으로는 안 돕니다. 이 "수동은 되는데 cron은 안 됨"이 cron 장애의 90%입니다.
원인은 거의 정해져 있습니다: cron의 빈약한 환경(PATH·환경변수 부재), 실패를 아무도 못 본 로그 부재,
시각/시간대 오해, 그리고 가끔 도는데 겹쳐 도는 중복 실행. 하나씩 좁혀 원인을 찾고, 재발을 막습니다.
⏱ 40분📊 중급🔧 3단계#cron#batch#scheduler#systemd-timer
MISSION
1
실행 여부 확인 — "안 돈 건가, 돌다 실패한 건가"
cron이 잡을 트리거하긴 했는지, 트리거됐지만 스크립트가 실패한 건지 로그로 가른다
2
환경 차이 재현 — "수동은 되는데 cron은 안 됨"
cron의 빈약한 환경(PATH·환경변수·작업 디렉터리)이 실패 원인인지 재현하고 교정한다
3
멱등성·중복 방지·모니터링으로 재발 차단
겹쳐 도는 중복 실행을 잠금으로 막고, 실패/누락을 즉시 아는 모니터링을 더한다
📌 선수 지식
ℹ️ 실습 환경
환경: local
필요 도구: cron, systemctl, journalctl, flock, date
🔒
실습 실행은 Pro 플랜 전용입니다
인시던트 브리프와 학습 자료는 지금 바로 확인할 수 있습니다. 실제 실습 진행 및 터미널 사용은 Pro 플랜에서 가능합니다.
Pro로 업그레이드 →
>_ LAB TERMINAL↔ 너비 조절
NOTES