블랙프라이데이가 일주일 남았습니다.
"지난번 이벤트 때 트래픽 3배 몰려서 서버 다운됐잖아요. 이번엔 HPA 달아놓고 가세요."
수동으로 Pod 수를 늘리는 것은 근본적인 해결책이 아닙니다. 트래픽이 언제 얼마나 올지 정확히 알 수 없고, 사람이 항상 모니터링하고 있을 수도 없습니다.
HPA(Horizontal Pod Autoscaler)는 CPU 사용량 같은 메트릭이 임계값을 초과하면 Pod를 자동으로 늘리고, 부하가 줄면 다시 줄여줍니다. Metrics Server에서 실시간 데이터를 받아 동작합니다.
CPU 70% 초과 시 최소 2개에서 최대 10개까지 자동 확장되는 HPA를 구성하고, 부하 시뮬레이션으로 실제 스케일아웃이 일어나는지 확인합니다.