클라우드 콘솔에서 인스턴스를 만들 때 "리전(Region)"과 "가용영역(Availability Zone)"을 둘 다 골라야 해서 입문자는 헷갈립니다. 둘 다 "위치"를 고르는 것 같은데 뭐가 다를까요? 간단히 말하면 리전은 도시 규모의 지리적 위치이고, 가용영역은 그 리전 안에 물리적으로 떨어진 데이터센터 묶음입니다. 이 차이를 알아야 장애에 견디는 시스템을 설계할 수 있습니다.
리전과 가용영역의 관계
| 구분 | 리전 | 가용영역(AZ) |
|---|---|---|
| 규모 | 도시·국가 단위 지역 | 리전 안의 독립 데이터센터 묶음 |
| 개수 | 전 세계 다수 | 한 리전에 보통 2~6개 |
| 거리 | 리전 간 수백~수천 km | 같은 리전 내 수~수십 km |
| 분리 목적 | 지연 시간·법규·데이터 주권 | 단일 데이터센터 장애 격리 |
| 예시 | 서울(ap-northeast-2) | ap-northeast-2a, 2c, 2d |
하나의 리전은 여러 개의 가용영역으로 이루어집니다. 각 AZ는 전원·냉각·네트워크가 독립되어 있어 한 곳에 정전이나 화재가 나도 다른 AZ는 멀쩡합니다. 단, 같은 리전의 AZ들은 빠른 전용망으로 연결돼 있어 지연이 매우 낮습니다.
왜 나눠 놨을까
리전을 나누는 이유는 두 가지입니다. 첫째는 지연 시간 — 한국 사용자에게는 서울 리전이 미국 리전보다 훨씬 빠릅니다. 둘째는 규제 — "데이터를 국내에 보관해야 한다"는 법규를 지키려면 특정 리전을 골라야 합니다.
가용영역을 나누는 이유는 장애 격리입니다. 데이터센터 한 동에 문제가 생겨도 서비스가 죽지 않게 하려고, 같은 리전 안에서 물리적으로 떨어뜨려 놓은 것입니다.
고가용성 설계의 핵심
여기서 실무 규칙이 나옵니다. 서버를 한 AZ에만 몰아두지 말 것.
나쁜 구성: 서버 2대 모두 ap-northeast-2a → 2a 장애 시 전체 다운
좋은 구성: 서버 1대 2a + 1대 2c → 한 AZ 죽어도 서비스 유지
로드밸런서를 여러 AZ에 걸쳐 두고, 데이터베이스도 다른 AZ에 대기 복제본(standby)을 두는 식으로 Multi-AZ 구성을 합니다. 더 큰 재해(리전 전체 장애나 법적 격리)에 대비하려면 다른 리전에 백업·복제를 두는 멀티 리전까지 갑니다. 다만 멀티 리전은 거리가 멀어 지연과 비용이 커지므로, 대부분의 서비스는 Multi-AZ만으로 충분한 가용성을 얻습니다.
요점 정리
- 리전 = 도시 단위 지역, 가용영역(AZ) = 리전 안의 독립 데이터센터.
- 한 리전은 여러 AZ로 구성되고, AZ는 전원·네트워크가 분리돼 장애가 번지지 않는다.
- 고가용성의 기본은 여러 AZ에 분산(Multi-AZ), 재해 대비는 멀티 리전.
여러 가용영역에 인스턴스를 분산 배치하고 한 AZ를 내렸을 때 서비스가 유지되는지 확인하는 실습은 클라우드 트랙에서 회원가입 없이 무료로 할 수 있습니다.