🎯 완료 후 할 수 있는 것
📋 커리큘럼
총 37개 모듈01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
🧪 실습 Labs
개념을 익혔다면 직접 손으로 해보는 시간. 서버에서 따라하고 verify.sh로 검증하세요.
새 서버 인수인계 — 처음 30분
초급낯선 Linux 서버를 인수받았을 때 OS, 서비스, 로그를 빠르게 파악하는 루틴을 직접 수행한다.
디스크 꽉 참 — 장애 진단과 복구
중급새벽 3시 디스크 100% 풀 장애 발생. df와 du로 원인이 되는 실제 디렉토리 경로를 좁히고, lsof를 통해 파일은 삭제되었으나 프로세스가 여전히 파일 핸들을 점유하여 디스크 공간이 반환되지 않는 유령 파일을 찾아내 서비스 재시작 없이 안전하게 공간을 확보(truncate)하는 법을 실전처럼 배웁니다.
systemd — 나만의 서비스 등록
초급Python 스크립트를 systemd unit 파일로 등록하여 서버 재시작 후에도 자동 기동되고, 크래시 시 자동 재시작되는 서비스를 만든다.
/var 파티션 100% 장애 — 원인 분석과 복구
중급운영 서버 /var 파티션이 100% 찼다. 서비스가 죽어있다. df/du로 원인 경로를 좁히고, find로 대형 파일을 탐지하고, truncate와 journalctl --vacuum으로 공간을 확보한다. lsof로 삭제된 파일 핸들까지 잡아낸다.
앱이 갑자기 멈췄다 — Linux 로그 분석 실전
중급새벽 3시, payment-service가 응답이 없다. systemd 저널부터 /var/log 파일, grep/awk 패턴 분석, 로그 로테이션 설정까지 — 실제 장애 대응 흐름 그대로 따라가며 Linux 로그 분석 기술을 익힌다.
SSH 키 권한 — Permission denied 진단
초급신규 서버에 SSH 키로 접속하려는데 "Permission denied (publickey)" 오류가 반복되는 상황. ssh -v 상세 로그, 키 파일 권한(600/700 규칙), authorized_keys 등록 여부, known_hosts 충돌까지 단계적으로 진단하여 SSH 인증 실패의 근본 원인을 특정하고 복구합니다.
프로세스 CPU/메모리 — top/htop/sar로 병목 특정
초급서버가 갑자기 느려졌다는 신고를 받았을 때, top/ps/htop으로 어떤 프로세스가 CPU와 메모리를 독점하고 있는지 즉시 파악하고, OOM killer 발동 여부를 dmesg로 확인하며, sar로 시간대별 리소스 히스토리를 분석하는 실전 진단 흐름을 익힙니다.
파일 권한 — chmod/chown/umask 실전 적용
초급배포한 앱이 로그 파일에 쓰지 못하는 Permission denied 오류를 해결하면서 리눅스 파일 권한의 핵심인 rwxrwxrwx 표기 읽기, chmod 숫자/심볼 방식, chown 소유자 변경, umask 기본 권한 설정을 실전처럼 체득합니다.
cron — 자동화 작업 스케줄링
초급매일 새벽 2시에 DB 백업 스크립트를 자동 실행해야 하는 실무 상황에서 crontab 5자리 문법을 익히고, 첫 cron job을 등록하며, syslog로 실행 기록을 확인하고, 표준 출력 리다이렉트까지 포함한 실전 운영 패턴을 완성합니다.
메모리 누수 진단 — valgrind/smem/pmap 분석
고급며칠째 서버 메모리가 서서히 증가하여 주기적 재시작이 필요한 상황에서 free/smem으로 증가 추이를 확인하고, pmap으로 프로세스 메모리 맵을 상세 분석하며, /proc/meminfo로 커널 메모리 분류를 이해하고, valgrind로 C/C++ 메모리 누수를 탐지하는 전문가 수준의 진단 흐름을 익힙니다.