📘

4단계: 운영 · 배포 · 모니터링

Docker, CI/CD, 모니터링, 클라우드 배포까지 운영 스택을 갖추는 모듈

모듈형 학습 자동 정렬

🧠 모듈 개요

이 단계에서 얻는 것

이 단계는 “기능을 만든다”에서 한 단계 더 나아가, 만든 서비스를 안전하게 운영하는 능력을 만드는 구간입니다.

  • 배포 가능한 형태로 만들기: Docker로 패키징하고, 환경 차이를 통제할 수 있습니다.
  • 자동화된 품질 게이트: CI에서 테스트/빌드/리포트를 고정해 “깨지는 코드”가 들어오는 걸 줄입니다.
  • 무중단 배포/롤백 감각: 롤아웃 전략과 헬스체크를 이해하고, 장애 시 빠르게 되돌릴 수 있습니다.
  • 관측성 베이스라인: 로그·메트릭·트레이스로 “왜 느린지/왜 실패하는지”를 추측이 아니라 데이터로 파악합니다.
  • 운영 보안 기본기: 비밀 관리/네트워크/권한 최소화 같은 운영 기본기를 갖춥니다.

이 모듈을 보는 방법

이 모듈은 “읽고 끝”보다, 작은 서비스 하나를 정해서 아래를 계속 반복하는 방식이 효과적입니다.

  1. Docker로 패키징한다
  2. CI로 테스트/빌드를 고정한다
  3. 배포하고(헬스체크/롤백 포함)
  4. 관측성을 붙여서 지표로 확인한다

각 글의 연습은 “완벽한 인프라”가 아니라, 운영 사고를 막는 최소한의 기준을 만드는 데 목적이 있습니다.

왜 이런 순서인가

운영 문제는 보통 “환경/배포/관측”에서 시작합니다.

  • 먼저 컨테이너로 실행 환경을 고정하고,
  • CI로 품질/재현성을 확보한 뒤,
  • 배포 전략과 관측성으로 “장애를 빠르게 발견하고 되돌리는” 루프를 만듭니다.

다음 단계로 넘어가기 전(권장 기준)

  • 도커 이미지로 빌드/실행이 가능하고, 로컬에서 docker-compose로 의존성을 함께 올릴 수 있다
  • PR 기준으로 테스트가 자동 실행되고, 실패 시 원인이 재현 가능하게 남는다
  • 배포 시 헬스체크/롤백이 동작하고, 최소한의 런북(롤백 절차)이 있다
  • p95/p99 레이턴시/에러율/리소스 사용량을 한 화면에서 볼 수 있다(대시보드 1개라도)

📑 이 모듈의 학습 노트

Networking

로드밸런서/헬스체크 설계

ALB/NLB 헬스체크, 타임아웃/리트라이 설정, 고가용성을 위한 설계 포인트

Load Balancer Health Check ALB
Ops

클라우드 비용 최적화 전략

오토스케일, 캐시/스토리지 티어링, 예약/세이빙 플랜, 모니터링을 통한 비용 최적화

Cost Optimization Autoscaling Caching