📘

3단계: 데이터베이스 & 데이터 시스템

인덱스/트랜잭션/락/캐시/메시징으로 데이터 시스템의 성능·정합성·확장성을 다지는 모듈

타임라인 Learning 메인

모듈형 학습 자동 정렬

🧠 모듈 개요

이 단계에서 얻는 것

이 단계는 “스프링을 안다”에서 한 단계 더 나아가, 데이터/정합성/성능을 근거 있게 다룰 수 있게 만드는 구간입니다.

DB 성능 감각: 인덱스/실행 계획을 보고 “왜 느린지”를 추적하고, 튜닝 방향을 세울 수 있습니다.
정합성 감각: 트랜잭션/격리 수준/락/데드락을 이해해서 “깨지지 않는” 설계를 할 수 있습니다.
캐시/메시징 감각: Redis 캐시 패턴, Kafka/Outbox 같은 비동기 설계를 “언제/왜” 쓰는지 연결할 수 있습니다.
데이터 관측/운영 감각: “느린 쿼리/락 대기/캐시 미스/컨슈머 지연” 같은 신호를 지표/로그로 연결합니다.

이 모듈을 보는 방법

이 페이지 아래에 연결된 글이 순서대로 정렬됩니다.

인덱스/실행 계획으로 “느림”을 해부하고
트랜잭션/락으로 “정합성”을 확보하고
캐시/메시징으로 “확장/운영”을 설계하는 흐름으로 읽으면 좋습니다.

각 글의 연습은 “완성 프로젝트”가 목표가 아니라, 작은 재현/관찰로 감각을 만드는 것이 목표입니다.

왜 이런 순서인가

데이터 관련 문제는 결국 다음 순서로 좁혀집니다.

쿼리가 느리다 → 실행 계획/인덱스/풀/락 대기 중 어디가 원인인지 분해
정합성이 깨진다 → 트랜잭션 경계/격리 수준/동시성 제어를 재설계
트래픽이 커진다 → 캐시/비동기/샤딩 같은 확장 전략을 선택

그래서 “인덱스/EXPLAIN → 트랜잭션/락 → 캐시/메시징 → 설계 문제” 순서를 기본으로 둡니다.

이 단계의 핵심 주제

인덱스/실행 계획/쿼리 튜닝
트랜잭션/격리 수준/락/데드락
캐시 전략(Cache-Aside/Write-Through/Stampede)
메시징/이벤트 기반 설계(Kafka, Outbox)
데이터 관측(슬로우 쿼리/락 대기/컨슈머 지연)

데이터 변경 파이프라인으로 확장하기

데이터 시스템을 공부할 때 인덱스와 트랜잭션까지만 보면 “DB를 잘 쓰는 법"에서 멈추기 쉽습니다. 실무에서는 그다음 질문이 더 자주 나옵니다. 관리자가 엑셀 20만 행을 올리면 어떻게 처리할지, 외부 파트너 파일을 다시 받으면 중복 반영을 어떻게 막을지, 배치가 절반만 성공했을 때 어떤 기준으로 재처리할지 같은 문제입니다.

이런 작업은 단순 CRUD가 아니라 상태를 가진 데이터 변경 파이프라인으로 봐야 합니다. 요청 하나가 오래 걸리고, 일부 row가 실패하며, 사용자가 같은 파일을 다시 올리고, worker가 온라인 DB와 자원을 공유하는 상황을 모두 정상 경로로 다룹니다. 그래서 이 모듈의 후반부는 쿼리 튜닝 → 정합성 제어 → 비동기 처리 → 재처리/대조 순서로 확장해서 읽는 편이 좋습니다.

추천 흐름은 아래와 같습니다.

Async Request-Reply Operation Resource로 긴 작업을 동기 응답에서 분리합니다.
Bulk Import Job, 대량 업로드 운영 설계로 파일 업로드, 검증, dry-run, apply, row error를 하나의 job 모델로 묶습니다.
Batch Idempotency/Reprocessing으로 같은 입력이 다시 들어와도 같은 업무 효과가 두 번 나지 않게 만듭니다.
Workload-aware Queue Partitioning으로 대형 import와 짧은 온라인 후처리 작업이 같은 큐에서 서로 막지 않게 분리합니다.
Reconciliation Ledger Pipeline으로 원장, 파생 테이블, 외부 시스템 사이의 불일치를 주기적으로 확인합니다.

실무 판단 체크리스트

처리 시간이 5초를 넘거나 row 수가 1,000개를 넘을 수 있으면 동기 API 대신 operation resource를 검토했는가?
업로드 성공, 검증 성공, 실제 반영 성공을 서로 다른 상태로 나누었는가?
파일 단위 fingerprint와 row 단위 effect key를 분리해 중복 업로드와 중복 반영을 따로 막는가?
부분 성공 허용률, 자동 중단 기준, 사람 승인 기준이 숫자로 정해져 있는가?
대형 job이 온라인 트래픽의 DB CPU, lock wait, queue lag를 악화시키면 자동 throttle 또는 pause할 수 있는가?
재처리 후에는 성공 로그뿐 아니라 reconciliation이나 샘플 대조로 실제 side effect를 확인하는가?

이 관점을 잡으면 데이터 시스템 학습이 “쿼리를 빠르게 만든다"에서 끝나지 않습니다. 느린 쿼리, 락, 캐시 미스, 큐 지연, 재처리, 데이터 불일치를 하나의 운영 흐름으로 연결할 수 있습니다. 특히 백오피스 import, 정산, 권한 변경, 파트너 동기화처럼 장애가 조용히 데이터 오염으로 번지는 기능에서는 이 흐름이 필수에 가깝습니다.

조회 결과를 운영 산출물로 바꾸기

데이터 시스템의 다른 축은 “많이 쓰는 것"이 아니라 “많이 읽어 내보내는 것"입니다. 관리자 화면의 전체 다운로드, 정산 파일 생성, 감사 로그 반출, 고객 데이터 export는 처음에는 단순 CSV 기능처럼 보이지만, 규모가 커지면 긴 쿼리, replica lag, 개인정보 노출, 재생성 불일치, 만료되지 않는 링크 문제가 한꺼번에 붙습니다.

그래서 import와 마찬가지로 export도 상태가 있는 파이프라인으로 다뤄야 합니다. 화면 조회와 파일 생성은 목적이 다릅니다. 화면 조회는 현재 상태를 빠르게 보여주는 것이 목표지만, export는 나중에 “어떤 조건으로, 어느 시점의 데이터를, 누가, 어떤 권한으로 받았는지” 설명할 수 있어야 합니다.

추천 흐름은 아래와 같습니다.

HTTP QUERY, 복잡한 읽기 API가 GET과 POST 사이의 빈칸을 메운다로 즉시 응답 가능한 복잡한 조회와 긴 작업의 경계를 잡습니다.
Cursor Pagination Consistency로 정렬, snapshot, 중복/누락 없는 탐색 기준을 먼저 정리합니다.
대용량 데이터 Export 파이프라인으로 전체 다운로드를 job, artifact metadata, signed URL, 감사 로그로 분리합니다.
Object Storage와 파일 관리로 파일 저장, 만료, 접근 제어, checksum 기준을 보강합니다.
Tamper-Evident Audit Log로 민감 export의 요청·생성·다운로드 기록을 나중에 검증 가능한 형태로 남깁니다.

Export 판단 체크리스트

결과가 1만 행 또는 10MB를 넘을 수 있으면 동기 다운로드를 기본값으로 두지 않는가?
화면 필터와 export 필터가 같은 계약을 쓰고, filter_hash와 schema_version을 남기는가?
파일 생성 시점뿐 아니라 다운로드 시점에도 현재 권한을 다시 확인하는가?
signed URL TTL, 파일 보관 기간, 민감 컬럼 마스킹 기준이 숫자로 정해져 있는가?
heavy export worker가 primary DB와 온라인 트래픽을 밀어내지 않도록 replica, 큐, 동시성을 제한하는가?
CSV formula injection, timezone, locale, null 표현처럼 파일 소비자가 겪는 문제를 schema 문서에 적었는가?

이 경로를 붙이면 데이터 시스템 모듈이 “입력 파이프라인"에만 치우치지 않습니다. import는 외부 데이터를 안전하게 들여오는 문제이고, export는 내부 데이터를 책임 있게 내보내는 문제입니다. 둘을 같이 보면 snapshot, 멱등성, 감사 로그, object storage, queue throttling 같은 운영 기준이 반복해서 등장한다는 점이 보입니다.

미니 실습

EXPLAIN 읽기: 느린 쿼리를 만들고 실행 계획으로 병목 찾기
락/데드락 재현: 트랜잭션 두 개로 락 대기 상황 만들기
캐시 스탬피드 방지: TTL 지터 또는 락으로 붐 방지 실험
Import job 모델링: 업로드/검증/apply/부분 실패 상태와 row error 코드를 표로 정의
Export job 모델링: 전체 다운로드를 accepted/running/uploading/available/expired 상태와 artifact metadata로 나누기
재처리 안전성 점검: 같은 파일을 두 번 실행해도 중복 효과가 나지 않는 멱등 키 설계

완료 기준 (다음 단계로 넘어가기 전)

EXPLAIN을 보고 ALL/filesort/temporary 같은 위험 신호를 읽고, 인덱스/쿼리 개선 방향을 말로 설명할 수 있다
격리 수준/락 때문에 생기는 현상(데드락/락 대기)을 로그/지표로 구분할 수 있다
캐시를 “붙여서 빨라졌다”가 아니라, 키/TTL/무효화/스탬피드까지 포함해 설계할 수 있다
대량 데이터 변경을 동기 API, 비동기 operation, 배치 job 중 어디에 둘지 판단할 수 있다
대용량 export를 동기 다운로드, QUERY, 비동기 export job 중 어디에 둘지 판단할 수 있다
재처리와 reconciliation 기준을 함께 설명할 수 있다

🔗 추천 학습 경로

Bulk Import Job, 대량 업로드 운영 설계

CSV·엑셀·JSONL 업로드를 상태 있는 import job, row error, 멱등성, 부분 성공 정책으로 설계합니다.

대용량 데이터 Export 파이프라인

전체 다운로드를 snapshot, artifact, signed URL, 감사 로그가 있는 운영 파이프라인으로 설계합니다.

Async Request-Reply Operation Resource

처리 시간이 긴 데이터 변경 작업을 202 Accepted와 상태 조회 API로 분리하는 계약입니다.

Batch Idempotency/Reprocessing

배치 재실행, 체크포인트, 멱등 키, 중복 효과 방지를 운영 기준으로 정리합니다.

Workload-aware Queue Partitioning

대형 job과 온라인 트래픽이 서로 밀어내지 않도록 큐와 worker pool을 나누는 방법입니다.

📑 이 모듈의 학습 노트

Database 11/11

SQL 기초: SELECT/INSERT/UPDATE/DELETE 완벽 정리

SQL의 기본 CRUD 작업과 WHERE/ORDER BY/LIMIT 조건을 실전 예제로 마스터

SQL Database MySQL

Database 12/16

SQL 기본: 조인/집계/인덱스가 먹는 조건 감각

SQL 실행 순서와 조인/집계 성능 함정, 인덱스가 타는 조건을 감각으로 잡는 기본기

SQL Join Aggregation

Database 11/13

SQL 서브쿼리와 집계함수: GROUP BY, HAVING, 윈도우 함수 마스터

서브쿼리, GROUP BY/HAVING 집계, 윈도우 함수로 복잡한 데이터 분석 쿼리 작성

SQL Subquery GROUP BY

Database 11/15

DB 스키마 설계 기본기: 키/제약조건/정규화

PK/UK/FK, 제약조건, 정규화/비정규화, 변경에 강한 스키마 설계 기준을 실무 관점으로 정리

Database Schema Modeling

Database 11/17

DB Connection Pool: HikariCP 설정과 성능 튜닝 완벽 가이드

커넥션 풀의 동작 원리와 HikariCP 설정으로 데이터베이스 성능을 최적화하는 실무 가이드

Connection Pool HikariCP Database

Database 12/16

MySQL 인덱스 설계와 실행 계획 읽기

B-Tree/컴포지트 인덱스 설계, EXPLAIN으로 실행 계획을 해석하고 튜닝하는 방법

MySQL Index EXPLAIN

Database 12/16

MySQL 성능 튜닝: 슬로우 쿼리와 커넥션 풀

슬로우 쿼리 로그, 커넥션 풀(HikariCP) 파라미터, 실행 계획 튜닝 포인트

MySQL Performance Slow Query

Database 11/19

NoSQL 기초: RDBMS와 비교하고 언제 사용할지 판단하기

NoSQL의 종류와 특징을 이해하고, RDBMS vs NoSQL 선택 기준을 실무 관점에서 정리

NoSQL MongoDB Redis

Database 11/21

MySQL 대용량 처리: 파티셔닝과 샤딩 전략

MySQL 파티셔닝과 샤딩으로 대용량 데이터를 효율적으로 처리하는 방법

MySQL Partitioning Sharding

Redis 12/16

Redis 캐시 패턴 모음

Cache-Aside, Write-Through, Write-Behind, 분산락 패턴을 코드 예시와 함께 정리

Redis Cache Aside Write Through

Database 11/27

데이터베이스 마이그레이션: Flyway로 스키마 버전 관리하기

Flyway를 이용한 데이터베이스 스키마 버전 관리와 안전한 마이그레이션 전략

Database Migration Flyway Schema

Database 02/12

DB 복제 & 읽기/쓰기 분리: Replication, Lag, Failover 실전

복제 구조의 원리(Primary/Replica), 복제 지연(Lag) 대응, 읽기/쓰기 분리 라우팅과 장애 전환 기준

Database Replication Read Replica

Kafka 12/16

Kafka Consumer Lag 관리와 리밸런스 대응

Lag 모니터링, 리밸런스 원인, 처리량/중복/손실 사이 트레이드오프 정리

Kafka Consumer Lag Rebalance

Kafka 12/16

Kafka 멱등·정렬 처리 전략

멱등 프로듀서, 정렬 보장 패턴, Exactly-once 처리를 위한 설정과 설계

Kafka Idempotent Ordering

Architecture 12/16

Outbox/Saga 패턴으로 분산 트랜잭션 다루기

Outbox 패턴, Saga(Choreography/Orchestration)로 데이터 일관성을 유지하는 방법

Outbox Saga Event Driven

Messaging 12/16

Redis Streams로 이벤트 스트림 처리하기

Redis Streams 기본 개념부터 Consumer Group/PEL, 멱등 처리와 재처리(복구)까지: 작은 이벤트 파이프라인 설계

Redis Streams Consumer Group

Redis 12/16

Redis Streams 심화: Backlog 관리와 재처리 전략

Pending 리스트 관리, 장애 시 재처리, 대량 backlog를 제어하는 Streams 운영 패턴 — Spring Boot + Lettuce 실무 코드 포함

Redis Streams Consumer Group

JPA 12/16

JPA N+1: 영원한 숙제, 확실히 잡기

로그에 쿼리 100개가 찍히는 공포. 원인 분석부터 Fetch Join, Batch Size, EntityGraph 해결법 비교

JPA Hibernate N+1

Database 12/16

인덱스 기본: B-Tree 구조와 쿼리 성능

인덱스가 왜 빨라지는지(B-Tree/선택도/커버링), 복합 인덱스 설계와 쿼리 튜닝의 기본 감각

Database Index B-Tree

Spring 12/16

Spring Transaction: @Transactional 동작 원리와 실전 함정

전파/격리/롤백 규칙과 프록시 동작, self-invocation/checked exception 같은 실무 함정을 한 번에 정리

Spring Transaction @Transactional

Caching 12/16

Redis 캐싱: 패턴/무효화/운영 함정까지

Cache-Aside/Write-through/Write-behind 선택, 무효화/스탬피드/핫키 같은 실전 문제와 운영 지표까지 정리

Redis Caching Cache Aside

Database 11/23

Redis 고급 기능: BitMap, HyperLogLog, Geo, Bloom Filter

Redis의 고급 데이터 구조로 메모리 효율적인 솔루션 구현하기

Redis BitMap HyperLogLog

Database Internals 12/28

스토리지 엔진 내부: B-Tree vs LSM-Tree

DB 성능의 핵심인 스토리지 엔진. MySQL의 B-Tree와 Cassandra/RocksDB의 LSM-Tree 구조를 비교하고 장단점을 파헤칩니다.

Database B-Tree LSM-Tree

Database 12/16

MySQL 트랜잭션 격리 수준과 락

READ COMMITTED/REPEATABLE READ 차이, Gap/Next-Key Lock과 데드락 예방법

MySQL Isolation Lock

Caching 02/12

Redis Cache Stampede 방지 실전: 락, 조기만료, 이중 캐시

TTL 만료 폭발을 막는 락/조기만료/이중 캐시 전략과 Spring Boot 통합, 모니터링, 실전 트러블슈팅까지

Redis Cache Stampede Thundering Herd

JPA 12/28

JPA 성능 최적화: Fetch 전략과 배치 처리

JPA N+1 해결, Fetch 전략, 배치 처리 등 성능 최적화 실전 기법

JPA Hibernate Performance

Database 12/28

페이지네이션과 정렬: 대용량 데이터 처리

Offset vs Cursor 페이지네이션 비교, 대용량 데이터 정렬과 Spring Data 적용

Pagination Database Performance

Architecture 03/12

백엔드 커리큘럼 심화: Usage Metering·Quota·청구 정합성을 한 번에 설계하는 방법

사용량 계량, 실시간 쿼터 차단, 월말 청구 정산을 분리·연결해서 운영하는 실무 아키텍처와 의사결정 기준을 정리합니다.

Usage Metering Billing Quota

Data Engineering 03/10

백엔드 커리큘럼 심화: 데이터 보존·삭제 아키텍처 (Soft Delete, Archive, Purge)

백엔드 서비스에서 데이터 보존 기간, 논리 삭제, 물리 삭제, 아카이브를 어떻게 분리 설계해야 운영 안정성과 규제 대응을 동시에 잡을 수 있는지 실무 기준으로 정리합니다.

Data Retention Soft Delete Purge Pipeline

Architecture 03/16

백엔드 커리큘럼 심화: Reconciliation 파이프라인으로 금액·포인트 데이터 불일치 줄이기

주문·결제·포인트 시스템에서 발생하는 데이터 불일치를 탐지하고 복구하는 Reconciliation 아키텍처를 실무 기준으로 정리합니다.

Reconciliation Ledger Data Consistency

Data Architecture 03/17

백엔드 커리큘럼 심화: 샤딩 키 설계와 리샤딩 운영 플레이북

샤딩 키를 어떻게 고르고, 언제 리샤딩을 결정하며, 운영 중단 없이 이전하는지 실무 기준으로 정리합니다.

Sharding Resharding Partition Key

Database 03/28

백엔드 커리큘럼 심화: DB 메이저 버전 무중단 업그레이드 플레이북(호환성·회귀·롤백 기준)

DB 메이저 버전 업그레이드를 단순 점검이 아니라 운영 가능한 전환 절차로 다룹니다. 호환성 확인, 쿼리 플랜 회귀 감지, 트래픽 승격/롤백 기준까지 숫자 중심으로 정리합니다.

PostgreSQL MySQL Major Upgrade

Caching 04/22

캐시 워밍과 콜드 스타트 완화 실전: 배포 직후 느려지는 서비스를 줄이는 운영 설계

캐시 워밍, 콜드 스타트, 핫셋 선정, 단계적 워밍, 보호 장치를 묶어 배포 직후 성능 흔들림을 줄이는 실무 설계를 정리합니다.

Cache Warmup Cold Start Redis

Database 04/29

백엔드 커리큘럼 심화: Lag-Aware Read Routing과 Follower Read 운영 플레이북

읽기/쓰기 분리 다음 단계로, replica lag를 숫자로 보고 follower read를 허용하거나 차단하는 기준을 실무 관점에서 정리합니다.

Read Replica Follower Read Replication Lag

Caching 05/02

백엔드 커리큘럼 심화: Cache-Aside, Read-Through, Write-Through, Write-Behind를 workload 기준으로 고르는 법

캐시 패턴은 취향이 아니라 workload와 데이터 신뢰도 요구에 맞춰 골라야 합니다. Cache-Aside, Read-Through, Write-Through, Write-Behind를 실무 숫자와 조건으로 비교합 …

Caching Cache-Aside Read-Through

Data Export 06/24

백엔드 커리큘럼 심화: 대용량 데이터 Export 파이프라인, 조회 버튼을 운영 가능한 산출물로 바꾸기

대용량 CSV·엑셀·JSONL export를 동기 다운로드가 아니라 snapshot, job, object artifact, 감사 로그, 만료 정책이 있는 운영 파이프라인으로 설계하는 기준을 정리합니다.

Data Export Batch Pipeline Object Storage