Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

Karrot’s Journey to CDC with MongoDB

당근 favicon당근·Architecture·
Apache FlinkMongoDBApache SparkCDCBigQuery
2025년 12월 09일3

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

당근은 MongoDB CDC를 도입해 Flink CDC 기반 파이프라인으로 MongoDB 변경 데이터를 수집·변환·BigQuery 적재를 수행하고 2시간 SLO 달성을 목표로 스키마 변화에 안정적으로 대응하는 Two-Stage Table 아키텍처를 구현했습니다.

구현 방법

  • MongoDB Change Stream을 Flink CDC로 구독하고 Exactly-Once 처리를 위한 체크포인트를 활용
  • 초기 스냅샷은 Spark 기반 방식으로 데이터 로딩
  • Stage 1 Raw(JSON) → Stage 2 Final 테이블로 스키마 변화에 따른 재구성 및 빠른 반영

주요 결과

  • 2시간 SLO를 충족하도록 설계된 파이프라인으로 운영 복잡성 감소
  • 스키마 변화 시 재처리 비용과 시간 대폭 감소(20분 이내)
  • Consistency 검증(dual write) 및 자동 알림으로 2주간 데이터 일관성 유지 확인

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
No Image
77%

매번 다 퍼올 필요 없잖아? 당근의 MongoDB CDC 구축기

당근 favicon당근·2025년 12월 08일
Kafka에서 S3로 실시간 데이터 수집 파이프라인 설계와 구축기 섬네일
70%

Kafka에서 S3로 실시간 데이터 수집 파이프라인 설계와 구축기

펫프렌즈 favicon펫프렌즈·2025년 11월 07일
Oracle에서 MongoDB로의 CDC Pipeline 구축 섬네일
70%

Oracle에서 MongoDB로의 CDC Pipeline 구축

카카오페이 favicon카카오페이·2024년 02월 02일