Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그
Dynamic Repartitioning for Time Series Workloads 섬네일

Dynamic Repartitioning for Time Series Workloads

넷플릭스 favicon넷플릭스·Architecture·
Apache KafkaApache SparkApache CassandraNodetool
2026년 06월 03일0

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

넷플릭스가 TimeSeries 데이터의 큰 파티션 문제를 해결하기 위해 Time Slice 재파티셔닝과 ID별 동적 파티셔닝을 도입해 읽기 지연과 타임아웃을 크게 개선했습니다.

구현 방법

  • Time Slice 재파티셔닝: 노드 히스토그램(nodetool tablehistograms)을 사용해 파티션 크기를 감지하고, DynamicTimeSliceConfigWorker가 향후 Time Slice의 파티션 전략을 자동으로 업데이트합니다(밀도 목표를 2MiB~10MiB로 설정).
  • 동적 파티션 per ID: 읽기 시 넓은 파티션을 탐지해 계획·분할을 비동기로 수행하고, Bloom 필터로 읽 경로를 분리 파티션으로 우회시켜 쓰레드 큐잉을 줄입니다. 분할 검증은 pre/post 체크섬으로 수행합니다.
  • 운영·모니터링: wide_row 메타데이터 테이블로 체크포인트를 관리하고, 파티션 분할 결과를 읽 경로에 반영합니다.

주요 결과

  • 넓은 파티션의 평균 읽기 지연이 초 단위에서 저수십 ms로 감소
  • Tail 지연은 수 초에서 약 200 ms 이하로 떨어짐
  • 시간초과 감소, CPU 활용도 하락, 쓰레드 큐잉 감소, 500MB+ 파티션도 안전하게 조회 가능
  • 체크섬 매칭 기반의 안전한 롤아웃 및 안정성 향상

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
The Evolution of Cassandra Data Movement at Netflix 섬네일
69%

The Evolution of Cassandra Data Movement at Netflix

넷플릭스 favicon넷플릭스·2026년 06월 19일
10초 타임아웃에서 벗어나기까지의 여정 섬네일
65%

10초 타임아웃에서 벗어나기까지의 여정

무신사 favicon무신사·2025년 08월 31일
From Silos to Service Topology: Why Netflix Built a Real-Time Service Map 섬네일
64%

From Silos to Service Topology: Why Netflix Built a Real-Time Service Map

넷플릭스 favicon넷플릭스·2026년 06월 19일