핵심 요약
NAVER D2가 VictoriaMetrics를 도입해 5년간 운영하며 12.5억 활성 시계열과 555조 데이터포인트를 안정적으로 관리하고, 180대 규모의 멀티클러스터(Hot 120대/Warm 60대)에서 랑데부 해싱 기반 무중단 교체를 달성했습니다.
구현 방법
- Hot/Warm 2계층 아키텍처 도입(Hot: SSD 512GB, Warm: HDD 512GB)
- vmagent 이중 쓰기, 샤딩은 랑데부 해싱, replicationFactor 3
- Hot Tier를 역순으로 신규 장비 추가하여 무중단 교체 구현
- Warm Tier는 vmbackup/vmrestore를 활용한 세트 단위 점진 전환
- 전체 수집 처리량 약 2,000만 개/초, 실제 디스크 사용량 약 510TB
주요 결과
- 활성 시계열 12.5억 개, 데이터포인트 555조 개 저장
- 쿼리 성능: Hot Tier 초당 500건 이상 레인지 쿼리, p99 약 300ms
- 무중단 교체로 downtime 0분, 메트릭 누락 0건


