핵심 요약
당근의 검색 플랫폼 팀은 Elasticsearch를 Kubernetes에서 안정적으로 운용하기 위해 search-coordinator 프록시를 도입했습니다. 데이터 노드의 워밍업 여부와 관계없이 트래픽 흐름을 제어해, 재시동 시에도 검색 서비스를 지키고자 했습니다.
구현 방법
- search-coordinator를 HTTP 프록시이자 워밍업 오케스트레이터로 도입
- Central Dogma로 prefer_nodes를 관리
- Redis 분산 락으로 노드당 한 차례 워밍업 보장
- Kafka로 워밍업 쿼리 수집 및 활용
주요 결과
- 워밍업 완료 노드만 검색 대상에 포함되어 롤링 리스타트 중 안정성 향상
- 단일 소스 오브 트루스 방식으로 라우팅 정책 중앙 관리

