핵심 요약
넷플릭스가 Batch Compute를 Kueue로 전환해 Titus와 연동하는 Kubernetes‑네이티브 배치 플랫폼을 구축했고, 생산 환경에서 수백만 건의 작업을 관리합니다.
구현 방법
- Titus 셀에서 Kueue를 활성화해 Netflix Batch를 도입
- 내부 Tenants를 Cohort, Leaf Tenants를 ClusterQueue+LocalQueue로 매핑
- 용량 구성은 Reserved/Shared를 리소스Flavor와 명목 쿼터로 변환
- Kueue 라우터와 Titus 페더레이션으로 작업 전달
주요 결과
- 프로덕션에서 완전 롤아웃, 수백만 워크로드 관리
- Preemption 및 공정 공유로 자원 활용 증가
- 가장 큰 고객 먼저 마이그레이션하고 4주 이행으로 위험 감소

