핵심 요약
쿠팡의 ML Platform은 노트북/파이프라인, 피처 스토어, 모델 학습·추론, 모니터링을 한 곳에서 관리해 ML 개발 생애주기를 가속화합니다.
구현 방법
- Notebooks/ML Pipeline: Jupyter 컨테이너, CPU/GPU
- Feature Store: Feast 기반 온라인/오프라인
- Training/Inference: Kubernetes 컨테이너 파이프라인, Seldon/TFServing/Triton 연동
- Monitoring/Observability: 클러스터/서비스 모니터링 대시보드
주요 결과
- Ko-BERT 멀티 GPU 학습 10x 가속
- 100K+ 워크플로우, 600+ ML 프로젝트 운영
- 온프렘+AWS 하이브리드로 비용 효율성 향상


