핵심 요약
RIDI의 추천 시스템은 SageMaker 도입으로 개발 도구를 간소화하고 학습-추론 분리 및 모델 레지스트리/롤백 자동화를 구현해 운영 효율성과 확장성을 강화했습니다.
구현 방법
- 학습/추론 분리로 개발 리소스 효율화 및 확장성 향상
- SageMaker Training 및 SageMaker Experiments로 실험 관리 및 모델 튜닝 최적화
- 모델 레지스트리 도입으로 메타데이터 중앙 관리 및 자동 롤백 구현
- 실시간 추론 도입을 위한 파이프라인 구성: TorchServe에서 Triton으로 이전, 전처리/추론/후처리 엔벨런 구성
- CI/CD 및 운영: Airflow와 SageMakerOperator를 통한 엔드 투 엔드 배포 자동화
- 향후 과제: 동적 실시간 추론 확장 및 Bloom 필터 등 대체 기술 검토
주요 결과
- ML 엔지니어가 비즈니스 엔지니어링에 더 집중 가능해짐
- 개발 생산성과 운영 효율성 향상 기대
- 모델 관리 및 롤백 자동화로 운영 리스크 감소


