핵심 요약
AWS의 VAMS가 NVIDIA Isaac Lab과의 통합을 통해 자산 관리 워크플로우에서 GPU 가속 로봇 시뮬레이션 훈련을 자동화했습니다.
구현 방법
- API Gateway → AWS Step Functions → AWS Batch를 통한 훈련 작업 제출 및 실행
- NVIDIA Isaac Lab 공식 컨테이너 이미지(nvcr.io/nvidia/isaac-lab:2.3.0) 기반으로 다중 환경/다중 노드 훈련 자동화
- VAMS 애드온으로 로봇 URDF/환경 업로드, 자산 기반 훈련 매개변수 구성, 체크포인트·메트릭·로그를 버전 관리와 연결
주요 결과
- 단일 GPU에서 수천 개의 로봇 인스턴스 병렬 실행 가능
- 수개월이 걸리던 학습이 몇 시간의 시뮬레이션으로 압축
- 빠른 반복 주기, 안전한 탐색, 재현성 및 확장성 확보; 훈련 출력물은 체크포인트, 메트릭, 구성 파일, 로그로 체계적으로 정리


