핵심 요약
구글은 Rapid Storage를 PyTorch에 직접 연결하는 고성능 통합을 도입해 학습 병목을 제거했고, Colossus 아키텍처와 양방향 gRPC 스트리밍을 활용해 최대 15 TiB/s의 총 처리량과 지연을 대폭 감소시켰으며, 스토리지 버킷 타입 업데이트 외에는 코드 변경이 필요 없는 상태로 전체 학습 시간을 23% 단축했습니다.
구현 방법
- fsspec 인터페이스를 활용해 Rapid Storage를 PyTorch에 직접 연결하는 통합 구현
- Google Colossus 아키텍처와 양방향 gRPC 스트리밍 도입으로 대역폭 증가 및 지연 감소
- 코드 변경 없이 저장소 버킷 타입 업데이트만으로 성능 개선 달성
주요 결과
- 최대 15 TiB/s의 총 처리량과 지연 시간 대폭 감소
- 전체 학습 시간 23% 단축
- 코드 변경 없이 저장소 버킷 타입 업데이트만으로 구현



