핵심 요약
AWS가 EC2 F2 인스턴스 기반 AFI형 LPU를 클라우드에 구축해 LPU 추론 서비스를 구현하고 PoC 운영과 비용 효율성을 크게 개선했습니다.
구현 방법
- AMD Virtex UltraScale+ HBM VU47P FPGA를 탑재한 F2 인스턴스 구성
- FPGA Developer AMI와 AWS HDK로 LPU 아키텍처 재구성 및 AFI 패키징
- AWS Marketplace의 AMI + HyperDex Toolchain + vLLM 런타임으로 일관된 환경 제공
- AWS SDK 기반 API로 FPGA 접근 및 런타임 통합
주요 결과
- PoC 구축 시간 약 90% 단축, 약 15분 내 LPU 환경 가동
- GPU 대비 추론 비용 최대 70% 절감(예: p5.4xlarge 6.88$/h vs f2.6xlarge 1.98$/h)
- 보안성과 운영 안정성 향상, 물리 장비 관리 제거
- 일관된 실행 환경으로 LPU-as-a-Service 확대 기반 마련


