홈 인기 피드 모든 블로그 모든 태그

홈 인기 피드 모든 블로그 모든 태그

우리는 달에 가기로 했습니다. - Hybrid인프라부터 네트워크 최적화까지, 무신사 AI Infra구축기

무신사·Architecture·

AWS Kubernetes OpenTelemetry eBPF Gateway API

2025년 12월 15일1

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

무신사는 온프렘 GPU와 AWS를 결합한 하이브리드 AI 인프라를 구축해 비용 절감과 확장성을 확보하는 여정에서 AutoMode, Karpenter, eBPF 기반 Cilium, NLB 전환, OpenTelemetry 관측, Gateway API 기반 Inference Extension 등을 도입해 운영의 안정성과 관측성을 확보했습니다.

구현 방법

On-Prem GPU(H100/H200/Blackwell)와 AWS를 하나의 쿠버네티스 클러스터처럼 연결
AutoMode + Hybrid Node를 시작으로 Self-managed Karpenter 도입으로 확장성 확보
네트워크/관측: eBPF(Cilium)로 CNI 교체 및 OpenTelemetry로 로그/메트릭/트레이스 수집
Inference 확장: Gateway API Inference Extension 도입 및 Priority 기반 라우팅 설계
로드밸런싱: ALB에서 NLB로 전환하여 안정성과 예측 가능한 지연 달성

주요 결과

비용 절감 최대 95% 달성
트래픽 급증에도 안정적인 운용 및 지연 관리 체계 확보

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!

우리는 달에 가기로 했습니다. - Hybrid인프라부터 네트워크 최적화까지, 무신사 AI Infra구축기

무신사·2025년 12월 15일

왓챠 추천 서비스 MLOps 적용기 Part1 섬네일

왓챠 추천 서비스 MLOps 적용기 Part1

왓챠·2024년 02월 28일

우리 팀엔 자바스크립트 상차만 하는 프런트엔드가 있었다

우아한형제들·2025년 11월 20일