Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

인프런이 자동으로 자막을 생성하기까지 (AI/인프라 편)

인프랩 favicon인프랩·DevOps·
PythonGPUAWS BatchWhisperWhisperX
2023년 10월 31일0

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

인프랩이 오프라인에서도 작동하는 자막 생성 파이프라인을 구축하고 WhisperX + g5.xlarge를 활용해 28분 영상의 자막 전사를 59초에 완료하는 성과를 얻었습니다.

구현 방법

  • 오프라인 자막 파이프라인 구성: ffmpeg로 WAV 추출 → whisperX(large-v2)로 전사 → srt 저장
  • 음절 단위 타임라인 기반 줄 구성 및 가독성 개선 로직 구현: WhisperX 시간 추적 및 줄 재구성 규칙 적용
  • GPU 기반 비용 최적화 및 운영 자동화: AWS Batch + Spot 인스턴스 활용, Go로 배치 생명주기 관리, IaC 구성

주요 결과

  • 28분 영상 자막 59초에 전사하여 속도 대폭 향상
  • 자막 일괄 생성 비용 약 807.22달러로 대규모 처리 비용 대폭 절감
  • 가독성 개선 및 자막 수정 요청 관리 기능 시연
  • 2개월 간의 인프라/배포 개선으로 프로덕션 출시 가능 수준 확보

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
보이저엑스의 ComfyUI 워크플로우 기반 AI 비디오 생성 파이프라인 구축 여정 섬네일
69%

보이저엑스의 ComfyUI 워크플로우 기반 AI 비디오 생성 파이프라인 구축 여정

AWS faviconAWS·2025년 11월 11일
ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유 섬네일
66%

ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유

Naver Place faviconNaver Place·2023년 07월 13일
No Image
66%

Video Invisible Watermarking at Scale

메타 (Engineering) favicon메타 (Engineering)·2025년 11월 04일