홈 인기 피드 모든 블로그 모든 태그

홈 인기 피드 모든 블로그 모든 태그

T4 GPU 1장으로 일궈낸 올리브영의 Gemma 3 기반 sLLM 구축기 섬네일

T4 GPU 1장으로 일궈낸 올리브영의 Gemma 3 기반 sLLM 구축기

올리브영·AI/ML·

LoRA QLoRA sLLM Gemma SFT

2026년 01월 21일6

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

올리브영이 Gemma3-4B-IT 기반의 sLLM을 SFT로 도메인 적응하고 텍스트 입력만으로 동작하도록 최적화해, 16GB GPU 환경에서 리뷰 테마 표현을 안정적으로 생성하도록 서비스에 도입했다.

구현 방법

Gemma3-4B-IT를 기반으로 도메인 특화 SFT 수행
텍스트 전용 로딩으로 비전 타워 제거, LoRA+QLoRA 및 4비트 양자화로 VRAM 절감
프롬프트 축약으로 토큰 비용 대폭 감소 및 배치 처리 속도 향상(528자 → 98자, 약 81% 축약)

주요 결과

배치 16에서 구현 속도 약 0.6초 확보
프롬프트 단축으로 비용 약 81% 절감 및 처리량 약 5.3배 증가
상용 LLM 대비 약간의 정확도 손실(약 5%p 이내)에도 운영 비용과 속도 측면에서 서비스에 적합한 품질 확보
재현성 및 버전 관리 강화, Human-in-the-Loop 검수로 품질 신뢰성 확보

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!

2조 토큰을 카테고리 분류에 쓰면서 알게된 것들

당근·2026년 02월 27일

서버 0대, 브라우저 SLM으로 만든 차트 추천 봇 섬네일

서버 0대, 브라우저 SLM으로 만든 차트 추천 봇

미리디·2026년 05월 22일

Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용한 농약 제품 이미지 인식 시스템 구축기 섬네일

Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용한 농약 제품 이미지 인식 시스템 구축기

AWS·2026년 06월 11일