홈 인기 피드 모든 블로그 모든 태그

홈 인기 피드 모든 블로그 모든 태그

Career Agent 개발기 (5) : Langfuse와 Token 비용 최적화 섬네일

Career Agent 개발기 (5) : Langfuse와 Token 비용 최적화

잡코리아·AI/ML·

OpenAI Langfuse Prompt Caching Batch API Event Compaction

2026년 06월 16일0

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

잡코리아의 Career Agent 개발에서 Langfuse를 활용해 에이전트 관찰, 대화 메모리 관리, 응답 속도 최적화, 대량 배치 비용 절감을 이뤘습니다.

구현 방법

Langfuse로 모든 LLM 호출 추적, 입력/출력 기록, latency와 비용 측정으로 관찰성 확보.
문제 발견→Trace 확인→Instruction 수정→재배포의 디버깅 사이클을 반복.
프롬프트 캐싱으로 시스템 프롬프트/툴 정의를 캐시해 입력 토큰 비용 50%, 지연 80% 감소.
이벤트 압축으로 대화 히스토리 토큰 수를 감소하고, Batch API로 대량 작업 비용을 50% 절감(배치당 최대 50,000건).

주요 결과

Tool Description 품질 향상으로 Tool Selection 오류 80% 감소.
토큰 사용 최적화와 응답 속도 개선, 배치 API 도입으로 비용 절감 50%.
배치당 최대 50,000건 처리 가능.

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!

Career Agent 개발기 (3) : Tool Calling 섬네일

Career Agent 개발기 (3) : Tool Calling

잡코리아·2026년 05월 20일

Career Agent 개발기 (2) : Multi-Agent와 Prompt 작성 섬네일

Career Agent 개발기 (2) : Multi-Agent와 Prompt 작성

잡코리아·2026년 05월 13일

엔터프라이즈 AI 에이전트 성능 평가 가이드 \:\ 인포그랩 NEXA의 LLM-as-a-Judge 실전 적용 사례

인포그랩·2025년 09월 10일