Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그
Career Agent 개발기 (5) : Langfuse와 Token 비용 최적화 섬네일

Career Agent 개발기 (5) : Langfuse와 Token 비용 최적화

잡코리아 favicon잡코리아·AI/ML·
OpenAILangfusePrompt CachingBatch APIEvent Compaction
2026년 06월 16일0

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

잡코리아의 Career Agent 개발에서 Langfuse를 활용해 에이전트 관찰, 대화 메모리 관리, 응답 속도 최적화, 대량 배치 비용 절감을 이뤘습니다.

구현 방법

  • Langfuse로 모든 LLM 호출 추적, 입력/출력 기록, latency와 비용 측정으로 관찰성 확보.
  • 문제 발견→Trace 확인→Instruction 수정→재배포의 디버깅 사이클을 반복.
  • 프롬프트 캐싱으로 시스템 프롬프트/툴 정의를 캐시해 입력 토큰 비용 50%, 지연 80% 감소.
  • 이벤트 압축으로 대화 히스토리 토큰 수를 감소하고, Batch API로 대량 작업 비용을 50% 절감(배치당 최대 50,000건).

주요 결과

  • Tool Description 품질 향상으로 Tool Selection 오류 80% 감소.
  • 토큰 사용 최적화와 응답 속도 개선, 배치 API 도입으로 비용 절감 50%.
  • 배치당 최대 50,000건 처리 가능.

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
Career Agent 개발기 (3) : Tool Calling 섬네일
77%

Career Agent 개발기 (3) : Tool Calling

잡코리아 favicon잡코리아·2026년 05월 20일
Career Agent 개발기 (2) : Multi-Agent와 Prompt 작성 섬네일
76%

Career Agent 개발기 (2) : Multi-Agent와 Prompt 작성

잡코리아 favicon잡코리아·2026년 05월 13일
No Image
76%

엔터프라이즈 AI 에이전트 성능 평가 가이드 \:\ 인포그랩 NEXA의 LLM-as-a-Judge 실전 적용 사례

인포그랩 favicon인포그랩·2025년 09월 10일