Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

Chat DIC 프로젝트에서 AWS Bedrock Prompt Caching으로 성능 최적화하기

SK플래닛 faviconSK플래닛·Cloud·
AWS BedrockPrompt CachingCache CheckpointLatencyToken Cost
2025년 10월 17일4

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

SK플래닛의 Chat DIC 프로젝트가 AWS Bedrock Prompt Caching으로 시스템/도구 프롬프트의 재계산을 줄이고 응답 지연 및 토큰 비용을 절감한 사례를 다룹니다.

구현 방법

  • System Prompt Caching: system, tools 프롬프트를 캐시에 저장해 재계산 방지
  • Tools Prompt Caching: tools에 캐시포인트를 추가하고, 메시지는 캐시 제외
  • TTL/토큰: TTL 5분, 최소 1,024 tokens 필요
  • 체크포인트: 모델별 최대 4개
  • API/기능: Converse/ConverseStream, InvokeModel/InvokeModelWithResponseStream, Cross-region Inference 지원
  • 관리: Console 및 API에서 프롬프트 캐싱 설정 가능

주요 결과

  • 시스템/도구 프롬프트 캐시로 재계산 감소, 응답 지연 및 토큰 비용 절감 기대
  • Throttling 완화 및 프롬프트 관리 유연성 증가
  • 메시지 프롬프트는 캐시 대상에서 제외

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
No Image
95%

Chat DIC 프로젝트에서 AWS Bedrock Prompt Caching으로 성능 최적화하기

SK플래닛 faviconSK플래닛·2025년 10월 17일
No Image
75%

Prompt caching 101

OpenAI Developers faviconOpenAI Developers·2025년 07월 21일
무형상품 서비스에 캐시 적용하기 섬네일
69%

무형상품 서비스에 캐시 적용하기

올리브영 favicon올리브영·2022년 12월 08일