홈 인기 피드 모든 블로그 모든 태그

홈 인기 피드 모든 블로그 모든 태그

옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법

여기어때·DevOps·

Kubernetes Grafana Loki OpenTelemetry Mimir

2026년 04월 23일0

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

여기어때가 Right-Sizing으로 Kubernetes 리소스 기준을 정의하고, P95 기반 분석과 컴포넌트별 버퍼 정책으로 Observability 인프라의 자원을 합리화했습니다.

구현 방법

관측 인프라 LGTM 스택(Loki/Mimir/Tempo)으로 다수 서비스의 메트릭을 수집 관리
지표로 container_memory_working_set_bytes, container_cpu_usage_seconds_total, kube_pod_container_resource_requests를 지속적 적재
데이터 계측 기간 1주, 샘플링 간격 5분
P95 기반으로 적정 리퀘스트를 역산하고 목표 사용률 70~80%로 버퍼를 컴포넌트별 차등 적용
쿼리 예시: Memory P95 대비 Request 비율, CPU 사용률과 Throttling 연계 분석
적용 우선순위: Stateless → Stateful 읽기 → Stateful 쓰기 → 버스트

주요 결과

리소스 절감 및 가용성 확보, OOMKill/Throttling 증가 없이 안정적으로 운영

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!

당근 피드시스템 안정성 향상기: 프로파일링부터 서킷 브레이커까지 섬네일

당근 피드시스템 안정성 향상기: 프로파일링부터 서킷 브레이커까지

당근·2025년 09월 18일

우아한 Cloud FinOps 여정

우아한형제들·2025년 09월 26일

StarRocks 운영기: Resource Group으로 멀티테넌트 워크로드 격리하기 섬네일

StarRocks 운영기: Resource Group으로 멀티테넌트 워크로드 격리하기

토스·2026년 04월 23일