Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

추측이 아닌 데이터로: 3개 서비스 27개 SLO와 54개 모니터를 설정하고 배포 자동화까지 구축한 2주의 집중 작업

무신사 favicon무신사·DevOps·
KubernetesSLOArgo CDAPM
2026년 02월 22일0

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

무신사 O4O 팀은 3개 서비스(sales-api, moss-api, mpos-api)에 27개 SLO와 54개 모니터를 설정하고, 배포 중 Error Budget을 자동으로 보호하는 시스템을 구축했습니다. 도입으로 배포 중 오탐 알림은 0건으로 감소했고, 비즈니스 실패는 즉시 탐지했습니다.

구현 방법

  • APM error 기반 측정으로 성공 여부 판단
  • 태그 기반으로 27개 SLO 관리 및 Datadog API 활용
  • 90일 데이터 분석에 기반한 임계값 설정
  • Burn Rate 알림 두 단계 구성(긴급/주의)
  • Python으로 SLO Correction 자동 생성/종료, ArgoCD Hooks로 CI/CD와 연동
  • AWS Secrets Manager로 API 키 보안 관리

주요 결과

  • 오탐 알림 0건, 실제 비즈니스 실패 즉시 탐지
  • 2주 집중 작업으로 27개 SLO + 54개 모니터 자동화 달성
  • 배포 시 Correction 자동 생성/종료로 휴먼 에러 0%에 가까운 운영 자동화

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
당근 피드시스템 안정성 향상기: 프로파일링부터 서킷 브레이커까지 섬네일
71%

당근 피드시스템 안정성 향상기: 프로파일링부터 서킷 브레이커까지

당근 favicon당근·2025년 09월 18일
무신사 쿠폰 시스템, DB 성능 64% 개선으로 기술 부채를 갚다 섬네일
70%

무신사 쿠폰 시스템, DB 성능 64% 개선으로 기술 부채를 갚다

무신사 favicon무신사·2025년 07월 27일
NOL QA, 한계를 넘다 — 24시간 일하는 신입사원 ‘Q-pid’ 채용 스토리 섬네일
69%

NOL QA, 한계를 넘다 — 24시간 일하는 신입사원 ‘Q-pid’ 채용 스토리

NOL faviconNOL·2025년 11월 21일