핵심 요약
올리브영은 인시던트 관리 정책 수립과 CSP 정의, Slack 기반 공유 체계를 구축해 장애 대응의 신속성과 재발 방지 체계를 확립했습니다.
주요 경험
- Usecase 전체 작성으로 CSP 도입과 인시던트 레벨 정의를 확립해 대응 피로도를 감소
- Slack 알림 대상 정의 및 공유 체계 단일화로 신속한 커뮤니케이션 확보
- Datadog 알림 기반 발견 시 자동 채널 생성과 Slack으로 실시간 처리 기록 및 5 Why 분석 및 보고/리뷰 체계 구축
얻은 인사이트
- 사용자 관점의 대응이 재발 방지에 효과적임
- 부서 간 협의와 문서화로 재현성 높은 프로세스 형성



