핵심 요약
AWS가 DevOps Agent와 Kubernetes Operator를 활용해 EKS에서 장애를 자동으로 감지하고 조사를 트리거하는 end-to-end 인시던트 대응 파이프라인을 구축했습니다.
구현 방법
- DevOps Agent의 Agent Space 구성 및 Generic Webhook(HMAC-SHA256) 설정, GitHub 연동
- DevOps Agent Operator 배포: IAM 정책/역할 연결, Pod Identity 구성, Webhook 시그니처 보안 확보
- Slack 연동 및 Webhook Secret 관리로 실시간 알림 및 자동 조사 트리거 완결
주요 결과
- 장애 발생 시 자동으로 조사 파이프라인이 시작되는 엔드-투-엔드 자동화 구현
- 외부 솔루션 연동 및 컨텍스트 수집(로그/이벤트/노드 정보) 흐름의 신뢰성 확보


