핵심 요약
AWS와 현대오토에버가 LangGraph 기반의 다중 에이전트 오케스트레이션 ErrorWatcher를 구축해 장애 대응 MTTR을 수 시간에서 5분으로 단축했다.
구현 방법
- LangGraph on AWS Lambda로 에이전트 간 상태 공유 및 순차 실행 제어
- Claude(Bedrock) 기반 LLMS와 KB의 RAG로 원인 분석 및 해결책 제시
- 4에이전트가 협력하는 워크플로우 구성 및 메타데이터 필터링으로 검색 정확도 향상
주요 결과
- MTTR를 수 시간에서 5분으로 단축
- HIGH 신뢰도 보고서를 learned-cases에 저장하는 지식 자산화
- 확장성 강화 및 향후 예방 모니터링/ITSM 연계 계획



