핵심 요약
올리브영이 Datadog을 POS/ SCO 환경에 도입해 폐쇄망-공개망 프록시 구조로 실시간 로그 수집과 모니터링 체계를 구축하고, 약 3,000대 규모의 단말에서 운영 안정성과 장애 탐지 속도를 대폭 개선했습니다.
구현 방법
- 프록시 서버를 통한 폐쇄망(POS) → Datadog 공개망 연결 구조 설계
- 로그 포맷을 JSON으로 표준화하고, 이벤트/오류 로그 중심으로 선별 수집
- Datadog Agent 자동 설치 스크립트 및 원격 관리로 전국 3,000대 규모 설치 완료 및 매장별 식별(Host) 구성
주요 결과
- 문제 탐지 시간 4분 30초에서 59초로 단축(약 76% 감소)
- CPU 평균 0.5%, 메모리 120MB로 안정적 로그 수집 확보
- 월간 선제 조치 3건 이상 및 부서 간 실시간 대시보드로 협업 강화



