핵심 요약
NOL의 결제 서비스 운영에서 다중 PG 분배, 결제 수단 비활성화, 공지 관리로 가용성과 고객 경험을 개선했고, Kafka-Logstash-ES-Kibana 기반의 이벤트 파이프라인으로 흐름 가시성과 Slack 알림으로 신속 대응 체계를 확보했습니다.
주요 경험
- 15개 PG 분배를 Admin으로 조정하고 장애 시 즉시 분배율을 0%로 전환
- 결제 수단 비활성화와 예약 공지로 노출되는 결제 수단 제어
- Kafka 기반 이벤트 파이프라인으로 결제 흐름 가시화 및 Slack 알림 도입
얻은 인사이트
- 정책 중심 설계가 결제 실패 확률 감소에 기여
- 임계값은 운영 환경에 맞춰 점진 조정 필요
- 이벤트 기반 모니터링과 알림으로 신속 대응 가능



