핵심 요약
NAVER D2가 Engineering Day 2026에서 발표한 세션으로, AI 에이전트가 코드를 자율적으로 실험하고 개선하는 루프를 구축해 스트리밍 QoE를 17% 개선한 사례를 소개합니다.
구현 방법
- Karpathy Agent Loop와 7가지 비타협 원칙으로 자율 루프를 구현해, 코드 수정-빌드-실험-판정의 순환을 스트리밍 파이프라인에 직접 적용했다.
- 9 Phase 계층적 검증과 Regression Guard로 실험 인프라를 구성하고, Context Rot 방지와 통계적 엄격성을 병행했다.
- 에이전트의 3중 기억 장치와 실험 인프라 맵으로 데이터 흐름의 재현성과 확장성을 확보했다.
주요 결과
- QoE를 17% 개선했고, 5시간의 수작업 대비 60시간의 AI 작업으로 12배의 레버리지를 확보했다.
- 7개 시나리오에서 전반적 개선을 달성했다.