핵심 요약
하이퍼커넥트는 아이템 속성 중 대표 속성을 예측하는 ML 문제로 정의하고, confounder를 제거하기 위해 랜덤화(RCT) 데이터와 속성 셔플 오프라인 평가를 활용해 비즈니스 임팩트를 검증했습니다.
구현 방법
- 쌍(pairwise) 학습으로 속성 간 전환율 비교, score 차이로 확률을 예측하는 f_theta(A) 모델 사용
- 아이템 내 속성 간 모든 조합(NC2)을 샘플링하고 같은 아이템의 비교로 분포를 동질화
- 랜덤화 기반 데이터 수집과 오프라인 평가로 mean CR lift를 비즈니스 지표로 활용
주요 결과
- 오프라인 평가에서 mean CR lift가 기존 방법 대비 최상으로 나타남
- 온라인 A/B 테스트에서도 전환율 상승이 확인되어 배포 가능성 시사
