핵심 요약
당근이 장기 유저 임베딩 도입과 RCBS 적용으로 홈피드·광고 랭킹의 성능과 지표를 개선한 경험을 공유합니다.
주요 경험
- 오프라인에서 유저 인코더를 두-타워 구조로 학습하고 다운스트림 피처로 재사용하는 구조를 도입했습니다.
- 콘텐츠 임베딩 도입으로 Cold 아이템 문제를 완화하고 GPU 메모리 제약을 크게 해소했습니다.
- RCBS로 같은 지역 유저로 배치를 묶어 impossible negatives를 98%에서 30%로 줄였고, RCBS-Train(fine)에서 Recall@10이 +49%, RCBS-Eval(fine)에서 +70% 개선했습니다.
얻은 인사이트
- 도메인에 맞춘 배치 설계와 콘텐츠 임베딩 조합이 학습 신호를 강화합니다.
- 추론 주기 최적화와 엔지니어링 과제가 온라인 성능 개선에 중요합니다.
- 향후 유저 임베딩 추론 주기를 단축하는 것이 핵심 과제로 남아 있습니다.

