핵심 요약
여기어때가 Word2Vec 기반 연관 키워드 추천 시스템을 구축하고, 초기화 문제를 해결해 지역적·맥락적 타당성을 갖춘 추천을 구현했습니다.
구현 방법
- Word2Vec으로 연관 키워드 후보 확장 및 코사인 유사도 기반 추천 생성
- 데이터 정규화(동의어 통일) 및 사전 데이터 활용으로 입력 품질 향상
- Step 1: Word2Vec 학습으로 후보 생성, Step 2: Co-occurrence Filtering으로 실제 동시 등장 검증
- 하이브리드 파이프라인으로 롱테일 키워드 반영 및 초기화 노이즈 제거
주요 결과
- 지역적·맥락적 타당성을 갖춘 키워드가 상위에 랭크되도록 개선
- 초기화로 인한 노이즈 제거 및 학습 안정성 향상
- 데이터 기반 연관 키워드 추천의 효율성 증가
