핵심 요약
여기어때가 팀의 코드 스타일 학습과 자동 코드 리뷰/테스트 코드 생성을 위한 RAG와 Vector DB 기반 솔루션을 공개했다.
구현 방법
- ts-morph로 AST 기반 청킹: 함수/클래스 단위로 분리, 긴 함수는 재귀로 세분화
- Gemini embedding(gemini-embedding-001, 768차원)으로 코드 벡터화 후 ChromaDB에 저장
- 500개 단위 배치 처리로 대규모 임베딩 속도 대폭 향상
- CI/CD의 update-embedding 파이프라인으로 변경사항 자동 반영
- Diffy, @pwb/testgen, 기획 문서 검색 기능 구현
주요 결과
- 10,000개 청크 처리 시간 45분에서 8분으로 단축
- 코드 리뷰/테스트 코드 자동화로 생산성과 품질 개선
- Vector DB를 프로젝트별로 독립적으로 운영



