핵심 요약
AWS가 Aurora PostgreSQL에서 pg_bigm과 pgvector를 결합한 한국어 하이브리드 검색으로 RAG 성능을 개선한 사례를 다룹니다.
구현 방법
- 데이터 수집/임베딩: S3에 저장, Lambda/ECS로 청킹, Amazon Bedrock Titan Embeddings V2로 1024차원 벡터 생성, 원문과 임베딩을 Aurora에 저장하고 pg_bigm(GIN)과 pgvector(HNSW) 인덱스 구성
- 검색 흐름: 질의에서 키워드 추출은 pg_bigm로, 전체 질의는 Bedrock Titan 임베딩으로 변환해 pgvector 시맨틱 검색, 두 결과를 RRF로 결합
- 응답 생성: 컨텍스트를 바탕으로 Bedrock Claude로 한국어 답변 생성
주요 결과
- 100,000건 테스트에서 pg_bigm이 더 많은 문서를 찾았고, 하이브리드가 특정 쿼리의 관련성 순위를 높임


