홈 인기 피드 모든 블로그 모든 태그

홈 인기 피드 모든 블로그 모든 태그

Aurora PostgreSQL에서 한국어 하이브리드 검색 구현하기: pg_bigm + pgvector로 만드는 한국어 특화 RAG 섬네일

Aurora PostgreSQL에서 한국어 하이브리드 검색 구현하기: pg_bigm + pgvector로 만드는 한국어 특화 RAG

PostgreSQL HNSW PgBigm PgVector RRF

2026년 05월 13일0

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

AWS가 Aurora PostgreSQL에서 pg_bigm과 pgvector를 결합한 한국어 하이브리드 검색으로 RAG 성능을 개선한 사례를 다룹니다.

구현 방법

데이터 수집/임베딩: S3에 저장, Lambda/ECS로 청킹, Amazon Bedrock Titan Embeddings V2로 1024차원 벡터 생성, 원문과 임베딩을 Aurora에 저장하고 pg_bigm(GIN)과 pgvector(HNSW) 인덱스 구성
검색 흐름: 질의에서 키워드 추출은 pg_bigm로, 전체 질의는 Bedrock Titan 임베딩으로 변환해 pgvector 시맨틱 검색, 두 결과를 RRF로 결합
응답 생성: 컨텍스트를 바탕으로 Bedrock Claude로 한국어 답변 생성

주요 결과

100,000건 테스트에서 pg_bigm이 더 많은 문서를 찾았고, 하이브리드가 특정 쿼리의 관련성 순위를 높임

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!

우리 팀 코드 스타일을 아는 AI 만들기: RAG와 Vector DB 활용기 섬네일

우리 팀 코드 스타일을 아는 AI 만들기: RAG와 Vector DB 활용기

여기어때·2025년 11월 05일

기존 개발 코드(Java)로 Amazon Neptune Analytics GraphRAG 구현하기 섬네일

기존 개발 코드(Java)로 Amazon Neptune Analytics GraphRAG 구현하기

AWS·2026년 04월 01일

“검색으로 연결되는 재능” — 하이브리드 검색 적용기 섬네일

“검색으로 연결되는 재능” — 하이브리드 검색 적용기

크몽·2025년 09월 01일