핵심 요약
AWS가 OpenSearch Service의 듀얼 벡터 검색 도입과 성능 최적화를 통해 의미 기반과 시각적 스타일을 동시에 만족하는 검색 결과를 상위에 노출하도록 개선했습니다.
구현 방법
- 듀얼 벡터 쿼리: 시맨틱 벡터와 비주얼 벡터를 한 번의 쿼리에서 탐색(k=200 각)
- knn-filtering 적용: BM25 선필터로 후보군 초기 축소
- SigLIP 비주얼 벡터 후보군과 점수 보정으로 앙상블
- 다중 벡터 인덱스 매핑 및 off-heap 처리
- 인프라 개선: 메모리 최적화 인스턴스 + 노드 수 8→12로 확장
주요 결과
- 평균 레이턴시 107ms→13ms로 약 88% 감소
- 채택률 43.80%→52.82%로 +9.02pp 증가
- Read IOPS AVG 4,040→4,490(+11%), MAX 4,760→6,300(+32%)
- 메모리 확대로 OS 페이지 캐시 여유 확보, 배치 세그먼트 병합 영향 감소
- 2.19에서 세그먼트 병합 문제 남아 있으며 3.3 업그레이드가 다음 글에서 다룸



