핵심 요약
SK플래닛은 Trino를 도입해 전사 데이터 분석 및 조회 시스템을 구축하고, 실시간 데이터 전달 강화와 통합 조회 환경으로 데이터 활용성을 크게 향상시켰습니다.
구현 방법
- Trino를 전사 분석 엔진으로 사용하고, Trino Gateway로 HA를 구현
- 데이터 접근 제어 및 모니터링: Apache Ranger 연동, LDAP 기반 관리, QueryCache/Galleon으로 일관된 접근 제공
- 메타데이터 관리: MeDic 확장 및 Trino 메타스토어 구축으로 카탈로그 명 통일 및 7→5 데이터 입수 구조 단일화
주요 결과
- 소량 데이터(1천만 Rows 미만 텍스트)에서 Hive 대비 더 빠른 조회 성능 확인
- 7개에서 5개로 축소된 데이터 입수 구조로 실시간 조회 가능성 확대
- MeDic 확장으로 Trino 메타데이터 검색 및 활용성 개선

