Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

오픈소스 Trino를 활용한 전사 데이터 분석 시스템 구축기

SK플래닛 faviconSK플래닛·Architecture·
KubernetesKafkaHadoopTrinoHive
2024년 09월 23일3

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

SK플래닛은 Trino를 도입해 전사 데이터 분석 및 조회 시스템을 구축하고, 실시간 데이터 전달 강화와 통합 조회 환경으로 데이터 활용성을 크게 향상시켰습니다.

구현 방법

  • Trino를 전사 분석 엔진으로 사용하고, Trino Gateway로 HA를 구현
  • 데이터 접근 제어 및 모니터링: Apache Ranger 연동, LDAP 기반 관리, QueryCache/Galleon으로 일관된 접근 제공
  • 메타데이터 관리: MeDic 확장 및 Trino 메타스토어 구축으로 카탈로그 명 통일 및 7→5 데이터 입수 구조 단일화

주요 결과

  • 소량 데이터(1천만 Rows 미만 텍스트)에서 Hive 대비 더 빠른 조회 성능 확인
  • 7개에서 5개로 축소된 데이터 입수 구조로 실시간 조회 가능성 확대
  • MeDic 확장으로 Trino 메타데이터 검색 및 활용성 개선

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
Trino로 타임아웃 개선하기 섬네일
76%

Trino로 타임아웃 개선하기

NHN Cloud faviconNHN Cloud·2025년 03월 04일
Trino resource optimize on YARN 섬네일
75%

Trino resource optimize on YARN

Naver Place faviconNaver Place·2024년 11월 26일
No Image
72%

실시간 파생 데이터 생성 : Kafka + Spark로 하루를 앞당기다

SK플래닛 faviconSK플래닛·2024년 10월 23일