홈 인기 피드 모든 블로그 모든 태그

홈 인기 피드 모든 블로그 모든 태그

점점 커지는 RDB Table, S3로 귀양 보내고 Athena로 불러오기 - feat. Optimization with Spark Bucketing 섬네일

점점 커지는 RDB Table, S3로 귀양 보내고 Athena로 불러오기 - feat. Optimization with Spark Bucketing

뱅크샐러드·Data·

2023년 06월 08일8

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

뱅크샐러드가 증가하는 이력 데이터를 MySQL에서 S3로 이관하고 Spark Bucketing으로 버킷화된 데이터만 Athena로 불러오도록 아키텍처를 최적화했습니다.

구현 방법

MySQL에서 S3로 데이터 이관 및 비용 효율화된 저장소 아키텍처 구성
Spark Bucketing으로 데이터 파티셔닝 설계
Athena로 버킷화된 데이터 조회를 위한 쿼리 설계

주요 결과

저렴한 저장소로 이관해 비용 구조를 단순화
필요한 데이터만 읽도록 설계해 조회 효율성 향상 가능성

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!

분석 데이터를 프로덕션에서 쉽게 사용할 수 없을까? 섬네일

분석 데이터를 프로덕션에서 쉽게 사용할 수 없을까?

뱅크샐러드·2023년 06월 07일

Spark on Kubernetes로 가자! 섬네일

Spark on Kubernetes로 가자!

뱅크샐러드·2023년 01월 05일

자비스앤빌런즈의 Amazon DynamoDB 도입기 – 외부 연계 데이터 저장과 약관 서비스 개선 섬네일

자비스앤빌런즈의 Amazon DynamoDB 도입기 – 외부 연계 데이터 저장과 약관 서비스 개선

AWS·2025년 10월 21일