핵심 요약
딜라이트룸이 DARO 데이터 환경 구축에서 S3 기반 데이터 레이크와 Athena를 중심으로 아키텍처를 설계하고, Airflow와 DBT로 파이프라인을 오케스트레이션하며 클로드 코드의 skill로 자동화를 구현해 운영 효율성과 확장성을 높인 사례를 공유합니다.
구현 방법
- S3 기반 데이터 레이크 위에 Athena를 활용하는 데이터 접근 구조 수립
- SDK/SSP/CPS 등 다양한 소스로 수집된 데이터를 S3에 저장하고 Athena로 조회하는 구조 구성
- Airflow와 DBT로 파이프라인 오케스트레이션 적용
- 클로드 코드의 skill 기능으로 소스 연결 및 데이터 테이블 생성 등의 반복 작업 자동화
- 데이터 거버넌스 문서화를 Notion MCP로 자동화하고 노션 페이지 템플릿으로 관리
- DEV/PROD 환경에서 소스 테이블 연결 및 검증을 포함한 end-to-end 워크플로우 구축
주요 결과
- 대규모 소스 연결 작업을 자동화하는 기반 스킬 도입으로 반복 작업의 효율성 향상
- Notion 기반 마트 문서 자동 초안 생성으로 약 80% 수준의 완성도 확보
- 데이터 거버넌스 정책의 문서화 및 아카이빙으로 협업 효율성 증가
- 50개가 넘는 소스의 연결 정의 자동 생성 및 검증으로 데이터 흐름의 안정성 강화


