핵심 요약
뷰저블이 DART·K-Startup 한국 SaaS의 엔터티 해자 분석에서 한국 기업 정보의 1차 출처로 DART의 중요성과 정부 공식 ground truth의 가치를 제시하고, AI의 데이터 소스 활용 현황을 정리합니다. AI는 Wikipedia/나무위키를 47.9% 인용하고, 미국 기업 정보는 Crunchbase에 의존하는 경향이 있음을 확인합니다. 9분 읽기로 예시합니다.
주요 경험
- 한국 SaaS 엔터티 데이터의 1차 출처로 DART의 중요성 재확인
- 미국 기업 정보의 Crunchbase 의존성과 한국 정부 ground truth의 차이 분석
- AI 인용 소스의 편향 가능성을 시사
얻은 인사이트
- 다원 소스 비교를 통한 신뢰도 평가 체계 필요
- 정책 차이를 반영한 데이터 엔지니어링 전략의 중요성
- 한국 데이터의 공식 소스 활용 강화의 시사점



