핵심 요약
AWS가 포스코DX의 엔지니어링 암묵지를 AI 지식 자산으로 전환하는 PoC를 9단계 엔드-투-엔드 파이프라인으로 구현해, 53개 엔티티와 91개 관계의 시간적 지식 그래프를 구축하고 벡터+그래프 하이브리드 검색으로 60초 내 Q&A를 가능하게 했습니다.
구현 방법
- 문서 수집/추출: 14종 포맷, VLM OCR, 민감정보 2단계 제거
- 지식 그래프 구축: 5대 UDK 유형 자동 분류, 엔티티/관계 JSON 추출
- Graphiti+Neo4j로 엔티티 해소, 시간축 및 출처 추적
- 검색/활용: 벡터+그래프+BM25 병렬, RRF 융합, Claude로 Q&A(출처 인용)
- 인프라: AWS Bedrock·CDK 기반 9스택
주요 결과
- 35개 규칙 중 28개(약 80%)가 AI 학습 미확인, UDK 분류 필요
- PoC에서 엔티티 53개, 관계 91개(20종 관계 타입) 자동 추출
- 엔드-투-엔드 처리 약 60초로 Q&A 가능
- 변경 영향도 파악 및 추적 용이한 그래프 기반 분석 제공



