핵심 요약
신한카드와 AWS GenAIIC의 협업으로 온톨로지 기반 인텐트 분류, 분산형 에이전트 AI, AI-to-AI 자율 업데이트를 도입해 소형 모델(Qwen3 32B)로도 5초 이내 응답과 높은 정확도를 달성한 사례를 소개합니다.
구현 방법
- 온톨로지 기반 인텐트 분류: Domain/Action/Tag로 구성된 인텐트 맵 활용, Qwen3 32B로 핵심 속성 추출, 그래프 매칭으로 최종 인텐트 확정
- 분산형 Agentic AI: 모든 에이전트가 “관련 있음” 여부를 이진 분류로 판단하고 병렬로 처리
- 자율적 시스템 업데이트 (Tikitaka): Stage 1 멀티턴 대화 시뮬레이션, Stage 2 실패 진단, Stage 3 AI 제안/적용, Stage 4 자율 배포 및 모니터링
- 아키텍처 및 운영: Router Agent(Bedrock 기반 속성 추론) → 전문 에이전트(SLLM) → 백엔드 데이터 접근(MCP, Lambda, DynamoDB) → 최종 응답(Bedrock)
주요 결과
- 정확도 개선: Qwen3 32B 베이스라인 84.2%→91.0% (+6.8%), Qwen3 235B은 77.4%→88.7% (+11.3%)
- 토픽 전환 정확도: 약 98% 달성
- 응답 지연: 5초 이내 달성(병렬 처리로 개선)
- 비용 절감: Claude Opus 4.5 대비 약 18배 감소
- 활용 유스케이스: 카드 한도 관리, 이용 내역 조회
- 향후 확장: 51개 인텐트 도메인 확장, 보안 가드레일 적용, 2026년 상용 배포 목표(Chatbot 0.3)



