신한카드, 온톨로지와 소형언어모델로 고효율 AI 챗봇 구축하기

핵심 요약

신한카드와 AWS GenAIIC의 협업으로 온톨로지 기반 인텐트 분류, 분산형 에이전트 AI, AI-to-AI 자율 업데이트를 도입해 소형 모델(Qwen3 32B)로도 5초 이내 응답과 높은 정확도를 달성한 사례를 소개합니다.

온톨로지 기반 인텐트 분류: Domain/Action/Tag로 구성된 인텐트 맵 활용, Qwen3 32B로 핵심 속성 추출, 그래프 매칭으로 최종 인텐트 확정
분산형 Agentic AI: 모든 에이전트가 “관련 있음” 여부를 이진 분류로 판단하고 병렬로 처리
자율적 시스템 업데이트 (Tikitaka): Stage 1 멀티턴 대화 시뮬레이션, Stage 2 실패 진단, Stage 3 AI 제안/적용, Stage 4 자율 배포 및 모니터링
아키텍처 및 운영: Router Agent(Bedrock 기반 속성 추론) → 전문 에이전트(SLLM) → 백엔드 데이터 접근(MCP, Lambda, DynamoDB) → 최종 응답(Bedrock)

온톨로지 기반 인텐트 분류: Domain/Action/Tag로 구성된 인텐트 맵 활용, Qwen3 32B로 핵심 속성 추출, 그래프 매칭으로 최종 인텐트 확정
분산형 Agentic AI: 모든 에이전트가 “관련 있음” 여부를 이진 분류로 판단하고 병렬로 처리
자율적 시스템 업데이트 (Tikitaka): Stage 1 멀티턴 대화 시뮬레이션, Stage 2 실패 진단, Stage 3 AI 제안/적용, Stage 4 자율 배포 및 모니터링
아키텍처 및 운영: Router Agent(Bedrock 기반 속성 추론) → 전문 에이전트(SLLM) → 백엔드 데이터 접근(MCP, Lambda, DynamoDB) → 최종 응답(Bedrock)