최신 피드를 AI 요약으로 빠르게 확인하세요
네이버 D2가 발표한 MLXP를 통해 Kubernetes 기반 LLM 서빙의 성능 최적화 기술 도입 사례를 소개합니다. KV Cache 인지 라우팅, Prefix Cache, 분산 멀티노드 서빙 같은 기술을 프로덕션에 적용하고 Istio 서비스 메시와 스케줄러, Pod 정책 간의 충돌을 진단해 해결한 경험을 공유합니다. 목표 독자는 LLM 서빙 인프라를 구축·운영하는 플랫폼 엔지니어 및 MLOps 팀으로, Kubernetes 위에서의 실전 구성과 문제 해결 인사이트를 제공합니다.

AWS는 Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용해 농약 제품 이미지를 식별하는 시스템 구축 사례를 공유합니다. Stage1에서 Vision LLM이 정보를 추출하고 TypoCorrector가 OCR 오타를 보정하며, Stage2의 계층적 매칭으로 후보를 추려 Stage3에서 Reranker가 최종 순위를 매깁니다. 4,000종의 제품명과 200여 제조사를 캐시하고, 30개 후보를 OpenSearch로 추출한 뒤 Reranker로 재정렬하는 다중 보완 구조로 실용적 응답 속도와 재현율을 확보합니다.

당근의 디자인시스템 SEED를 중심으로, AI 시대에 디자인시스템이 맥락과 의사결정을 돕는 시스템으로 확장하는 흐름을 설명합니다. AI 도구가 UI 하한선을 끌어올리더라도 최종 선택은 팀의 맥락과 기준으로 좁혀져야 하며, 패턴 문서와 의사결정 기록의 구축이 핵심이라고 강조합니다. SEED는 고급 UX 패턴 정리, 토큰 의미의 명시, AI가 읽을 수 있는 컨텍스트 파일 마련 등 구체적 실행 방향과 패턴 기반의 의사결정 지원을 제시합니다.
![[22. 10. 13] 에이아이트릭스, 인도네시아 발리에서 열린 HIMSS APAC 참가 섬네일](https://miro.medium.com/v2/resize:fit:1200/1*7Gi8l42y-qL5_cjq2lcCJg.png)
에이아이트릭스가 발리에서 열린 HIMSS APAC에 처음 참가해 부스를 중앙 부근에 배치하고 다수의 방문객을 성공적으로 유치했습니다. VitalCare 데모와 KOL 및 글로벌 기업 교류를 목표로 부스 운영을 달성했고, 동남아시아 의료진의 방문과 도입 문의를 확인했습니다. 한국 병원의 사례 발표가 주목받았고, 내년에도 인도네시아의 전자의무기록 도입 확대 가능성과 APAC 전시의 기회가 강조되었습니다.
![[22. 10. 20] FDA 가이던스 ‘Computer Software Assurance for Production and Quality System Software’ 분석 섬네일](https://miro.medium.com/v2/resize:fit:1200/1*K6R-FZekXgHAJGXVfg7qPg.png)
에이아이트릭스가 FDA의 초안 가이드라인 'Computer Software Assurance for Production and Quality System Software'를 분석해 생산 및 품질 시스템 소프트웨어의 보증 프레임워크를 정리합니다. 주요 내용으로 Intended Use 식별, 위험 기반 접근법, 보증 활동의 선정 및 기록 작성 등 A-D 단계와 예시를 제시하고 ISO 13485:2016 및 ISO/TR 80002-2의 시사점을 다룹니다. 또한 앞으로의 규제 동향 모니터링과 SaMD 적용 현장에 바로 활용할 수 있는 구체 가이드라인을 제공할 예정입니다.
![[슈퍼브 인사이트] AI로 같은 결과, 토큰은 10배 적게 쓰는 법(품질 손해 1도 없이요👀 섬네일](https://storage.ghost.io/c/73/74/73741b5e-0bdf-4e6f-9161-743bc6f76d78/content/images/size/w1200/2026/06/ko-blog------------------------------------------------AI-------------------------------------------------------------------10------------------------------------------------.png)
슈퍼브에이아이의 [슈퍼브 인사이트]는 같은 결과를 얻으면서 토큰 사용을 10배 줄이는 방법과 품질 손실 없이 운영하는 전략을 다룹니다. 슈퍼브에이아이의 연구팀은 4가지 방법, RAG, JSON 최적화, 토큰 카운트 관리와 LLM API의 파라미터 조정 같은 실무 기법을 구체적으로 제시합니다. 실무적으로는 토큰 절감 전략의 비용 효율화와 응답 속도 개선을 비롯해 운영 부담을 줄이는 구체적 가이드를 제공합니다.

캐치테이블의 IMPACT ON 워크샵은 속초에서 진행되었고, 구성원 주도형 프로그램 선택과 예측 불가능한 날씨에도 대응하는 운영 방식이 핵심으로 드러납니다. AI를 활용한 워크샵 페이지와 Notion QR, 6개 프로그램 구성, Plan B의 활용으로 예기치 못한 상황에서도 운영의 연속성을 확보했습니다. 또한 MGM 미팅, 현장 간식 캐치편의점 도입, 지역 특산물 간식 등 현장 경험을 강화하는 방식으로 실무자와 참가자의 가치 창출을 도왔습니다.

AWS가 Amazon Bedrock 위에서 Codex와 Claude Code를 함께 운용하기 위한 하네스 엔지니어링 사례를 다룹니다. 4가지 협업 토폴로지와 8가지 arm으로 구성된 실험을 48런 수행했고, 같은 Bedrock 계정과 리전에서 두 도구를 추론시키며 토큰·시간·비용·기능 점수·행동 특징 등을 체계적으로 기록했습니다. 실험은 두 도구의 강점 차이와 협업 가능성을 구체적으로 확인했고, Bedrock 기반 엔드투엔드 협업 파이프라인 설계와 비용 관리의 실무적 시사점을 제공합니다.
NHN Cloud의 EasyQueue는 운영은 NHN Cloud가 맡되 Kafka의 본연 유연함은 사용자에게 남겨두는 완전관리형 Apache Kafka 서비스입니다. 클러스터 운영은 NHN Cloud가 담당하고, 토픽 설계와 파티션 구성은 사용자가 제어하며, 공용 클러스터로 즉시 토픽 생성이 가능합니다. 현재 판교·평촌 두 리전에서 베타로 제공되며, 컨슈머 Lag를 콘솔에서 확인하고 Kafka 클라이언트의 표준 호환성을 유지합니다.
농심 NDS가 AWS Summit Seoul 2026에서 발표한 차세대 OpenSearch의 에이전틱 AI 접근법과 4단계 검색 패러다임을 다룹니다. 주요 내용은 MCP(모델 컨텍스트 프로토콜) 표준과 에이전트 메모리, 로컬 에이전트의 멀티테넌트 보안 구조, 벡터 저장계층, 그리고 GPU 인덱스 가속으로 대규모 벡터 검색의 비용과 성능을 개선하는 방법이다. 기업 고객을 위한 맞춤형 AI 아키텍처 설계와 안전한 에이전틱 AI 도입 전략을 제시하며, NDS가 OpenSearch 기반 인프라의 핵심 역할과 활용 시나리오를 구체적으로 안내한다.