핵심 요약
미리디가 Prism Lens로 이미지 한 장을 편집 가능한 레이어로 되돌리는 파이프라인을 구축해 비용과 속도를 크게 개선했습니다. 한 장당 비용은 0.6-0.8달러에서 0.1-0.2달러로, 브라우저 처리 시간은 80초에서 14초로, WebGPU 도입으로 16초를 1초로 단축했습니다.
구현 방법
- GPT-5 비전 모델이 이미지 분석 후 manifest(JSON) 생성
- imageMode(crop/generate)로 자르는 여부 결정
- 실행은 로컬 온디바이스 AI+코드 도형 그리기, 가려진 부분 복원만 클라우드 생성형 AI로 처리
- 좌표 보정은 매팅의 알파 마스크로 정밀 보정
- WebGPU 기반 매팅/업스케일로 속도 향상
주요 결과
- 정체성 자산은 crop로 보존
- 가려진 부분만 generate로 보완
- 로컬 처리로 서버 호출 대폭 축소
- 전체 파이프라인 속도 대폭 개선



