핵심 요약
토스가 FedLPA 연구를 통해 분산 데이터의 로컬 분포를 그래프 기반으로 파악하고, 이를 바탕으로 글로벌 모델의 안정적 성능을 달성하는 연합학습 3단계 파이프라인을 제시했습니다.
구현 방법
- CLSD: 특징 벡터로 유사도 그래프 생성, 고확신 샘플로 그래프 강화
- InfoMap Clustering: 그래프 커뮤니티 탐지로 자동 범주 추정
- LPA: 자가 증류로 프로토타입 재예측, Empirical Prior에 맞춘 정규화로 불균형 보정
주요 결과
- 로컬 데이터 유지에도 글로벌 서비스 고성능 가능
- 규제 리스크 감소 및 개인정보 보호 강화
- 글로벌 서비스 확장의 기술적 토대 마련



