Paper

Latent Collaboration in Multi-Agent Systems

James Zou

2026.02.07

·Arxiv·by 이호민

#Collaboration#Efficiency#Latent Space#LLM#Multi-Agent Systems

핵심 포인트

1LatentMAS는 Multi-Agent Systems(MAS)에서 Large Language Model(LLM) 에이전트들이 텍스트 기반 소통 대신 연속적인 latent space에서 직접 협업하도록 돕는 training-free 프레임워크입니다.
2이 프레임워크는 각 에이전트가 last-layer hidden embeddings를 통해 auto-regressive latent thoughts를 생성하고, shared latent working memory(KV cache)를 통해 정보를 손실 없이 교환합니다.
3광범위한 벤치마크에서 LatentMAS는 기존 text-based MAS 대비 최대 14.6% 높은 정확도, 70.8%-83.7% 적은 토큰 사용, 그리고 4배 이상 빠른 추론 속도를 달성하며 뛰어난 성능과 효율성을 입증했습니다.

h_t

Paper

James Zou

2026.02.07

·Arxiv·by 이호민

#Collaboration#Efficiency#Latent Space#LLM#Multi-Agent Systems

1LatentMAS는 Multi-Agent Systems(MAS)에서 Large Language Model(LLM) 에이전트들이 텍스트 기반 소통 대신 연속적인 latent space에서 직접 협업하도록 돕는 training-free 프레임워크입니다.
2이 프레임워크는 각 에이전트가 last-layer hidden embeddings를 통해 auto-regressive latent thoughts를 생성하고, shared latent working memory(KV cache)를 통해 정보를 손실 없이 교환합니다.
3광범위한 벤치마크에서 LatentMAS는 기존 text-based MAS 대비 최대 14.6% 높은 정확도, 70.8%-83.7% 적은 토큰 사용, 그리고 4배 이상 빠른 추론 속도를 달성하며 뛰어난 성능과 효율성을 입증했습니다.

h_t