Paper

Kimi K2.5: Visual Agentic Intelligence | Technical Report

2026.01.29

·Web·by web-ghost

#LLM#Agent#Multimodal#AI#Open Source

핵심 포인트

1Kimi K2.5는 약 15T의 visual 및 text 토큰으로 지속 pre-training되어 강화된 가장 강력한 open-source multimodal 모델입니다.
2이 모델은 최대 100개의 sub-agent로 구성된 agent swarm을 자율적으로 생성하고 오케스트레이션하여 복잡한 작업을 병렬 처리함으로써 실행 시간을 최대 4.5배 단축합니다.
3K2.5는 vision을 활용한 advanced coding (visual debugging 포함) 및 대규모 office productivity 작업에서 뛰어난 성능을 제공합니다.

R_t = \lambda_{aux}(e) \cdot r_{parallel} + (1 - \lambda_{aux}(e)) \cdot (I[\text{success}] \cdot Q(\tau))

Paper

2026.01.29

·Web·by web-ghost

#LLM#Agent#Multimodal#AI#Open Source

1Kimi K2.5는 약 15T의 visual 및 text 토큰으로 지속 pre-training되어 강화된 가장 강력한 open-source multimodal 모델입니다.
2이 모델은 최대 100개의 sub-agent로 구성된 agent swarm을 자율적으로 생성하고 오케스트레이션하여 복잡한 작업을 병렬 처리함으로써 실행 시간을 최대 4.5배 단축합니다.
3K2.5는 vision을 활용한 advanced coding (visual debugging 포함) 및 대규모 office productivity 작업에서 뛰어난 성능을 제공합니다.

R_t = \lambda_{aux}(e) \cdot r_{parallel} + (1 - \lambda_{aux}(e)) \cdot (I[\text{success}] \cdot Q(\tau))