Paper

LGAI-EXAONE/K-EXAONE-236B-A23B · Hugging Face

2026.01.04

·Hugging Face·by 이호민

#LLM#MoE#Multilingual#Transformers#AI

핵심 포인트

1LG AI Research에서 개발한 K-EXAONE은 236B의 총 파라미터와 23B의 활성 파라미터를 가진 대규모 다국어 MoE(Mixture-of-Experts) 모델로, 256K의 긴 Context Window와 한국어, 영어 등 6개 언어를 지원합니다.
2Multi-Token Prediction (MTP)으로 추론 처리량을 약 1.5배 향상시키고 3:1 하이브리드 Attention으로 메모리 사용을 최소화하며, 추론, Agentic 기능, 다국어 이해 및 장문 처리 능력에서 우수한 성능을 보입니다.
3K-EXAONE은 정확성을 위한 Reasoning 모드와 낮은 Latency를 위한 Non-reasoning 모드를 제공하며 Tool-use를 지원하고 vLLM, SGLang 등에서 배포 가능하지만, 학습 데이터의 특성상 때때로 부적절하거나 편향된 응답을 생성할 수 있는 한계가 있습니다.

enable_thinking=True

Paper

2026.01.04

·Hugging Face·by 이호민

#LLM#MoE#Multilingual#Transformers#AI

1LG AI Research에서 개발한 K-EXAONE은 236B의 총 파라미터와 23B의 활성 파라미터를 가진 대규모 다국어 MoE(Mixture-of-Experts) 모델로, 256K의 긴 Context Window와 한국어, 영어 등 6개 언어를 지원합니다.
2Multi-Token Prediction (MTP)으로 추론 처리량을 약 1.5배 향상시키고 3:1 하이브리드 Attention으로 메모리 사용을 최소화하며, 추론, Agentic 기능, 다국어 이해 및 장문 처리 능력에서 우수한 성능을 보입니다.
3K-EXAONE은 정확성을 위한 Reasoning 모드와 낮은 Latency를 위한 Non-reasoning 모드를 제공하며 Tool-use를 지원하고 vLLM, SGLang 등에서 배포 가능하지만, 학습 데이터의 특성상 때때로 부적절하거나 편향된 응답을 생성할 수 있는 한계가 있습니다.

enable_thinking=True