Blog

zai-org/GLM-4.7-Flash · Hugging Face

2026.01.20

·Hugging Face·by 권준호

#LLM#Transformers#MoE#Text Generation#Conversational AI

핵심 포인트

1GLM-4.7-Flash는 30B-A3B MoE 모델로, 30B 클래스에서 가장 강력하며 성능과 효율성의 균형을 맞춘 경량 배포 옵션을 제공합니다.
2이 모델은 AIME, GPQA, HLE, SWE-bench Verified, τ²-Bench, BrowseComp와 같은 주요 벤치마크에서 Qwen3-30B-A3B-Thinking-2507 및 GPT-OSS-20B 모델 대비 우수한 성능을 입증했습니다.
3GLM-4.7-Flash는 vLLM 및 SGLang 프레임워크를 통한 로컬 배포를 지원하며, 상세한 설치 및 사용 가이드가 공식 Github 저장소에 제공됩니다.

uv pip install sglang==0.3.2.dev9039+pr-17247.g90c446848 --extra-index-url https://sgl-project.github.io/whl/pr/

Blog

2026.01.20

·Hugging Face·by 권준호

#LLM#Transformers#MoE#Text Generation#Conversational AI

1GLM-4.7-Flash는 30B-A3B MoE 모델로, 30B 클래스에서 가장 강력하며 성능과 효율성의 균형을 맞춘 경량 배포 옵션을 제공합니다.
2이 모델은 AIME, GPQA, HLE, SWE-bench Verified, τ²-Bench, BrowseComp와 같은 주요 벤치마크에서 Qwen3-30B-A3B-Thinking-2507 및 GPT-OSS-20B 모델 대비 우수한 성능을 입증했습니다.
3GLM-4.7-Flash는 vLLM 및 SGLang 프레임워크를 통한 로컬 배포를 지원하며, 상세한 설치 및 사용 가이드가 공식 Github 저장소에 제공됩니다.

uv pip install sglang==0.3.2.dev9039+pr-17247.g90c446848 --extra-index-url https://sgl-project.github.io/whl/pr/