News

#vllm #llm #ai #opensource | vLLM

vLLM

2026.01.21

·LinkedIn·by 이호민

#vLLM#LLM#AI#OpenSource

핵심 포인트

1vLLM v0.14.0이 기본 비동기 스케줄링 및 PyTorch 2.9.1 요구사항과 같은 Breaking Changes를 포함하여 출시되었습니다.
2주요 개선사항으로는 OOM을 방지하는 `--max-model-len auto` 기능과 고성능 gRPC server entrypoint가 추가되었으며, Grok-2 및 LFM2-VL 등 다양한 신규 모델 아키텍처를 지원합니다.
3CUTLASS MoE 최적화를 통해 Throughput과 TTFT 성능이 향상되었고, SM103 및 B300 Blackwell과 같은 최신 하드웨어 지원이 강화되었습니다.

VLLM_LOG_MODEL_INSPECTION=1

News

vLLM

2026.01.21

·LinkedIn·by 이호민

#vLLM#LLM#AI#OpenSource

1vLLM v0.14.0이 기본 비동기 스케줄링 및 PyTorch 2.9.1 요구사항과 같은 Breaking Changes를 포함하여 출시되었습니다.
2주요 개선사항으로는 OOM을 방지하는 `--max-model-len auto` 기능과 고성능 gRPC server entrypoint가 추가되었으며, Grok-2 및 LFM2-VL 등 다양한 신규 모델 아키텍처를 지원합니다.
3CUTLASS MoE 최적화를 통해 Throughput과 TTFT 성능이 향상되었고, SM103 및 B300 Blackwell과 같은 최신 하드웨어 지원이 강화되었습니다.

VLLM_LOG_MODEL_INSPECTION=1