Service

gpt-oss

2025.08.10

·Web·by Anonymous

#LLM#OpenAI#Agent#Quantization#Ollama

핵심 포인트

1OpenAI가 Ollama와 협력하여 강력한 추론 및 agentic 작업에 최적화된 gpt-oss 20B 및 120B open-weight 모델을 출시했습니다.
2이 모델들은 함수 호출, 웹 브라우징, Python 도구 사용 등 agentic capabilities와 함께 chain-of-thought 및 fine-tuning 기능을 제공하며 Apache 2.0 license로 배포됩니다.
3MoE weights를 MXFP4 형식으로 양자화하여 메모리 사용량을 크게 줄였으며, 이로 인해 20B 모델은 16GB 메모리에서도 실행 가능하고 Ollama는 해당 형식을 기본 지원합니다.

Service

2025.08.10

·Web·by Anonymous

#LLM#OpenAI#Agent#Quantization#Ollama

1OpenAI가 Ollama와 협력하여 강력한 추론 및 agentic 작업에 최적화된 gpt-oss 20B 및 120B open-weight 모델을 출시했습니다.
2이 모델들은 함수 호출, 웹 브라우징, Python 도구 사용 등 agentic capabilities와 함께 chain-of-thought 및 fine-tuning 기능을 제공하며 Apache 2.0 license로 배포됩니다.
3MoE weights를 MXFP4 형식으로 양자화하여 메모리 사용량을 크게 줄였으며, 이로 인해 20B 모델은 16GB 메모리에서도 실행 가능하고 Ollama는 해당 형식을 기본 지원합니다.