News

Gemini 3.1 Flash-Lite: Built for intelligence at scale

The Gemini Team

2026.03.03

·Web·by 이호민

#AI#Gemini#Google AI#LLM#Vertex AI

핵심 포인트

1Google은 고용량 워크로드를 위한 Gemini 3 시리즈의 가장 빠르고 비용 효율적인 모델인 Gemini 3.1 Flash-Lite를 Gemini API 및 Vertex AI를 통해 Preview로 출시했습니다.
2이 모델은 $0.25/1M input tokens, $1.50/1M output tokens의 저렴한 가격으로 2.5 Flash보다 2.5배 빠른 Time to First Answer Token 및 45% 향상된 출력 속도를 제공합니다.
3Gemini 3.1 Flash-Lite는 높은 Elo score와 벤치마크 점수를 바탕으로 Translation, Content moderation, UI/dashboard 생성, Simulation 등 다양한 고빈도 및 복합 작업을 효율적으로 처리할 수 있습니다.

0.25, 1M output tokens당

News

The Gemini Team

2026.03.03

·Web·by 이호민

#AI#Gemini#Google AI#LLM#Vertex AI

1Google은 고용량 워크로드를 위한 Gemini 3 시리즈의 가장 빠르고 비용 효율적인 모델인 Gemini 3.1 Flash-Lite를 Gemini API 및 Vertex AI를 통해 Preview로 출시했습니다.
2이 모델은 $0.25/1M input tokens, $1.50/1M output tokens의 저렴한 가격으로 2.5 Flash보다 2.5배 빠른 Time to First Answer Token 및 45% 향상된 출력 속도를 제공합니다.
3Gemini 3.1 Flash-Lite는 높은 Elo score와 벤치마크 점수를 바탕으로 Translation, Content moderation, UI/dashboard 생성, Simulation 등 다양한 고빈도 및 복합 작업을 효율적으로 처리할 수 있습니다.

0.25, 1M output tokens당