Google представила Gemini 3.1 Flash Lite: быстрее и дешевле

4 марта4 мар

2 мин

Google открыла превью-доступ к Gemini 3.1 Flash Lite — самой экономичной модели линейки 3.x для разработчиков. Компания обещает «best-in-class intelligence» для высоконагруженных сценариев и даёт цифры по скорости и цене. По внутренним тестам Google, Gemini 3.1 Flash Lite ускорилась относительно Gemini 2.5 Flash сразу по двум метрикам. Time to First Answer Token (время до первого токена ответа) — до 2,5 раза быстрее. А генерация вывода — на 45% быстрее, при этом качество «сохраняется или растёт», а стоимость снижается. Google подтвердила тарифы для новой модели на уровне $0,25 за 1M входных токенов и $1,50 за 1M выходных токенов. По курсу около 92 рубля за доллар это примерно 23 рубля за 1M входных токенов и 138 рублей за 1M выходных токенов. ❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО Для сравнения внутри линейки Google цифры такие: То есть 3.1 Flash Lite дешевле 2.5 Flash, но дороже 2.5 Flash Lite. Google при этом делает ставку на баланс: выше скорость и заяв

Оглавление

Цены Gemini 3.1 Flash Lite: $0,25 за вход и $1,50 за выход
Переменное рассуждение: разработчики смогут крутить глубину reasoning
Сравнение с конкурентами: Google заявляет победы в 6 из 11 бенчмарков

Google открыла превью-доступ к Gemini 3.1 Flash Lite — самой экономичной модели линейки 3.x для разработчиков. Компания обещает «best-in-class intelligence» для высоконагруженных сценариев и даёт цифры по скорости и цене.

По внутренним тестам Google, Gemini 3.1 Flash Lite ускорилась относительно Gemini 2.5 Flash сразу по двум метрикам. Time to First Answer Token (время до первого токена ответа) — до 2,5 раза быстрее. А генерация вывода — на 45% быстрее, при этом качество «сохраняется или растёт», а стоимость снижается.

Цены Gemini 3.1 Flash Lite: $0,25 за вход и $1,50 за выход

Google подтвердила тарифы для новой модели на уровне $0,25 за 1M входных токенов и $1,50 за 1M выходных токенов. По курсу около 92 рубля за доллар это примерно 23 рубля за 1M входных токенов и 138 рублей за 1M выходных токенов.

❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО

Для сравнения внутри линейки Google цифры такие:

Gemini 3.1 Flash Lite: $0,25 / $1,50 за 1M токенов (input/output)
Gemini 2.5 Flash: $0,30 / $2,50 за 1M токенов
Gemini 2.5 Flash Lite: $0,10 / $0,40 за 1M токенов

То есть 3.1 Flash Lite дешевле 2.5 Flash, но дороже 2.5 Flash Lite. Google при этом делает ставку на баланс: выше скорость и заявленное качество, но без ценника «старших» моделей.

Переменное рассуждение: разработчики смогут крутить глубину reasoning

Одна из ключевых фишек модели — variable reasoning. Разработчик может регулировать, сколько «рассуждений» модель тратит на ответ. Это позволяет переключаться между быстрыми реакциями для простых задач и более глубокими ответами для сложных.

Google прямо называет сценарии, где такая настройка особенно полезна:

Высоконагруженный перевод: когда важны цена и задержки
Модерация контента: много коротких запросов, нужна стабильная скорость
Генерация UI и дашбордов: типовые структуры, много шаблонной работы
Симуляции: когда нужна управляемая «глубина» ответа

Сравнение с конкурентами: Google заявляет победы в 6 из 11 бенчмарков

Google также сравнила Gemini 3.1 Flash Lite с рядом сторонних моделей по бенчмаркам. По данным компании, модель обходит ключевых конкурентов в 6 из 11 тестов.

Модель Цена за 1M input Цена за 1M output Gemini 3.1 Flash Lite $0,25 $1,50 GPT-5 mini $0,25 $2,00 Claude 4.5 Haiku $1,00 $5,00 Grok 4.1 Fast $0,20 $0,50

Цены тут важны не меньше качества. На больших объёмах разница между $1,50 и $2,00 за output быстро превращается в ощутимую статью расходов, особенно если продукт генерирует много текста.

Где доступна Gemini 3.1 Flash Lite и в каком статусе

Сейчас Gemini 3.1 Flash Lite доступна в статусе preview через Gemini API в Google AI Studio. Для корпоративных клиентов модель также появилась в Vertex AI.

И это продолжение свежей волны релизов. Несколько недель назад Google выпустила Gemini 3.1 Pro и заявила, что она обходит Claude Sonnet 4.6, Opus 4.6, GPT-5.2 и GPT-5.3-Codex в большинстве бенчмарков.

❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО

Источники: Google

Подписывайтесь на наши каналы в Telegram и Дзен, чтобы узнавать больше. И делитесь своим мнением и опытом в нашем чате.

Google представила Gemini 3.1 Flash Lite: быстрее и дешевле ⚡️