Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

Gemini 3 Flash: Быстрая, дешевая и умная модель от Google

Gemini 3 Flash — новая модель семейства Gemini 3, объединяющая высокий уровень рассуждений с минимальной задержкой и экономичной ценой. По результатам тестов, модель демонстрирует неожиданно высокую эффективность. На GPQA Diamond — 90.4%, на Humanity’s Last Exam — 33.7% без использования инструментов, а на MMMU Pro — 81.2%, что почти соответствует Gemini 3 Pro. При этом Gemini 3 Flash превосходит Gemini 2.5 Pro и конкурирует с более крупными моделями, оставаясь при этом значительно доступнее по цене. Ключевой особенностью является управляемый процесс мышления. Модель способна уделять больше времени сложным задачам, но в среднем использует на 30% меньше токенов, чем Gemini 2.5 Pro, сохраняя при этом более высокое качество. Gemini 3 Flash является одной из самых быстрых моделей на рынке: до 3 раз быстрее, чем 2.5 Pro, согласно данным Artificial Analysis. Цена составляет $0.50 за 1 миллион входных токенов и $3 за 1 миллион выходных токенов (для аудио – $1). Это позволяет использовать моде

Gemini 3 Flash — новая модель семейства Gemini 3, объединяющая высокий уровень рассуждений с минимальной задержкой и экономичной ценой.

По результатам тестов, модель демонстрирует неожиданно высокую эффективность. На GPQA Diamond — 90.4%, на Humanity’s Last Exam — 33.7% без использования инструментов, а на MMMU Pro — 81.2%, что почти соответствует Gemini 3 Pro. При этом Gemini 3 Flash превосходит Gemini 2.5 Pro и конкурирует с более крупными моделями, оставаясь при этом значительно доступнее по цене.

Ключевой особенностью является управляемый процесс мышления. Модель способна уделять больше времени сложным задачам, но в среднем использует на 30% меньше токенов, чем Gemini 2.5 Pro, сохраняя при этом более высокое качество.

Gemini 3 Flash является одной из самых быстрых моделей на рынке: до 3 раз быстрее, чем 2.5 Pro, согласно данным Artificial Analysis. Цена составляет $0.50 за 1 миллион входных токенов и $3 за 1 миллион выходных токенов (для аудио – $1). Это позволяет использовать модель не только в премиум-сегменте, но и в массовом производстве.

Для разработчиков важным показателем является результат SWE-bench Verified: 78%, что выше, чем у всех моделей серии 2.5 и Gemini 3 Pro. Gemini 3 Flash ориентирована на агентные системы, высокочастотные процессы и интерактивные приложения, где критически важна минимальная задержка.

Модель эффективно интегрируется в мультимодальные системы: анализ видео, визуальные вопросы и ответы, извлечение данных, A/B-тестирование, ассистенты для игр.

Gemini 3 Flash теперь используется по умолчанию:
— в Gemini API, Gemini CLI и Google Antigravity
— в Vertex AI и Gemini Enterprise
— в приложении Gemini (заменяет 2.5 Flash)
— в режиме AI в Google Search