19 мая Google представила Gemini 3.5 Flash — модель, которая переворачивает привычную иерархию языковых моделей и знаменует собой новую эру в развитии искусственного интеллекта. Впервые в истории линейки облегчённая Flash-версия превзошла флагманский Gemini 3.1 Pro по ключевым метрикам программирования и агентских задач. Это не просто инкрементальное улучшение — это фундаментальная смена парадигмы в подходе к разработке больших языковых моделей, демонстрирующая, что эффективность архитектуры важнее простого наращивания параметров. Скорость вывода Gemini 3.5 Flash составляет впечатляющие 289 токенов в секунду по данным независимого сервиса Artificial Analysis, что делает её самой быстрой моделью на рынке. Для сравнения: Claude Opus 4.7 выдаёт всего 67 токенов в секунду, а GPT-5.5 работает ещё медленнее. Разрыв более чем в четыре раза — это не просто цифры в бенчмарках, это качественно новый пользовательский опыт, где задержки становятся практически незаметными. Модель развёрнута на TPU