Найти в Дзене
ELEKTRA

Google деактивирует часть моделей Gemini API: точные даты, замены и план миграции без простоев

Вы выпускаете обновление, а изображения и видео внезапно перестают рендериться. В логах — «модель не найдена». Паника не нужна: Google заранее объявила график отключения ряда превью-моделей Gemini API. Ниже — что именно уходит, куда мигрировать и как пройти переключение без падения конверсии. Суть решения простая: превью-ветки живут коротко, затем уступают место стабильным релизам. В ноябре отключаются отдельные модели для генерации изображений и видео. Практика для продакшна одна — держать маршрутизацию через конфигурации, а не шить имя модели в код. Так вы включаете замену за минуты, а не переписываете сервис. Что именно уходит. Поэтапно выключаются два варианта Veo 3.0 в превью и две Flash-ветки для генерации изображений в линейке 2.0. Плюс часть старых Imagen и вспомогательных моделей переводятся в архив. Ключ к спокойствию — заранее завести таблицу «задача → допустимые модели → дата EOL (конца жизни)». Куда мигрировать. Для изображения — на Gemini 2.5 Flash Image или Imagen 4 в

Вы выпускаете обновление, а изображения и видео внезапно перестают рендериться. В логах — «модель не найдена». Паника не нужна: Google заранее объявила график отключения ряда превью-моделей Gemini API. Ниже — что именно уходит, куда мигрировать и как пройти переключение без падения конверсии.

Суть решения простая: превью-ветки живут коротко, затем уступают место стабильным релизам. В ноябре отключаются отдельные модели для генерации изображений и видео. Практика для продакшна одна — держать маршрутизацию через конфигурации, а не шить имя модели в код. Так вы включаете замену за минуты, а не переписываете сервис.

Что именно уходит. Поэтапно выключаются два варианта Veo 3.0 в превью и две Flash-ветки для генерации изображений в линейке 2.0. Плюс часть старых Imagen и вспомогательных моделей переводятся в архив. Ключ к спокойствию — заранее завести таблицу «задача → допустимые модели → дата EOL (конца жизни)».

Куда мигрировать. Для изображения — на Gemini 2.5 Flash Image или Imagen 4 в поддерживаемой конфигурации. Для видео — на Veo 3.1 Preview с оговоркой по квотам. Для диалоговых живых голосов — на нативные аудио-ветки вместо промежуточных каскадных решений. Это прямые маршруты, их достаточно покрыть автотестами.

Техника смены модели. Вынесите имя модели, регион и параметры запроса в переменные окружения. Включайте через фича-флаг с поэтапным трафиком: 5% → 20% → 50% → 100%. Перед этим прогрейте кэш промтов, а синтетические тесты гоняйте на фиксированных сидах, чтобы видеть деградации качественно, а не «на глаз».

Экономика. Стабильные ветки обычно дают меньшую латентность и меньше повторов. Это снижает стоимость минуты рендера и ручных перегенераций. На витринах и лендингах вы уводите риск «битых» карточек к нулю, а NPS (индекс потребительской лояльности) не проседает в пиковые часы.

Продуктовая логика. Не держите одну «любимую» модель. Сборка должна быть профильной: быстрый черновик, детальный рендер, фотореалистичный финиш. Сверху — единый слой нормализации ответа, чтобы интерфейс для пользователя оставался одинаковым, даже если под капотом уже другая модель.

Процессы. Плейбук миграции обязателен: оповещение, переключение эндпоинта, регресс-прогоны, контроль качества, вывод старой ветки из оркестрации. В CI/CD держите проверку перечня активных моделей, чтобы PR не проходил с «мертвым» идентификатором. Алерты — на всплеск таймаутов и рост повторов.

Инфраструктура. Старые SDK (наборы средств разработки) и модули объявлены к снятию, Google продвигает единый Gen AI SDK. Проверьте контейнер: версии клиента, регионы, права. На кэше и сторидже храните не артефакты модели, а промт-параметры и семена — миграции пройдут без болезненной чистки.

Команда. Разработчик выносит зависимость в конфиг, SRE отслеживает латентность и ошибки, продакт ведет матрицу замен, аналитик контролирует конверсию и отказы. Один раз собранный шаблон миграции экономит часы при каждом следующем цикле деприкаций.

«Основатели». Google создали Ларри Пейдж и Сергей Брин; сегодня компанию возглавляет Сундар Пичаи, а направление ИИ ведет Google DeepMind под руководством Демиса Хассабиса. Это важно практическим выводом: частота релизов высокая, графики отключений будут повторяться, дисциплина миграций — норма.

Риски и как их гасить. Главные риски — скрытые зависимости от формата вывода и логики безопасности изображений. Держите контракты строгими: типы, размеры, допускаемые атрибуты. На клиенте — graceful degradation, на сервере — ретраи по экспоненте и fallback-ветка с «самой старшей» стабильной моделью.

Горизонт 6–24 месяцев. линейка упростится до нескольких четких семейств по задачам, а «живые» голосовые и видео-ветки сольются с мультимодальными. Для бизнеса это означает меньше хаоса и понятные окна миграций. В ответ — автоматизируйте сверку матрицы моделей по расписанию и держите «двухкнопочный» свитч.

Любить такой курс есть за что: предсказуемый жизненный цикл, понятные замены и выигрыш в стабильности. Сохраните материал и подпишитесь на ELEKTRA — разбираем шум в релиз-нотах и переводим его в действия, чтобы ваши витрины и прод не срывались на «модель не найдена».