По состоянию на 17 апреля 2026 года ключевой сюжет у Google в AI для разработчиков — это не один «большой запуск», а переход от волны платформенных анонсов 2025 года к операционализации, удешевлению, стандартизации и управлению: семейство Gemini 3.1 стало центральной модельной линией, Gemini API резко расширил набор инструментов и режимов инференса, Vertex AI усилил RAG, векторный поиск и оценивание, а агентный стек перешел к версии «production-first» через ADK 1.0, Gemini CLI, MCP‑интеграции и корпоративную governance‑обвязку. В открытом контуре самым заметным шагом стал Gemma 4 с переходом на Apache 2.0, а в инфраструктурном — дальнейшее расширение TPU‑ и edge‑стека через TorchTPU, LiteRT и MaxText.
Для разработчиков рекомендую заглянуть к нам в сообщество наиболее существенные изменения в 2026 году выглядят так. Во-первых, миграция на Google GenAI SDK фактически стала стандартом: Google прямо рекомендует уходить с legacy‑клиентов, потому что новые библиотеки дают доступ к Live API, Veo и другим свежим функциям. Во-вторых, Gemini API получил Computer Use, Interactions API, мультимодальные embeddings, комбинацию built‑in tools с custom function calling, более крупные file inputs, новые режимы Flex и Priority, а также обновленные spend caps и billing tiers. В-третьих, инструментальная линейка для агентной разработки заметно повзрослела: Developer Knowledge API + MCP Server, Data Commons MCP, Colab MCP, ADK for Java 1.0.0, ADK Go 1.0, skills‑механика в ADK, а также экосистемные возможности Gemini CLI — hooks, plan mode и subagents.
Для команд и предприятий главный вывод еще жестче: в 2026 году Google продвигает не «отдельную модель», а полный герметичный контур разработки AI‑систем. Это видно по Vector Search 2.0 GA, RAG Engine Serverless, поддержке partner model evaluations, Workbench‑обновлениям, документированным сценариям CI/CD и continuous evaluation, интеграции Model Armor, а также по compliance‑поверхности вокруг EU AI Act и ISO/IEC 42001. Если в 2025 году акцент был на запуске агентных строительных блоков, то в 2026 Google делает ставку на управляемый, наблюдаемый и аудируемый AI‑SDLC.
Scope и методология
Этот отчет охватывает календарный 2026 год в доступной на сегодня части — с 1 января по 17 апреля 2026 года. Это важно: год еще не завершен, поэтому в отчет не могут входить анонсы, которые появятся позже. Я приоритизировал primary sources: официальные блоги Google, документацию, release notes, pricing pages, compliance pages, а также официальные материалы сторонних платформ, если речь идет об интеграциях, например документацию и changelog’и GitHub. Затем — публикации Google DeepMind / Google Research и, только как третий слой контекста, авторитетную прессу вроде Ars Technica, TechCrunch и InfoQ.
Отдельное ограничение касается мероприятий. Google I/O 2026 пройдет 19–20 мая 2026 года, а Google Cloud Next ’26 — 22–24 апреля 2026 года. На дату подготовки отчета сами сессии и keynote‑материалы этих событий либо еще не состоялись, либо еще не доступны как полноценный корпус источников. Поэтому я использую только официальные страницы мероприятия, анонсы и предварительные описания сессий, а не несуществующие «разборы выступлений». Все детали, которых в опубликованных источниках нет, я помечаю как не указано или трактую как осторожный вывод, а не как установленный факт.
Хронология
Ниже — укрупненная карта того, как менялась developer‑повестка Google в AI в первые месяцы 2026 года. Диаграмма построена по официальным release notes, developer blog‑постам, docs и event‑анонсам.
Январь 2026: Google сделал акцент на TPU-инфраструктуре и более прикладной работе с Gemini в средах разработки.
- Что изменилось: вышли материалы по JAX для Cloud TPU, Gemini CLI появился в Vertex AI Workbench, а в Gemini API обозначился сценарий Computer Use.
- Почему это важно: AI-инструменты стали ближе к повседневому developer workflow, а не только к экспериментам в отдельных песочницах.
Февраль 2026: Фокус сместился в сторону knowledge-интеграций и расширения модельной линейки.
- Что изменилось: появились Developer Knowledge API и MCP Server, вышел preview Gemini 3.1 Pro, а генерация изображений усилилась через Flash Image и Nano Banana 2.
- Почему это важно: команды получили более цельную связку между кодовой базой, агентными инструментами и мультимодальными сценариями.
Март 2026: Google ускорил переход от прототипов к production-сценариям и углубил агентные возможности.
- Что изменилось: в GA вышел Vector Search 2.0, появился preview Gemini Embedding 2, в Gemini CLI добавили Plan Mode, расширились инструменты grounding и live-аудио, а ADK получил стабильные Java- и Go-версии.
- Почему это важно: разработчики получили более зрелый набор компонентов для поиска, orchestration, мультимодальности и сборки агентных систем.
Апрель 2026: Повестка сместилась к open-моделям, serverless RAG и более широкому набору production-инструментов.
- Что изменилось: вышла Gemma 4 под Apache 2.0, появился preview RAG Engine Serverless, развивались TorchTPU и TTS-возможности Gemini 3.1 Flash, а Gemini CLI получил subagents.
- Почему это важно: экосистема стала одновременно более открытой, более автоматизируемой и лучше приспособленной к масштабированию рабочих AI-процессов.
Таблица ключевых анонсов 2026
- 5 янв. — Практический гайд по JAX on Cloud TPU. Почему это важно: Сигнал, что Google по-прежнему инвестирует в TPU‑first DX для JAX, с фокусом на debugging/profiling.
- 16 янв. — Gemini CLI появился в Vertex AI Workbench. Почему это важно: Терминальный агент переносится в managed notebook/workbench‑контур.
- 29 янв. — В Gemini API добавлен Computer Use. Почему это важно: Агентный стек выходит к browser automation и UI‑операциям.
- 4 февр. — Developer Knowledge API + MCP Server в public preview. Почему это важно: Появляется canonical, machine‑readable слой над docs Google для AI‑инструментов.
- 19 февр. — Gemini 3.1 Pro. Почему это важно: Новая базовая high‑reasoning модель для AI Studio, CLI, Antigravity, Vertex AI, Gemini Enterprise и IDE‑контуров.
- 26 февр. — Gemini 3.1 Flash Image / Nano Banana 2. Почему это важно: Усиление визуального и image‑editing контура в API.
- 5 мар. — Vector Search 2.0 стал GA. Почему это важно: Knowledge core для AI‑приложений усиливается гибридным поиском, авто‑эмбеддингами и приватным networking.
- 10 мар. — Gemini Embedding 2 preview. Почему это важно: Переход к мультимодальным embeddings: текст, аудио, PDF, видео, изображения.
- 11 мар. — Plan Mode в Gemini CLI. Почему это важно: Безопасное исследование codebase и архитектурное планирование без автозаписи.
- 18–26 мар. — Tools+functions combo, Maps grounding, Live audio, Lyria 3. Почему это важно: Резкое ускорение agentic/multimodal‑surface Gemini API.
- 30–31 мар. — ADK Java 1.0.0 и ADK Go 1.0. Почему это важно: Агентная разработка выходит за пределы Python/TypeScript в production‑языки.
- 2 апр. — Gemma 4, а также обновление Veo/retirement notes в Vertex. Почему это важно: Открытая модельная линия Google становится сильнее и проще юридически для встраивания.
- 3 апр. — RAG Engine Serverless в preview. Почему это важно: RAG‑контур становится ближе к fully managed service без ручного provisioning БД.
- 7 апр. — TorchTPU. Почему это важно: Снижение friction для PyTorch‑команд, которые хотят использовать TPU без глубокого ухода в JAX.
- 15–17 апр. — Gemini 3.1 Flash TTS, subagents, MaxText SFT/RL, A2UI v0.9. Почему это важно: Сразу четыре признака зрелости: voice, orchestration, post‑training и portable generative UI.
Сдвиг в developer toolchain
Главный сдвиг 2026 года — консолидация вокруг четырех слоев: GenAI SDK, Gemini CLI / Gemini Code Assist, ADK, и MCP‑совместимая knowledge/tooling‑инфраструктура. Если в 2025 Google строил фундамент — ADK, Agent Engine, A2A, Gemini CLI, Gemini 3 и ранние IDE‑сценарии — то в 2026 почти каждый из этих элементов получил версию, более пригодную для production: больше supported languages, больше state management, больше policy‑hooks, больше knowledge endpoints, больше инженерной предсказуемости.
Google GenAI SDK — это уже не «новая библиотека», а фактический standard path. Документация прямо говорит, что SDK находится в GA на поддерживаемых платформах, а legacy‑библиотеки не только не рекомендуются, но и не дают доступа к свежим функциям вроде Live API и Veo. По текущим docs, основной language surface включает Python, JavaScript/TypeScript, Go, Java и C#, а Interactions API требует достаточно свежих версий пакетов (google-genai начиная с 1.55.0, @google/genai — с 1.33.0). Для команд это означает, что в 2026 миграция на новый SDK — уже не «желательно», а необходимое условие для доступа к актуальному API‑срезу.
Gemini CLI в 2026 из «терминального ассистента» превратился в полноценный агентный runtime для разработки. В январе он появился в Vertex AI Workbench, в январе же Gemini API получил Computer Use, затем CLI получил hooks для инъекции контекста и политик, в марте — plan mode для research‑first сценариев с read‑only MCP tools и ask_user, а в апреле — subagents с отдельными context windows и специализированными toolsets. Эта траектория важна потому, что Google явно проектирует CLI уже не как чат в терминале, а как оркестратор рабочих циклов разработки. Для SRE/ops‑контуров это особенно заметно: Google отдельно показал, как его используют SRE‑команды для incident response, от paging до postmortem.
Gemini Code Assist в 2026 не сделал столь шумного продуктового «pivot», но продукт аккуратно укрепил ядро ежедневного coding‑workflow. Весеннее обновление добавило и улучшило Agent Mode with Auto Approve, Inline Diff Views, более точное управление контекстом и custom commands. По сравнению с августом 2025, когда основными тезисами были широкая доступность agent mode, интеграция inline diffs и shell/tool approvals, мартовский апдейт выглядит как переход от feature novelty к сниженному friction в повседневной разработке. В reviewed 2026 sources это важный тренд: продукт менее «маркетингово новый», но более пригодный для непрерывного использования в IDE.
Очень сильный ход Google в 2026 — создание machine‑readable knowledge plane для AI‑инструментов. Developer Knowledge API and MCP Server в public preview дает канонический доступ к документации Google через MCP, а Data Commons MCP, анонсированный через несколько дней, показал, что Google хочет не только сделать docs доступными AI‑агентам, но и переводить собственные data products в hosted MCP‑формат. На этом фоне колаб‑направление и другие MCP‑серверы выглядят уже не как набор отдельных экспериментов, а как попытка навязать новый «нормальный путь интеграции» для tooling agents: не custom scraper, не самописный plugin, а официальный MCP endpoint.
Отдельного внимания заслуживает агентный framework‑слой. ADK в 2025 был в первую очередь Python/TypeScript‑историей, а в 2026 получил Java 1.0.0 и Go 1.0. Java‑релиз принес features вроде Google Maps grounding, URL fetching и более жесткую App/Plugin‑архитектуру; Go‑релиз делает акцент на OpenTelemetry tracing, extensibility и self‑healing‑паттерны. На практике это значит, что в 2026 Google впервые предлагает достаточно цельный агентный story не только для prototyping‑языков, но и для тех стеков, где живут корпоративные backend‑команды. Дополнительно Skills/SkillToolset выводят ADK в сторону динамически расширяемой компетенции агента: по официальному описанию, progressive disclosure может сокращать token usage до 90% против монолитных prompt‑архитектур.
Интеграция с GitHub Copilot в 2026 уже не теоретическая. Официальный GitHub changelog подтверждает, что Gemini 3.1 Pro ушел в public preview in GitHub Copilot 19 февраля 2026 года, а затем Gemini 3 Pro был официально deprecated 26 марта с рекомендацией мигрировать на 3.1 Pro. Документация GitHub дополнительно фиксирует два важных enterprise‑момента: Gemini‑модели в Copilot хостятся на Google Cloud Platform, и при их использовании GitHub ссылается на data commitment от Google, по которому prompt’ы и ответы не используются для тренировки моделей Gemini. Для команд, у которых IDE‑контур уже стандартизирован на Copilot, это, вероятно, самый практический путь потребления Google‑моделей в 2026 без смены основного developer UX.
Сравнение основных developer‑инструментов Google в 2026
- Google GenAI SDK — Базовый клиентский SDK к Gemini API / AI Studio / Vertex. Состояние в 2026: Production standard. Что нового: Миграция с legacy стала рекомендованной нормой; покрытие Python/JS/Go/Java/C#. Когда выбирать: Любой новый проект на Gemini API. Ограничения: Legacy‑клиенты не дают доступ к части новых функций.
- Gemini CLI — Терминальный агент. Состояние в 2026: Быстро взрослеющий agent runtime. Что нового: hooks, plan mode, subagents; Workbench integration. Когда выбирать: Терминал, codebase research, ops, ad‑hoc orchestration. Ограничения: Не заменяет formal CI/CD и policy gates.
- Gemini Code Assist — IDE‑ассистент. Состояние в 2026: Matured daily coding UX. Что нового: Auto Approve, inline diffs, context management, custom commands. Когда выбирать: Командам, уже живущим в IDE. Ограничения: В reviewed sources нет отдельного большого 2026 platform jump; это скорее polishing.
- ADK — Code‑first agent framework. Состояние в 2026: Существенно зрелее, чем в 2025. Что нового: Java 1.0, Go 1.0, skills, better stateful patterns. Когда выбирать: Агентные backend‑системы и orchestrated workflows. Ограничения: Порог сложности выше, чем у prompt‑only apps.
- Developer Knowledge API + MCP — Канонический доступ к docs Google. Состояние в 2026: Public preview. Что нового: Machine‑readable docs gateway для AI tools. Когда выбирать: Агентам, которым нужен trustworthy docs grounding. Ограничения: Preview‑статус; full long‑term SLA не указан.
- Vertex AI Workbench + Gemini CLI — Managed dev environment. Состояние в 2026: Усилен в 2026. Что нового: CLI preview, Debian 12, Python 3.12, Micromamba, но удалены встроенные TF/PyTorch frameworks. Когда выбирать: Controlled notebook/dev environments. Ограничения: Workbench image 26.03 убрала TensorFlow и PyTorch из стандартного образа.
- GitHub Copilot с Gemini 3.1 Pro — Внешний consumption layer для Google‑моделей. Состояние в 2026: Public preview. Что нового: Gemini 3.1 Pro добавлен; Gemini 3 Pro выведен. Когда выбирать: Если IDE/enterprise policy уже стандартизирована на Copilot. Ограничения: Зависимость от Copilot plans и premium requests; pricing со стороны Google не задает итоговую цену Copilot.
В reviewed 2026 primary sources Cloud Code почти не фигурирует как самостоятельная AI‑повестка. Это не означает исчезновение продукта, но означает, что центр тяжести явно сместился к Gemini Code Assist, Gemini CLI, Workbench/Workstations и agent tooling. Для практики это важно: если ваша внутренняя документация и onboarding все еще опираются на старый Cloud Code‑центричный narrative, их имеет смысл переписать под новый стек. Это именно аналитический вывод из корпуса источников, а не отдельный официальный анонс.
Модели, API и доступ к моделям
По официальным docs и pricing pages 2026 года developer‑surface Google теперь фактически сосредоточен вокруг Gemini, Gemma, Veo, Lyria, robotics‑моделей и partner models в Vertex AI. В релизах и pricing‑страницах, которые я просмотрел, PaLM и LaMDA уже не выступают как активные, первичные developer‑бренды. Это не формальный sunset‑анонс именно в этом отчете, а осторожный вывод: публичная developer‑поверхность 2026 года строится вокруг Gemini/Gemma, а не вокруг прежней бренд‑линейки PaLM/LaMDA.
На вершине этой пирамиды стоит Gemini 3.1 Pro, а рядом — более экономичный Gemini 3.1 Flash‑Lite и image/audio/video‑варианты. Важно, что Google не просто выпустил очередную модель, а достроил вокруг нее многоуровневый операционный контур: Interactions API, Computer Use, audio‑to‑audio live model, TTS preview, multimodal embeddings, grounding with Search and Maps, а также special endpoint gemini-3.1-pro-preview-customtools для сценариев, где нужно лучшее приоритизирование custom tools. Это усиливает именно agentic‑use case, а не только классический чат или completion.
С точки зрения tuning‑стека картина в 2026 стала яснее, но не полностью симметрична open‑source миру. Управляемый контур в документации Google описывает supervised tuning, preference tuning, continuous tuning, checkpoints и модели семейства Gemini 3.1 в Vertex/Google AI for Developers; при этом я не нашел в reviewed primary sources отдельного managed‑продукта, явно маркированного как RLHF service. Вместо этого RL‑ и SFT‑направление очень заметно в open‑source стороне через MaxText, где в апреле 2026 Google добавил SFT и RL на single‑host TPU. Поэтому для практики разница такая: managed Gemini‑контур делает ставку на tuning/evals/tooling, а исследовательско‑инфраструктурный контур показывает более низкоуровневый post‑training через MaxText.
Gemma 4 — существенный маркер не только модельной, но и лицензированной стратегии Google. По официальному Google blog и Google Open Source Blog, Gemma 4 — это новая линия открытых моделей для reasoning и agentic workflows, а переход на Apache 2.0 заметно упрощает использование для компаний, которые строже смотрят на совместимость лицензий и внутренний legal review. Ars Technica и InfoQ отдельно подчеркнули именно лицензионный и agentic‑аспект релиза, что здесь важно не как «истина вместо официального источника», а как показатель того, что рынок прочитал запуск прежде всего как developer‑friendly legal opening, а не просто как увеличение качества open weights.
Сравнение актуальных модельных поверхностей и режимов доступа
- Gemini API / Google AI Studio — Самый быстрый доступ к Gemini‑моделям, built‑in tools, AI Studio billing/spend caps. Где лучше использовать: Прототипы, consumer‑oriented apps, быстрые эксперименты. Статус и комментарий: В 2026 получил Flex/Priority tiers, project spend caps, обновленные usage tiers, tools+functions combo.
- Vertex AI — Enterprise‑grade access к Gemini и partner models, RAG, eval, governance. Где лучше использовать: Корпоративные приложения, гибридный MLOps, compliance. Статус и комментарий: В 2026 важны Vector Search 2.0, partner model evaluations, RAG Engine Serverless.
- Open Gemma 4 — Open‑weight reasoning/agentic models. Где лучше использовать: On‑device, self‑hosting, кастомный inference stack. Статус и комментарий: Apache 2.0 — важный юридический плюс.
- Gemini in GitHub Copilot — Consumption Google models в существующем Copilot UX. Где лучше использовать: Команды, уже стандартизированные на Copilot. Статус и комментарий: Gemini 3.1 Pro public preview; Gemini 3 Pro deprecated.
- Gemini in CLI / IDE / Android Studio / Antigravity — Прямой developer UX поверх Gemini 3.1 Pro. Где лучше использовать: Coding, prototyping, agentic research. Статус и комментарий: Доступность в нескольких surfaces подтверждена официально.
Сравнение цен и inference‑режимов
Все цены ниже — в USD и по состоянию на просмотр official pricing pages в апреле 2026 года. Практически важнее не абсолютные числа, а сам принцип: Google теперь явно предлагает cost lanes — Standard, Priority и Flex/Batch.
- Gemini 3.1 Pro в Vertex AI: Standard — Input: $2 / 1M токенов, Output: $12 / 1M; long context дороже; Priority — Input: $3.6 / 1M, Output: $21.6 / 1M; Flex / Batch — Input: $1 / 1M, Output: $6 / 1M. Практический смысл: Один и тот же модельный класс можно разводить по SLA/cost path.
- Gemini 3.1 Flash‑Lite в Vertex AI: Standard — Input: $0.25 / 1M, Output: $1.50 / 1M; Priority — Input: $0.45 / 1M, Output: $2.7 / 1M; Flex / Batch — Input: $0.13 / 1M, Output: $0.75 / 1M. Практический смысл: Хороший high‑volume tier для moderation, translation, UI generation, middleware‑tasks.
- Gemini Developer API spend tiers: Standard — Free / Tier 1 / Tier 2 / Tier 3; Priority — Не inference tier, а billing qualification. Практический смысл: Упростился переход от hobby/prototype к production spend.
- AI Studio / Gemini API data use: Standard — Бесплатный/неоплаченный контур может участвовать в product improvement при opt‑in на datasets; paid tier — без product improvement по pricing rows. Практический смысл: Критично для privacy‑sensitive приложений.
- Google Developer Program credits: Standard — $45 / user / month; $10 c Google AI Pro; $100 c Google AI Ultra. Практический смысл: Удобно для индивидуальных разработчиков и small teams, но не заменяет enterprise procurement.
С практической стороны Google в 2026 наконец делает то, что в 2025 было неполным: явно разделяет режимы latency/cost/quality, а не только модели. Это сближает Gemini‑стек с enterprise‑реальностью, где одна и та же система почти всегда требует как минимум одного «дорогого reasoning‑path» и одного «дешевого throughput‑path».
Жизненный цикл моделей и миграции
У 2026 есть еще одна важная особенность: Google заметно активнее ведет lifecycle management. По официальным release notes Gemini API, Gemini 3 Pro Preview был shut down 9 марта 2026 года и alias переведен на Gemini 3.1 Pro Preview. По release notes Vertex AI retirement dates семейства Gemini 2.5 Pro / Flash / Flash‑Lite обновлены на 16 октября 2026 года. Кроме того, Vertex уже рекомендует мигрировать image/video endpoints до 30 июня 2026 года: старые Imagen/Veo endpoints заменяются на gemini-2.5-flash-image и Veo 3.1‑линии. Это делает pinning model versions и ведение explicit migration backlog уже не best practice, а обязательной дисциплиной.
Vertex AI, MLOps, DevOps, security и compliance
Если смотреть именно на платформу, а не на отдельные модели, в 2026 у Google наиболее интересна эволюция Vertex AI в сторону knowledge‑centric, serverless, governable agent platform. Vector Search 2.0 стал GA и позиционируется как retrieval engine / knowledge core для AI‑приложений. Он объединяет collections, auto‑embeddings, hybrid search, встроенный semantic re‑ranking и поддерживает PSC / PGA / VPC Service Controls. Это не просто «еще один vector DB update»; это попытка превратить retrieval в native enterprise primitive внутри Vertex‑стека.
Второй сильный сдвиг — RAG Engine Serverless. Выпуск serverless‑режима в preview говорит о том, что Google понял базовую проблему корпоративного RAG: многим командам не нужен отдельный dedicated database path ради первого production launch. Возможность абстрагировать provisioning и scaling БД, но при желании переключаться в Spanner mode, — это именно инженерный компромисс между «быстро запуститься» и «позже изолировать и контролировать». Для adoption это, вероятно, одна из самых практичных 2026‑новинок Vertex.
В MLOps‑контуре важно и то, что Gen AI evaluation service теперь поддерживает partner models, а не только собственные модели Google. Это существенный enterprise‑сигнал: Google не заставляет держать quality gate только внутри своей модельной линейки. В связке с официальными рекомендациями по continuous evaluation, где в одном контуре фигурируют Vertex AI Evaluation, Cloud Build и Cloud Trace, получается более зрелое представление о GenAI‑SDLC: quality firewall в CI/CD, наблюдаемость полного request lifecycle и managed evaluation прямо в cloud‑stack.
Сам Cloud Build в 2026 получил не революционные AI‑фичи, а полезные инженерные улучшения: загрузку generic artifacts в generic repositories, загрузку OCI images в Artifact Registry прямо из build step, а также поправку конкретной CVE в марте. Это не «AI feature launch» в узком смысле, но для production‑команд это как раз тот тип обновлений, который определяет, насколько реально удобно встроить AI‑артефакты, модели, container images и inference‑сервисы в существующий supply chain.
Vertex AI Workbench в 2026 тоже сделал важный разворот. С одной стороны, он получает Gemini CLI и обновления базового образа: Debian 12, Python 3.12, Micromamba. С другой — официальный image 26.03 удаляет встроенную поддержку TensorFlow и PyTorch frameworks из стандартных Workbench images. Это критично для migration planning: если ваша команда рассчитывала на «толстый» предустановленный notebook‑образ, придется либо собирать свои environments, либо переходить на более explicit env management. Для платформенных инженеров это почти наверняка означает пересмотр golden images и bootstrap‑scripts.
В agent governance Google продолжает строить поверх Vertex AI Agent Builder и примыкающих сервисов. В конце 2025 были анонсированы Sessions/Memory и enhanced tool governance через Cloud API Registry, а в 2026 эта логика уже явно прорастает в blog‑материалах и интеграциях: Agent Engine, Memory Bank, Sessions, governance tools, MCP servers и partner models подаются как единый контур. Для enterprise adoption это значит, что Google все меньше продает «модель + prompt» и все больше продает управляемый жизненный цикл агента.
По блоку security / privacy / compliance 2026 выглядит убедительно, хотя и несколько фрагментарно. Для Gemini API docs фиксируют, что для billing‑enabled projects prompts и responses в логах по умолчанию не используются для product improvement или development; opt‑in sharing идет отдельным путем через logs/datasets. Одновременно abuse monitoring удерживает часть данных 55 дней исключительно для policy enforcement и explicitly говорит, что эти данные не используются для train/fine‑tune моделей, кроме policy enforcement‑систем. На стороне Google Cloud compliance‑surface в 2026 включает отдельную страницу по EU AI Act, а страница ISO/IEC 42001 указывает, что в scope сертификата входят, среди прочего, Generative AI on Vertex AI, Vertex AI Platform и Vertex AI Search.
Отдельным практическим слоем безопасности становится Model Armor. В reviewed 2026 sources Google показывает его как inline‑защиту против prompt injection, malicious URIs, dangerous content и утечек при использовании MCP‑server’ов и AI inference на GKE. Это важно потому, что security‑story Google в 2026 строится уже не только вокруг model safety filters, а вокруг gateway‑level enforcement для agentic systems. Для regulated и internet‑facing workloads это, вероятно, минимальный разумный baseline.
Что изменилось в инфраструктурном ML‑стеке
По TensorFlow, JAX, TFX и смежному compute‑стеку картина в 2026 неоднородна. TensorFlow 2.21 сам по себе важен, но не потому, что приносит radical new training abstractions; напротив, он показывает сдвиг в фокусе. Главное в релизе — это окончательное выведение LiteRT в production stack, boost до 1.4x faster GPU performance относительно TFLite, появление NPU‑акселерации и мосты к PyTorch/JAX conversion. При этом Google прямо пишет, что для нового work in Generative AI стоит смотреть на Keras 3, JAX и PyTorch, а по экосистеме TensorFlow/TFX акцент смещается на security fixes, bug fixes и dependency updates. Для TFX это очень важный сигнал: в 2026 он выглядит как mature maintenance layer, а не как растущий innovation frontier.
По JAX Google, напротив, продолжает инвестировать и в tooling, и в релизный темп. Changelog показывает релизы 0.9.0, 0.9.1, 0.9.2 и 0.10.0 уже к середине апреля 2026 года; из заметных точечных additions — jax.thread_guard() для multi‑controller JAX, улучшения CPU parallelization и другие низкоуровневые доработки. Но гораздо важнее, что JAX остается центральной осью TPU‑first dev‑story: отдельный январский гайд по debugging/profiling на Cloud TPU, а также апрельский MaxText‑апдейт с SFT и RL на single‑host TPU показывают, что Google по‑прежнему видит JAX как serious framework для LLM post‑training и high‑performance training pipelines.
Интересно, что одновременно Google открывает TPU‑контур и для PyTorch‑мира через TorchTPU. Это один из самых стратегически важных инфраструктурных жестов 2026 года: вместо требования «если хотите TPU — идите в JAX/XLA глубже» Google начинает предлагать путь, где PyTorch‑команды могут мигрировать с минимальными code changes. В сочетании с LiteRT на edge и JAX на training‑стороне это выглядит как попытка охватить сразу on‑device, PyTorch inference/training portability и TPU‑native research stack.
Для полноты картины нужно отметить и то, чего я не нашел. В reviewed primary sources за период с января по 17 апреля 2026 года не видно крупных самостоятельных анонсов по Vertex Feature Store или Vertex data labeling, сопоставимых по масштабу с Vector Search 2.0 или RAG Engine Serverless. Это не означает, что эти компоненты исчезли; это означает, что в 2026 Google явно делает ставку на retrieval, agents, cost tiers, security и open model consumption, а не на расширение messaging вокруг feature‑store/data‑labeling направления. Детали сверх этого в опубликованных источниках не указаны.
Сравнение с 2025
В 2025 году Google построил каркас: Agent Engine, ADK, A2A, Gemini CLI, Gemini 3, ранний agentic surface в IDE, а также доступность Gemini в GitHub Copilot и других инструментах. Именно 2025 создал ожидание, что Google всерьез идет в сторону «developer‑as‑agent‑orchestrator». В 2026 этот каркас не ломают и не переименовывают — его дошлифовывают до инженерной пригодности. Это хороший знак: значит, команда не мечется между стратегиями.
Если перевести разницу на язык платформенной зрелости, то 2025 был годом foundational launches, а 2026 стал годом controlled adoption. Это видно по пяти линиям:
- Модели. Gemini 3 / Gemini CLI / ранние agentic promises. Gemini 3.1 Pro, Flash‑Lite, embeddings 2, TTS, live audio, management of lifecycle. Сдвиг от «впечатляющих capability launches» к portfolio management.
- SDK / API. GenAI SDK достиг GA в 2025; legacy еще жив по инерции. Миграция становится фактической нормой. API‑surface стабилизируется вокруг одного SDK.
- Agent tooling. ADK/A2A/Agent Engine как концепт и ранняя платформа. Java/Go 1.0, skills, governance, MCP tooling. Агентный стек становится корпоративно внедряемым.
- IDE / CLI. Agent Mode и Gemini CLI появились как сильная новинка. Hooks, plan mode, subagents, daily UX polishing. Google делает ставку на workflow‑oriented tooling.
- Open models / edge. LiteRT был previewed, Gemma‑линия продолжала расти. LiteRT production, Gemma 4 на Apache 2.0. Open/edge‑story становится серьезнее и юридически проще.
Это сравнение важно не только ради исторической рамки. Оно подсказывает, что Google сейчас движется эволюционно, а не «рывками через переписывание платформы». Для команд‑покупателей и платформенных инженеров это обычно хороший признак: риск того, что ставка на стек устареет за квартал, здесь ниже, чем год назад. Это, конечно, не гарантия; это аналитическая оценка по траектории анонсов.
Практические рекомендации для команд
Ниже — практическая схема, которая лучше всего соответствует наблюдаемой стратегии Google в 2026: IDE/CLI на входе, единый SDK/ADK‑слой посередине, а на проде — выбор между lightweight Gemini API и более тяжелым governance‑first Vertex AI. Эта схема следует из официальных SDK/docs, release notes и MLOps/security guidance.
Что делать сейчас
Для новых приложений я бы рекомендовал начинать с Google GenAI SDK и сразу фиксировать specific model versions, а не использовать “latest” aliases в production. Причина проста: Google в 2026 активно двигает lifecycle management и deprecations; одна из главных инженерных ошибок здесь — строить систему на плавающем alias без migration playbook.
Для агентных систем, особенно если нужен tool orchestration, human‑in‑the‑loop или long‑running workflow, ставка на ADK выглядит оправданной. Если стек команды — Python/TS, порог входа ниже; если стек тяжелый enterprise‑backend, 2026 впервые сделал разумной ставку и на Java или Go. Особенно сильный аргумент в пользу ADK — то, что skills, plugins, state management и tracing уже обсуждаются Google как first‑class concepts, а не как пользовательские обходные паттерны.
Для малой команды или стартапа разумный путь — Gemini API / AI Studio как default, пока не появляются требования к governance, networking isolation, compliance mapping, managed RAG или partner model comparison. Для enterprise‑команды я бы начинал с Vertex AI почти по умолчанию, если система изначально будет жить в regulated или internal‑data‑heavy контуре. В 2026 разница между поверхностями стала даже больше, чем в 2025: AI Studio стала удобнее для быстрого старта, а Vertex — заметно сильнее в controlled deployment.
Для cost engineering я бы проектировал минимум две дорожки инференса: Standard/Pro для тяжелого reasoning и Flash‑Lite + Flex для массовых, latency‑tolerant либо middleware‑задач. В 2026 Google фактически сам рекомендует такой дизайн ценовой архитектурой. Использовать одну дорогую модель везде — теперь уже не просто неэкономично, а стратегически неверно, потому что платформа явно предоставляет более рациональные альтернативы.
Для миграций минимальный обязательный backlog на 2026 год выглядит так:
- Legacy Gemini client libraries → Google GenAI SDK. Почему: Новые функции идут только в GenAI SDK. Что делать: Переписать entry points на Client‑архитектуру. Срочность: Срочно для всех активных проектов.
- Gemini 3 Pro Preview → Gemini 3.1 Pro Preview. Почему: Gemini 3 Pro shut down. Что делать: Обновить model IDs и regression suite. Срочность: Уже обязательно.
- Gemini 2.5 family workloads. Почему: Retirement dates обновлены. Что делать: Подготовить migration plan на 3.1 family. Срочность: До 16 окт. 2026.
- Imagen/Veo legacy endpoints. Почему: Deprecated endpoints. Что делать: Перейти на gemini-2.5-flash-image и Veo 3.1. Срочность: До 30 июня 2026.
- TFLite naming / edge stack → LiteRT. Почему: Production focus moved. Что делать: Обновить docs, tooling, conversion path. Срочность: Высокий приоритет для edge teams.
- Workbench prebuilt TF/PyTorch assumptions. Почему: Frameworks removed from image 26.03. Что делать: Пересобрать dev images / env bootstrap. Срочность: Высокий приоритет для notebook teams.
- GitHub Copilot model policy. Почему: Gemini 3 Pro deprecated in Copilot. Что делать: Включить/разрешить Gemini 3.1 Pro policies. Срочность: Срочно для Copilot org admins.
Кому что подходит
Если у команды основной pain point — время от идеи до working prototype, лучший стек Google в 2026 — это Gemini API + GenAI SDK + Gemini CLI + AI Studio. Если основной pain point — контроль, аудит, сетевые политики, мульти‑модельность и внутренняя data plane, тогда выигрывает Vertex AI + ADK + Vector Search/RAG + Cloud Build/Evaluation + Model Armor. Если главный pain point — самостоятельный хостинг и legal simplicity, то в 2026 впервые по‑настоящему интересно смотреть на Gemma 4 благодаря Apache 2.0 и более зрелому open‑model positioning.
Вывод
В сумме картина 2026 для разработчиков выглядит так: Google не просто наращивает мощность моделей, а достраивает вокруг них инженерную операционную систему. Самые важные практические изменения — это не только Gemini 3.1 как таковой, а переход к единому SDK, рост значения CLI/ADK/MCP, явное разделение cost tiers, более зрелый Vertex knowledge plane, и усиление security/compliance scaffolding. Если в 2025 можно было еще спорить, является ли агентный стек Google ранним экспериментом, то в 2026 ответ уже скорее отрицательный: это полноценная, многослойная платформа, которую теперь нужно оценивать как платформу — с миграциями, governance, ценовой архитектурой и эксплуатационными компромиссами, а не как набор разрозненных AI‑демо.
---
Не, ну если дочитал - реально загляни в канал, я в чат приму за подписку))