31 подписчик

Новая фаза AI: «мир кода», экономика оценок и момент Nano Banana

2 октября 20252 окт 2025

5 мин

Последние недели показали, что развитие крупных моделей идёт по нескольким взаимосвязанным трекам — от углублённого понимания кода (Meta – запрещённой в России) и измерения реальной экономической полезности (OpenAI) до срывного пользовательского опыта, который взбил рынок изображений (Google Nano Banana). Эти события вместе формируют не просто технические обновления, а новый набор ожиданий для разработчиков, продуктовиков и бизнеса — где модели становятся «агентами», оценка смещается к GDP‑величинам, а вертикальные приложения получают как угрозы, так и новые шансы. Разберём по ключевым тезисам и выведем практические выводы. 1) Meta (запрещённая в России) CWM — модель, которая «видит» выполнение кода Meta FAIR открыла Code World Model (CWM): LLM на 32B параметров с поддержкой сверхдлинного контекста (до 131k токенов). Главная идея — перейти от «код как текст» к «код как мир»: обучать модель на execution traces и агентных траекториях (редактирование, запуск тестов, правка багов), чтобы о

Эти события вместе формируют не просто технические обновления, а новый набор ожиданий для разработчиков, продуктовиков и бизнеса — где модели становятся «агентами», оценка смещается к GDP‑величинам, а вертикальные приложения получают как угрозы, так и новые шансы. Разберём по ключевым тезисам и выведем практические выводы.

1) Meta (запрещённая в России) CWM — модель, которая «видит» выполнение кода

Meta FAIR открыла Code World Model (CWM): LLM на 32B параметров с поддержкой сверхдлинного контекста (до 131k токенов). Главная идея — перейти от «код как текст» к «код как мир»: обучать модель на execution traces и агентных траекториях (редактирование, запуск тестов, правка багов), чтобы она могла симулировать исполнение, предсказывать состояние переменных и самостоятельно находить, и исправлять ошибки.

Почему это важно:

Переход от генерации к имитации исполнения повышает пригодность кода для практического запуска и отладки.
Агентная подготовка позволяет модели работать как «электронный программист» — не только предлагать строку, но и делать правки в репозитории, запускать тесты и итеративно добиваться прохода тестов.
Open‑weights релиз и чекпоинты (mid‑training, SFT, RL) ускоряют воспроизводимость и исследования.

Риски и ограничения: 32B—модель требует ресурсов; форматологические шумы agentic‑тренировок нужно аккуратно фильтровать; ещё мало понятно, как модель будет вести себя в мультиъязычных и комплексных enterprise‑стэках.

Практический вывод: команды разработки должны тестировать CWM‑подобные модели в CI‑цепочках как ассистента — на этапе локальной валидации и баг‑фиксов, а не как «готового разработчика». Интеграция в workflow (PR → тест → фиксы) — ключ.

2) OpenAI GDPval — измеряем влияние AI на экономику, а не только на бенчмарки

OpenAI представила GDPval — набор реальных рабочих задач (1 320 задач, «золотой» поднабор из 220 задач), покрывающих 9 отраслей и 44 профессии, суммарная годовая экономическая ценность которых оценивается в ~$3 трлн.

В слепых тестах Claude Opus 4.1 и GPT‑5 показали, что в ~половине кейсов модели могут выдавать результат «на уровне эксперта»; при этом модели на выводе работают быстрее и дешевле (по вычислительным затратам) — порядка 1% от затрат человека.

Почему это значимо:

GDPval переводит разговор с «может ли модель сдать экзамен» на «может ли модель выполнять конкретную рабочую задачу и генерировать экономическую ценность».
Ранние результаты подтверждают стратегию «AI сначала — человек потом» для типовых, структурированных задач.

Риски и ограничения: расчёты учитывают только inference‑затраты, не учитывают валидацию, интеграцию, ответственность и соответствие регуляциям. Массовая автоматизация потребует организационных изменений и программ переквалификации.

Практический вывод: компании должны строить стратегии «человек+AI» — от автоматизации рутинных итераций до перенаправления человеческих ресурсов на творческие и надзорные роли. Инвесторам интересны решения, которые не просто экономят время, а увеличивают доходность клиента.

3) Google Nano Banana — живой пример «GPT‑момента» для изображений

Nano Banana (Gemini App) показал, как продукт с выдающимся UX и качеством восприятия может в считанные дни привлечь сотни миллионов изображений и миллионы пользователей. Ключ — диалоговая, интерактивная генерация, встроенная «мировая» семантика модели и высокая скорость отклика: создание образа перестаёт быть серией проб и ошибок и становится реальным творческим диалогом.

Почему это волнует вертикальные приложения:

Универсальные модели могут быстро «съесть» пользовательский спрос за счёт лучшего UX и «достаточно хороших» результатов.
Однако вертикальные сервисы (как Meitu) всё ещё обладают «последней милей» — глубоким пониманием нишевых задач, данных, бизнес‑процессов и монетизации (B2B‑интеграции, e‑commerce).

Практический вывод: вертикали должны перестать воевать с большими моделями в поле «чему лучше генерация» и стать «переводчиками сценария» — встраивать сильные универсальные модели в собственные сценарии (примеры: AI‑примерки, коммерческая фотосъёмка, товарная вёрстка), фокусируясь на пользовательской ценности и платёжном продукте.

4) Общая картина и что делать сейчас

Тренд: модели приобретают agentic и world‑model свойства → они переходят от ассистентов к операторам в процессе (код, дизайн, рабочие задачи).
Экономика: GDP‑ориентированные оценки ускорят внедрение, но масштаб потребует стандартов валидации и управления рисками.
Горизонт возможностей: вертикальные компании не обязательно обречены — их шанс в глубокой связке «универсальная модель + вертикальное ноу‑хау + UX/интеграция».

Рекомендации:

Инжинирить AI‑workflow: интегрируйте модели в CI/CD, в процессы валидации и human‑in‑the‑loop.
Делайте «платёжные» фичи: монетизируйте сценарии, где AI реально повышает доход.
Защитите данные и доверие: в отрасли, где данные чувствительны, будьте прозрачны в обработке и валидации.
Тестируйте новые интерфейсы: живой диалог (как Nano Banana) и агентная работа (как CWM) задают новые UX‑стандарты.

Заключение
Мы движемся к эре, где модели не только генерируют, но и действуют, измеряются по вкладу в GDP и конкурируют не только технологией, но и продуктовым опытом. Кто успеет соединить мощь больших моделей с реальным знанием сцен и хорошим UX — тот получит преимущество.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/