16 подписчиков

Война моделей: кто доведёт проект до запуска без рук

17 октября 202517 окт 2025

6 мин

Привет, это Ринат. Anthropic внезапно выкатили Claude 4 в двух версиях, Sonnet и Opus. На первый взгляд всё красиво, но бизнесу и разработчикам важны не таблицы, а то, как модель ведёт себя под нагрузкой. Не в учебном примере, а в реальной работе, где нужно собрать игру, отладить браузер и довести всё до состояния, которое открывается, запускается и делает своё дело. Ниже — полевые испытания и выводы, которые помогут понять, где уже можно опираться на ИИ, а где всё ещё нужен аккуратный человеческий штурман. Подход простой. Одной модели — один большой запрос на целый проект. Если что-то ломается, у модели есть несколько попыток починить конкретные ошибки. Мы оцениваем не красоту ответа, а рабочий результат. Приложение либо ставится на телефон и снимает, либо нет. Плагин либо звучит, либо крашит хост. Файл для монтажа либо импортируется и даёт полезную разметку, либо превращается в пустую оболочку. Инструменты для работы доступны, но лишних подсказок нет. Идея в том, чтобы проверить спо

Оглавление

Как проверял и по каким правилам
Doom в браузере как «крестик на карте»
Вторая игра, но уже с онлайном

Как проверял и по каким правилам

Подход простой. Одной модели — один большой запрос на целый проект. Если что-то ломается, у модели есть несколько попыток починить конкретные ошибки. Мы оцениваем не красоту ответа, а рабочий результат. Приложение либо ставится на телефон и снимает, либо нет. Плагин либо звучит, либо крашит хост. Файл для монтажа либо импортируется и даёт полезную разметку, либо превращается в пустую оболочку. Инструменты для работы доступны, но лишних подсказок нет. Идея в том, чтобы проверить способность модели следовать плану и доводить задачу до финиша.

Doom в браузере как «крестик на карте»

Кто писал игры под веб, знает, насколько легко утонуть в сборках, путях и шрифтах, которые внезапно не грузятся. Здесь характер моделей проявился быстро. Часть пыталась бесконечно искать готовые порты, путалась в архивах и запуске сервера. Часть честно писала с нуля и сама проверяла результат в браузере. Sonnet 4 собрал рабочую версию, заметил, что картинка темновата, и сам поправил освещение. Opus пошёл ещё смелее и построил шутер на чистом canvas, без тяжёлых библиотек. Остальные чаще спотыкались на мелочах, теряли контекст, забывали, что у них есть инструменты, и зависали в полумерах. Главный вывод простой. Способность самопроверки и умение удерживать «цепочку действий» важнее, чем запас готовых фрагментов кода.

Вторая игра, но уже с онлайном

Тут всплывает то, что редко видно на игрушечных примерах. Нужно не только вывести спрайты, но и синхронизировать состояние между игроками, разобраться с комнатами и задержками, не заморозить браузер. Часть моделей уверенно стартовала, но забывала поднять сервер и просила «сделайте сами». Часть доводила до игрового поля, но ломала стрельбу и поведение юнитов. Лучшие сделали подключение, стрельбу и базовую синхронизацию, пусть и с шероховатой оптимизацией. Интересная деталь. Когда в запросе явно прописаны разрешённые инструменты и критерии готовности, сильные модели почти не отвлекаются на лишнее и двигаются ровно по рельсам.

Генератор анимированных диаграмм

Задача полезная в продакшене. На вход — текст, на выход — анимация с блоками, стрелками и подписями, которую можно подстроить по таймингам. Здесь вылезли две вещи. Во-первых, моделям по-прежнему непросто держать длинную историю изменений в одном диалоге, особенно если проект растёт. Во-вторых, не все аккуратно работают с графическими библиотеками и слоями. В результате часть дошла до рабочего каркаса, но без нормальных ключевых кадров. Часть утонула в ошибках сборки. Вывод очевиден. Для сложной визуалки лучше разбивать путь на маленькие ступени, фиксировать успехи и только потом склеивать в единое полотно.

Автогенерация субтитров для видео, чистый бэкенд

Полезная труба для контент-потока. Авторизация, очередь задач, распознавание речи, сборка субтитров по фразам. Здесь видно, кто умеет поднимать сервис «под ключ». Лучшие спокойно прошли авторизацию, правильно разложили асинхронные статусы, собрали субтитры с адекватной синхронизацией и не превратили весь текст в один гигантский блок. Слабые споткнулись об зависимости, путались в переменных окружения и ломали обработку на середине. Это про дисциплину, а не про вдохновение. Если в запросе есть чёткая схема потока и формат ответа, сильная модель доводит до результата. Без схемы начинается импровизация.

Фронтенд баги: ластик, цвета, слои

Самый частый класс задач в реальной жизни. Вроде пустяк, а ощущения от продукта портит. Ластик рисует чёрным, а не стирает. Цвет обводки меняется, но не всегда. Слои есть, но порядок не двигается. Большинство моделей закрыли первые две проблемы. С третьей, где нужно аккуратно обновлять состояние и перерисовывать канвас, справиться оказалось сложнее. Даже с доступом к браузерной проверке. Локальный вывод. Для таких задач помогает минимальный «репро»: одна кнопка, один модуль, один эффект. Чем меньше поле, тем выше шанс, что ИИ попадёт точно в цель.

Моделирование в Blender: «панелька» на скорую руку

Здесь проверяется не код, а пространственное чувство. Надо удержать пропорции, не уронить геометрию и не «подвесить» окна в воздухе. Часть моделей дала ровный силуэт с читаемыми окнами и балконами. Часть потеряла соотношения и насыпала лишних деталей. В практическом смысле этого уже хватает для быстрых превью. Дальше руками или скриптом всё довести до аккуратного состояния.

Что всё это значит для работы и денег

Первое. Модели взрослеют. Они лучше держат план, спокойнее проходят рутину и чаще замечают собственные ошибки. Но магии нет. Без вашей режиссуры они легко уходят в сторону. Секрет успеха в ясных границах. В запросе должно быть понятно, что считается готовностью, какие инструменты разрешены, какие шаги критичны.

Второе. Стабильность важнее «вау-эпизодов». Модель, которая три раза подряд довела проект до рабочего состояния, ценнее, чем та, что один раз ослепила демкой, а потом не повторила. Бизнес любит повторяемость. В продакшене выиграет не самая блестящая, а самая предсказуемая связка.

Третье. Не отдавайте в ИИ то, что сами не видите хотя бы на уровне блок-схемы. Если вы понимаете входы, выходы и промежуточные состояния, модель добежит быстро. Если нет, она начнёт «придумывать» и уводить вас в лишние ветки.

Четвёртое. Лучшая стратегия — короткие фазы с фиксацией результата. Маленькая победа, коммит, метка, дальше следующий шаг. В такой ритм хорошо ложатся и игры, и бэкенды, и браузерные редакторы, и конвейеры для контента.

Кому это даст эффект уже сейчас

Создателям контента, у кого скорость напрямую бьёт в охват. Малому бизнесу и студиям, где накопился технический долг, а правки давят на спринт. Фрилансерам, которые берут разношёрстные заказы и не могут позволить себе «копать месяц». Предпринимателям, кому нужен живой прототип, который можно показать клиенту и обсудить деньгами. Везде работает один и тот же рецепт. Внятная цель, небольшой шаг, проверяемый результат. Повторить.

Короткие выводы по моделям

Sonnet 4 и Opus уверенно держат сложные сценарии, лучше остальных следуют инструкциям и сами себя проверяют. Старые версии ведут себя стабильнее в простых задачах, но чаще теряются в длинной цепочке действий. Модели конкурентов годятся для небольших проектов и правок, однако любят забывать контекст и капризны в работе с инструментами. Если сидите на предыдущих версиях, переход на новый Sonnet выглядит оправданно уже из-за предсказуемости и лучшего поведения в больших запросах.

ИИ перестал быть «фокусом ради фокуса». Он стал инструментом, который снимает рутину и ускоряет путь от замысла до работающего продукта. Ваша роль — ставить чёткие цели, держать рамки и переводить единичные успехи в повторяемый процесс. Тогда вы растёте не в теории, а в реальном выхлопе.

Если всё, что ты сейчас прочитал, зацепило — тебе важно идти дальше

Тебя ждет бесплатынй закрытый урок с полной схемой, как выйти на стабильные 200 000 ₽+ через AI-ботов -> https://clck.ru/3PnSfr
Это не «волшебная кнопка», но если сделаешь, как показано, первые результаты могут прийти уже через пару недель. Но урок в открытом доступе не останется, потом просто не будет шанса зайти с таким разбором.

Подробнее про рынок нейросетей рассказываю на своём YouTube-канале 👇
https://www.youtube.com/@RinatSuleyman