Найти в Дзене
Цифровая Переплавка

⚖️ Почему разработчики выбирают старые модели ИИ — и что это говорит о будущем ИИ-инженерии

На первый взгляд это парадокс: новые модели всё мощнее, умнее и “человечнее” — а разработчики массово возвращаются к старым версиям. Но именно это показал свежий анализ Augment Code, изучивший 3,5 миллиарда токенов взаимодействий между инженерами и языковыми моделями. Результат оказался неожиданным: в октябре 2025 года доля Sonnet 4.5 упала с 66 % до 52 %, а Sonnet 4.0 выросла с 23 % до 37 %. Причина? Разработчики больше не верят в концепцию «одной лучшей модели». Теперь они выбирают не “самую новую”, а “под конкретную задачу”. Раньше логика была проста: новая версия = апгрейд.
Теперь всё иначе — Sonnet 4.0 и 4.5 сосуществуют как два разных класса инструментов: 🧠 Sonnet 4.5 — для глубоких размышлений, рефакторинга, проектирования и сложного планирования.
⚡ Sonnet 4.0 — для быстрых структурированных правок и стабильной автоматизации.
📚 GPT-5 — для объяснений, документации и смешанных задач “код + текст”. Каждая из моделей нашла свою нишу — словно в экосистеме микросервисов, где каждый
Оглавление

На первый взгляд это парадокс: новые модели всё мощнее, умнее и “человечнее” — а разработчики массово возвращаются к старым версиям. Но именно это показал свежий анализ Augment Code, изучивший 3,5 миллиарда токенов взаимодействий между инженерами и языковыми моделями.

Результат оказался неожиданным: в октябре 2025 года доля Sonnet 4.5 упала с 66 % до 52 %, а Sonnet 4.0 выросла с 23 % до 37 %. Причина? Разработчики больше не верят в концепцию «одной лучшей модели». Теперь они выбирают не “самую новую”, а “под конкретную задачу”.

🧩 Модели становятся не поколениями, а “инструментами”

Раньше логика была проста: новая версия = апгрейд.
Теперь всё иначе —
Sonnet 4.0 и 4.5 сосуществуют как два разных класса инструментов:

🧠 Sonnet 4.5 — для глубоких размышлений, рефакторинга, проектирования и сложного планирования.
Sonnet 4.0 — для быстрых структурированных правок и стабильной автоматизации.
📚
GPT-5 — для объяснений, документации и смешанных задач “код + текст”.

Каждая из моделей нашла свою нишу — словно в экосистеме микросервисов, где каждый компонент делает своё дело идеально, но не универсально.

🔬 Технический разбор: рассуждения против скорости

Sonnet 4.5 делает на 37 % больше токенов в ответ, но на 20 % меньше инструментальных вызовов (12,3 против 15,7 у 4.0).
Это значит, что она дольше “думает”, прежде чем действовать, и генерирует более сложные цепочки рассуждений.

💭 То, что раньше казалось «задумчивостью модели», оказалось стратегией:
4.5 выстраивает длинную внутреннюю логику, тогда как 4.0 действует мгновенно и шаблонно — что важно для автоматических пайплайнов CI/CD или кодогенерации API.

Однако у медитации есть цена: Sonnet 4.5 читает из кэша почти вдвое больше данных (240 млрд против 135 млрд у 4.0), из-за чего возрастает латентность. В реальном продакшене это чувствуется: при многопоточном анализе или использовании в IDE задержки на секунды превращаются в потерю контекста.

🧮 Токен-экономика и “стоимость мышления”

Когда мы говорим, что модель “умнее”, мы часто забываем — она также дороже в вычислениях.
4.5 тратит больше ресурсов на:

  • 🔁 чтение контекста из кэша,
  • 📚 хранение длинных цепочек reasoning,
  • 🧱 многослойные структуры запросов и ответов.

Эти процессы не видны пользователю напрямую, но влияют на производительность (throughput): чем глубже модель размышляет, тем медленнее она отдаёт результат.
Всё чаще инженеры предпочитают не “глубину мысли”, а
детерминизм и предсказуемость.

🧠 Специализация вместо гонки вооружений

Похоже, эпоха “самой сильной модели” подходит к концу.
ИИ-индустрия повторяет путь баз данных: когда-то все использовали SQL, потом появились NoSQL, time-series и графовые хранилища. Теперь то же самое происходит с моделями:

🧊 Sonnet 4.5 — аналог OLAP-систем: глубоко анализирует, но медленна.
⚙️
Sonnet 4.0 — как Redis: быстрая, простая, надёжная.
🪶
GPT-5 — как документационный движок, где важна ясность и контекст.

Разработчики начали собирать ансамбли моделей — пайплайна (pipelines), где каждая отвечает за свою стадию: одна пишет код, другая объясняет, третья проверяет. Это не деградация, а эволюция в сторону архитектуры “ИИ-оркестрации”, где вместо одной «всесильной модели» работают специализированные агенты.

💬 Моё мнение: зрелость рынка наступила

Я вижу в этих данных не отказ от прогресса, а переход от восторга к инженерии.
В 2023-2024 все гонялись за “самой новой LLM”, но теперь разработчики поняли: производительность, детерминизм и стоимость токенов не менее важны, чем «разумность» модели.

🔥 Настоящая революция — не в создании ещё одной модели, а в осознанном комбинировании уже существующих.
Появление ансамблей моделей (
model-ensembles) — это тот же путь, что прошёл DevOps, когда “один сервер” превратился в микросервисы с оркестрацией и мониторингом.

ИИ-инженерия наконец становится инженерией — с метриками, нагрузочным тестированием и пониманием компромиссов.

📚 Источники и ссылки:

🧩 Не все новые модели лучше старых. Но впервые за долгое время — это не баг, а признак зрелости отрасли.