Добавить в корзинуПозвонить
Найти в Дзене
Цифровая Переплавка

📡 Когда кодирующие агенты перестанут напоминать dialup

В конце 90-х интернет через dialup-модем был настоящим чудом, но все помнят: долгий коннект, обрывы, и невозможность говорить по телефону одновременно с серфингом. Сегодня аналогичные ощущения вызывает работа с кодирующими ИИ-агентами. Они уже умеют помогать в разработке, но скорость и надёжность пока далеки от идеала. Статья Мартина Олдерсона What happens when coding agents stop feeling like dialup? проводит прямую параллель между dialup и современными ИИ-агентами. И эта аналогия куда глубже, чем кажется. Эксперименты с Cerebras Code показали впечатляющее: до 2000 токенов/сек. Это сравнимо с переходом от dialup к ADSL. Но высокая скорость порождает новые проблемы: То есть скорость перестанет быть ограничением — новым bottleneck станет человек, который должен осмыслить и принять решение. Я вижу, что агентная разработка проходит три стадии: Когда скорость перевалит за 1000–2000 токенов/сек, мы фактически получим “несколько джуниоров-стажёров”, работающих параллельно под надзором одного
Оглавление
Краткое описание: неоновая «до/после» сцена — слева ретро-телефон и улитка (dialup, 56k), справа ракета, шкала «2000 t/s», параллельные конвейеры кода и облако с ценником и часами — быстрые агенты, параллелизм и новые ценовые модели.
Краткое описание: неоновая «до/после» сцена — слева ретро-телефон и улитка (dialup, 56k), справа ракета, шкала «2000 t/s», параллельные конвейеры кода и облако с ценником и часами — быстрые агенты, параллелизм и новые ценовые модели.

В конце 90-х интернет через dialup-модем был настоящим чудом, но все помнят: долгий коннект, обрывы, и невозможность говорить по телефону одновременно с серфингом. Сегодня аналогичные ощущения вызывает работа с кодирующими ИИ-агентами. Они уже умеют помогать в разработке, но скорость и надёжность пока далеки от идеала.

Статья Мартина Олдерсона What happens when coding agents stop feeling like dialup? проводит прямую параллель между dialup и современными ИИ-агентами. И эта аналогия куда глубже, чем кажется.

🐢 Текущие ограничения

  • Скорость генерации — даже топовые модели сегодня выдают 30–60 токенов/сек. Для простого диалога достаточно, но для агентных workflow это узкое горлышко.
  • 🔄 Надёжность — Claude Code и аналоги часто “зависают” или требуют перезапуска, напоминая модем, который сбросил соединение из-за дождя.
  • 📈 Экспоненциальный рост нагрузки — агентные сценарии потребляют на порядок больше токенов, чем обычный чат. Инфраструктура крупных AI-компаний испытывает колоссальное давление.

⚡ Грядущее ускорение

Эксперименты с Cerebras Code показали впечатляющее: до 2000 токенов/сек. Это сравнимо с переходом от dialup к ADSL. Но высокая скорость порождает новые проблемы:

  • 💡 становится соблазнительно “принимать всё подряд”, не фильтруя,
  • 🔀 появляются сценарии параллельных запусков 5–10 вариантов решений задачи, где агент выбирает лучший.

То есть скорость перестанет быть ограничением — новым bottleneck станет человек, который должен осмыслить и принять решение.

🏗 Инфраструктурные вызовы

  • 🌐 Бесконечный цикл спроса: рост скорости → рост использования → рост нагрузки. В отличие от телекома 2000-х, где потребление стабилизировалось, здесь потолка пока не видно.
  • 🖥 Аппаратные лимиты: полупроводниковая индустрия больше не удваивает производительность каждые два года. Эффективность ограничена, и supply не поспевает.
  • 💵 Ценообразование: вероятно, появятся тарифы “вне пиковых часов”, batch-планы и другие способы сглаживания нагрузки.

🤔 Моё мнение

Я вижу, что агентная разработка проходит три стадии:

  • 📜 Q&A-ассистент (GPT-3.5) — много галлюцинаций, но полезно для подсказок.
  • 🛠 IDE-хелпер (GPT-4, Claude Code) — уверенно пишет сниппеты, под присмотром разработчика.
  • 🤖 Агент с параллельным поиском решений (эксперименты с быстрыми моделями) — даёт несколько вариантов, среди которых выбирается лучший.

Когда скорость перевалит за 1000–2000 токенов/сек, мы фактически получим “несколько джуниоров-стажёров”, работающих параллельно под надзором одного инженера. Это изменит саму роль программиста: он станет больше куратором и архитектором, чем “писателем кода”.

🔮 Будущее

  • 🧩 Новые IDE — появятся инструменты, где агент выполняет задачи параллельно, а разработчик лишь подтверждает результат.
  • 🌍 Гибкие тарифы — цены будут зависеть от времени суток и нагрузки дата-центров.
  • 🚀 Сдвиг компетенций — выиграют те, кто умеет грамотно формулировать “единицы работы” (см. концепцию slice of cake) и выстраивать pipeline с ИИ.

И как когда-то переход от dialup к широкополосному интернету изменил всю цифровую экономику, так и ускорение кодирующих агентов радикально перестроит индустрию разработки.

📚 Источник: