📰 Nace AI: гиперсети приходят на смену RAG и тонкой настройке — разбор третьего пути для AI-агентов

СегодняСегодня

2 мин

Корпоративные команды снова и снова наблюдают один и тот же фарс. AI-агент шикарно выступает на демо, попадает в продакшн — и встаёт колом: пару шагов делает, а потом требует человека, чтобы тот подлил контекста и проверил вывод. Обещанная эффективность утекает в бесконечный контроль. Агент сделал работу? Ха! Это вы за ним следили. Неудивительно, что большинство пилотов так и не становятся реальными системами. По ту сторону стены маячит та самая мечта, в которую хочет верить каждая команда: агент, который сам выполняет долгую задачу — хоть всю ночь, если надо, — а человеку остаётся лишь проверить последние 10%. Реально ли это? Упирается в проблему, которую разговоры об оркестрации обычно обходят стороной. Когда компания Chroma прогнала через 18 ведущих моделей, каждая теряла точность по мере роста входных данных. Это свойство механизма внимания, а не дыра, которую закроет более сильная модель. Агент, которого на ходу кормят всё новыми кусками вашего бизнеса, не становится устойчивее.

По ту сторону стены маячит та самая мечта, в которую хочет верить каждая команда: агент, который сам выполняет долгую задачу — хоть всю ночь, если надо, — а человеку остаётся лишь проверить последние 10%. Реально ли это? Упирается в проблему, которую разговоры об оркестрации обычно обходят стороной. Когда компания Chroma прогнала через 18 ведущих моделей, каждая теряла точность по мере роста входных данных. Это свойство механизма внимания, а не дыра, которую закроет более сильная модель. Агент, которого на ходу кормят всё новыми кусками вашего бизнеса, не становится устойчивее. Он становится шатче.

Вот он, слой под гонкой оркестрации. Маршрутизация, надёжное исполнение и наблюдаемость — всё это предполагает, что каждый агент сам по себе уже достаточно компетентен, чтобы координироваться. А реальный вопрос глубже: как долго агент может работать без вмешательства человека? И ответ упирается в то, где живут знания вашей компании относительно модели. Оба стандартных решения оставляют человека в цикле.

Почему обучение модели вашей бизнес-логике не даёт вам уйти с поводка

Фронтирные модели продолжают умнеть, но разрыв не сокращается — это не проблема способностей. Это вопрос того, где ваши знания расположены относительно модели. У предприятий есть два способа их разместить. Первый — тонкая настройка (fine-tuning): знания вплавляются в веса. Она по-прежнему страдает от катастрофического забывания — проблемы, обнаруженной ещё в 80-х и не решённой к 2026 году. Обучая модель новому, вы стираете то, что она уже знала. Команды обходят это, изолируя каждую задачу в отдельной тонко настроенной модели или адаптере. В итоге — расползающийся зоопарк моделей, дикие расходы и головная боль с управлением. К тому же тонко настроенная модель — это снимок, устаревающий в день изменения политики, когда начинается дорогой и медленный цикл переобучения.

Второе — внутриконтекстное обучение (in-context learning): политики закидываются прямо в промпт рантайма. Здесь вступает гниение контекста. Ретривал сужает корм, но промах ретривала выглядит так же уверенно, как точный ответ, а цена и задержка растут с каждым добавленным токеном.

Оба провала похожи. С тонкой настройкой модель может уверенно работать по политике прошлого квартала. С внутриконтекстным обучением — уверенно цепляться за деталь, потерянную в середине длинного промпта. В любом случае вывод выглядит одинаково уверенным, поэтому вы не можете сказать, какие части неверны, не проверив всё. Вот почему человек никуда не девается. Некоторые команды запускают оба подхода сразу: финят стабильные знания, остальное ретривят. Это смягчает каждую неудачу, но не устраняет ни одну: на любом выводе вы всё равно не уверены, что модель актуальна и работает с правильным контекстом — так что снова проверяете.

Третий путь: генерировать специализированную модель по требованию

Третий подход перебирается из исследований в ранние продукты....

🔗 Полный текст статьи читайте у нас на сайте: Читать на TechLoot

📢 ТехноЛут