127 подписчиков

RecursiveMAS: ускорение многоагентного ИИ в 2,4 раза

3 июня3 июн

3 мин

Представьте команду специалистов, где каждый эксперт не может передать коллеге свои мысли напрямую — только через письменный доклад. Сначала один пишет текст, другой его читает, пишет свой ответ, третий читает оба текста и пишет итог. Именно так устроены классические многоагентные системы ИИ. И именно это исследователи решили сломать. В большинстве современных многоагентных систем агенты буквально разговаривают текстом. Один генерирует ответ, другой его читает и генерирует следующий. Это создаёт три проблемы, которые усиливаются с ростом числа агентов: Для бизнеса, который строит агентные пайплайны, это выглядит так: добавляешь больше агентов — растёт стоимость и задержка, а качество не всегда пропорционально улучшается. RecursiveMAS — фреймворк, разработанный исследователями в ведущих американских университетах. Его суть: агенты передают друг другу не текст, а латентные эмбеддинги — непрерывные векторные представления из внутреннего пространства модели. Простая аналогия: вместо того ч

Оглавление

Многоагентный ИИ стал в 2,4 раза быстрее — и дело не в новых моделях
Почему текстовая коммуникация — это узкое место
Что меняет RecursiveMAS

Многоагентный ИИ стал в 2,4 раза быстрее — и дело не в новых моделях

Почему текстовая коммуникация — это узкое место

В большинстве современных многоагентных систем агенты буквально разговаривают текстом. Один генерирует ответ, другой его читает и генерирует следующий. Это создаёт три проблемы, которые усиливаются с ростом числа агентов:

Очереди и задержки. Каждый агент ждёт полного ответа предыдущего, прежде чем начать работу.
Раздутые токены. Промежуточные рассуждения приходится проговаривать в текст — только для того, чтобы следующая модель их прочитала. Это токены, которые не несут ценности для конечного пользователя.
Изолированное обучение. Каждого агента сложно обучать с учётом поведения всей системы — слишком много движущихся частей.

Для бизнеса, который строит агентные пайплайны, это выглядит так: добавляешь больше агентов — растёт стоимость и задержка, а качество не всегда пропорционально улучшается.

Что меняет RecursiveMAS

RecursiveMAS — фреймворк, разработанный исследователями в ведущих американских университетах. Его суть: агенты передают друг другу не текст, а латентные эмбеддинги — непрерывные векторные представления из внутреннего пространства модели.

Простая аналогия: вместо того чтобы каждый раз переводить мысль в слова и обратно, агенты передают саму «мысль» в том виде, в котором она существует внутри нейросети.

Архитектура вдохновлена рекурсивными языковыми моделями. В них один набор слоёв обрабатывает данные циклически, углубляя рассуждение без роста параметров. RecursiveMAS переносит этот принцип на уровень системы: каждый агент — это «слой» единого рекурсивного процесса. Информация циркулирует через цепочку как скрытый поток, и только на выходе конвертируется в текст для пользователя.

Конкретные результаты

Экспериментальные данные показывают:

Скорость инференса выросла в 2,4 раза по сравнению с классическими текстовыми мультиагентными системами
Использование токенов сократилось на 75% — промежуточные рассуждения больше не нужно генерировать в текст
Точность улучшилась на трёх типах задач: генерация кода, медицинское рассуждение, информационный поиск
Стоимость обучения ниже, чем у стандартного дообучения и LoRA-методов

Важно понимать природу этих улучшений. Скорость растёт, потому что исчезает текстовая очередь. Токены сокращаются, потому что промежуточные шаги не нужно «проговаривать». Точность улучшается, потому что система обучается как единое целое — а не набор изолированных агентов.

Почему это важно для практики прямо сейчас

RecursiveMAS пока исследовательский проект, не готовый плагин для вашего пайплайна. Но он задаёт направление, в котором будут двигаться production-фреймворки в ближайшие годы.

Что можно делать уже сейчас, опираясь на эти принципы:

Аудит промежуточного текста. Пройдитесь по своим агентным пайплайнам и отметьте все места, где агент генерирует текст исключительно для передачи следующему. Это ваши кандидаты на оптимизацию. Структурированные форматы вместо натурального языка. Там, где агенты обмениваются данными, используйте JSON или другие структурированные форматы вместо развёрнутых текстовых ответов. Это снижает токен-нагрузку без изменения архитектуры. Агенты как специализированные слои. Чем уже роль агента, тем эффективнее он работает в цепочке. Универсальный агент, который «знает всё» — антипаттерн при масштабировании. Системная метрика качества. Оценивайте результат всей цепочки, а не каждого агента отдельно. Это приближает вас к логике совместного обучения, которую реализует RecursiveMAS.

Общая картина

Текстовая коммуникация между агентами — не стандарт индустрии. Это решение по умолчанию, которое появилось потому, что языковые модели умеют генерировать текст. Но «умею генерировать» и «должен генерировать для внутренней передачи данных» — разные вещи.

RecursiveMAS демонстрирует, что когда вы убираете это ограничение, система становится быстрее, дешевле и точнее одновременно — без компромиссов. Для организаций, которые инвестируют в агентные системы, это сигнал: архитектурные решения, принятые сегодня, будут определять стоимость и производительность системы через год-два, когда объёмы вырастут.

Автоматизируешь контент или бизнес с помощью ИИ? Бот @contentrunbot и база знаний ContentRun - инструменты и практика без воды. Оба бесплатно.