📰 Xiaomi HarnessX: Китайцы научили ИИ чинить себя на лету — маленькие модели в шоке от +44% прироста

СегодняСегодня

2 мин

Корпоративные ИИ-агенты берутся за всё более сложные и долгосрочные задачи. Но их потенциал часто упирается в обвязку — тот самый программный каркас, который соединяет мозг в виде LLM с внешним миром. Проблема в том, что сегодня эта обвязка — статичная и handmade. Улучшать её приходится вручную, а данные о выполнении задач просто пропадают. Инженеры Xiaomi решили, что так дальше нельзя, и создали HarnessX — фреймворк, который делает обвязку самостоятельным объектом и автоматически допиливает её код. В реальных бизнес-приложениях такая автоадаптация позволяет ИИ подстраиваться под специфику задачи на лету. Тесты показали впечатляющий прирост производительности в софтверной инженерии и веб-взаимодействиях. Результаты намекают: масштабирование модели — не единственный путь к супер-ИИ. А для небольших моделей — возможно, даже не лучший. Эволюция обвязки от HarnessX дала в среднем +14,5% прироста на 15 комбинациях модель-бенчмарк. А для открытой Qwen3.5-9B — целых +44% на задачах воплощённо

Проблемы инженерии обвязки

В ИИ-приложениях возможности фундаментальной модели сильно зависят от того, что её окружает. Обвязка выполняет роль операционного слоя: превращает сырой вывод модели в структурированные, исполнимые действия агента. Сюда входят промпты, интеграции внешних инструментов, управление памятью и потоки управления — всё, что диктует агенту, как наблюдать за окружением, рассуждать над задачей и действовать.

Когда корпоративные агенты берут на себя более сложные и длительные процессы, инженерия обвязки становится фундаментальной частью разработки ИИ. Но, несмотря на важность, эта область всё ещё далека от зрелой инженерной дисциплины. И тут три ключевые проблемы.

Первая: обвязка статична и собирается вручную. Стоит сменить фундаментальную модель, добавить новый инструмент или перейти в другую операционную среду — приходится переписывать код вручную, под конкретный случай. Традиционные обвязки не умеют самостоятельно учиться на прошлом опыте и улучшаться.

Вторая: почти все существующие обвязки страдают от архитектурной запутанности. Шаблоны промптов, обёртки инструментов, политики повторных попыток и управление памятью намертво впечатаны в одни и те же участки кода. Дёрнешь один компонент — молча сломаются другие. Попытка переиспользовать обвязку в другом бизнес-контексте превращается в тупое копирование кода, а не в чистую модульную композицию.

Третья: обвязка и фундаментальная модель оптимизируются изолированно друг от друга. Когда инженеры гоняют тесты, чтобы улучшить обвязку, сгенерированные треки выполнения обычно выбрасывают, а не используют как тренировочные данные для модели. В итоге апгрейд модели не тянет за собой улучшение обвязки — возникает бутылочное горлышко, и команды не выжимают из операционных данных агента и половины ценности.

HarnessX: автономная фабрика для ИИ-агентов

HarnessX решает инженерные проблемы ручной разработки обвязки с помощью того, что исследователи называют «единой фабрикой обвязок».

Ключевая инновация — относиться к обвязке как к «объекту первого класса». На языке разработки это значит: обвязка — независимо сериализуемая, модульная и заменяемая сущность. Разделив конфигурацию модели (какая именно ИИ-модель работает) и конфигурацию обвязки, инженеры могут без проблем менять, адаптировать и развивать каркас, не трогая саму модель....

🔗 Полный текст статьи читайте у нас на сайте: Читать на TechLoot

📢 ТехноЛут