80 подписчиков

Маленькая модель, большие результаты: как Nvidia и университет Гонконга переизобрели ИИ-помощников

10 декабря 202510 дек 2025

3 мин

Представьте: восьмимиллиардная модель превосходит гораздо более крупные системы, тратя при этом меньше ресурсов. Звучит как научная фантастика? Но именно это произошло. Исследователи из Nvidia и Университета Гонконга выпустили Orchestrator — умный координатор, который заставляет различные инструменты и языковые модели работать как слаженный оркестр. Модель обучалась через ToolOrchestra — новую систему на основе обучения с подкреплением. Суть простая, но гениальная: вместо того чтобы вкладывать всё в одну монструозно большую систему, лучше взять небольшую модель-координатора и дать ей команду специализированных помощников. Она разберётся, кого позвать, когда и зачем. Сейчас компании обычно дают большой языковой модели набор базовых инструментов: поиск в интернете, калькулятор, может быть, интерпретатор кода. ИИ-агент может выполнять задачи, вытягивая информацию из этого арсенала. И кажется, что это хороший подход. Но вот в чём засада: люди не так работают. Когда человек решает сложную з

Оглавление

Почему текущие подходы буксуют
Революция через координацию
Восемь миллиардов против всех

Модель обучалась через ToolOrchestra — новую систему на основе обучения с подкреплением. Суть простая, но гениальная: вместо того чтобы вкладывать всё в одну монструозно большую систему, лучше взять небольшую модель-координатора и дать ей команду специализированных помощников. Она разберётся, кого позвать, когда и зачем.

Почему текущие подходы буксуют

Сейчас компании обычно дают большой языковой модели набор базовых инструментов: поиск в интернете, калькулятор, может быть, интерпретатор кода. ИИ-агент может выполнять задачи, вытягивая информацию из этого арсенала. И кажется, что это хороший подход. Но вот в чём засада: люди не так работают.

Когда человек решает сложную задачу, он не пытается всё сделать сам. Нет — он звонит экспертам, обращается к специалистам, использует узконаправленные инструменты. Представьте врача, который вместо консультации с радиологом пытается сам делать УЗИ. Глупо, правда? А языковые модели до сих пор более или менее так и работают.

Исследователи заметили: а что если переучить систему на человеческий манер взаимодействия?

Революция через координацию

Вот появляется новая идея. Вместо одной мощной модели — целая экосистема. В центре небольшая, компактная модель-оркестратор. Её работа: понять задачу, разбить её на части и вызвать нужные инструменты в правильном порядке.

Эти инструменты — это не просто калькулятор с гуглом. Это может быть математическая модель, если вопрос про цифры. Или специализированный генератор кода для программирования. Или совсем другой ИИ, обученный на чём-то конкретном. Каждый делает своё, и координатор управляет хором.

ToolOrchestra — это метод, который учит маленькую модель этому ремеслу. Использует обучение с подкреплением, награды за правильные ответы, экономию ресурсов и вообще за умение слушать, что предпочитает пользователь. Может, человек хочет использовать открытый код вместо дорогого API по соображениям приватности? Система это учитывает.

Для обучения команда создала автоматический конвейер данных, который сгенерировал тысячи примеров из 10 разных областей. Проверенные, настоящие примеры.

Восемь миллиардов против всех

На основе этого подхода родилась Orchestrator — восьмимиллиардная модель на базе Qwen3-8B. Её протестировали на трёх серьёзных бенчмарках: Humanity’s Last Exam (вопросы уровня PhD), FRAMES и Tau2-Bench. Результаты? Скажу честно — впечатляют.

Сначала выяснилось то, что все уже знали: большие модели без инструментов — это как врач без стетоскопа. Дают инструменты — помогает, но вот беда: ресурсы летят в небо. Задержки растут. Счета у компаний становятся больше.

А восьмимиллиардный Orchestrator? На Humanity’s Last Exam он сокрушил конкурентов, потратив при этом намного меньше вычислительных мощностей. На функциональном тесте Tau2-Bench модель показала класс: призывала дорогой GPT-5 только в 40% случаев, остальное решала дешёвыми инструментами. Но при этом всё ещё побеждала агентов, которые звали мощную модель на каждый шаг.

Самое интересное: система адаптировалась к новым задачам, показав то, что исследователи назвали «высокой степенью общего логического мышления». И вот что критично для бизнеса — модель работала с инструментами и расценками, которых она никогда не видела во время обучения. Это значит, что систему можно внедрить на реальных предприятиях с их микс-комбинацией публичных, приватных и собственных моделей.

Почему это важно прямо сейчас

Компании ломают головы: как построить ИИ-агента, который будет и умным, и дешёвым, и управляемым? Orchestrator предлагает решение. Не нужно держать огромную чёрную ящик модель, которая прожирает бюджет. Достаточно хорошего координатора и команды специалистов.

Разработчики щедро поделились: веса модели доступны, правда, под некоммерческой лицензией. Но вот исходный код ToolOrchestra выложили под свободную лицензию Apache 2.0 — значит, компании могут адаптировать подход под свои нужды.

В заключении исследования авторы намекают на будущее: «Мы видим ещё более продвинутые версии этой концепции — рекурсивные системы оркестраторов, которые будут раздвигать границы интеллекта и повышать эффективность решения всё более сложных задач». То есть это только начало.

Вот так разработки в области ИИ-агентов и оптимизации больших моделей постоянно ускоряются — каждый месяц появляется что-то новое и удивительное!🔔 Чтобы не пропустить такие находки и всегда быть в курсе новостей ИИ-мира, подпишитесь на мой канал «ProAI» в Telegram!