33 подписчика

Новое поколение AI, которое само создаёт себе инструменты

26 января26 янв

5 мин

2026 год приносит в мир AI‑агентов ещё один сдвиг парадигмы. Skills едва успели стать мейнстримом, как появилась новая модель разработки: агенты, которые умеют эволюционировать и создавать инструменты сами — без Skills, без GitHub, без человеческой помощи. Исследование показало: агент, работающий поверх Gemini 3 Pro, может сам создавать, исправлять и сохранять инструменты, необходимые для решения задач — и обгонять модели, использующие вручную созданные Skills, на десятки баллов. Это выглядит как появление нового типа искусственного интеллекта: агента, который в процессе работы «куёт себе мечи» и совершенствует свой инструментарий так же, как человек развивается через опыт. ✔ Демка, с которой всё началось: агент сам понял, что ему нужно создать инструмент — и создал его В опубликованном demo пользователь задаёт задачу анализа данных ACT по штатам США.

Агент начинает нормально: …но сталкивается с ограничением: нужного инструмента нет. Тогда происходит магия: Это — не заранее прописанная

Исследование показало: агент, работающий поверх Gemini 3 Pro, может сам создавать, исправлять и сохранять инструменты, необходимые для решения задач — и обгонять модели, использующие вручную созданные Skills, на десятки баллов.

Это выглядит как появление нового типа искусственного интеллекта: агента, который в процессе работы «куёт себе мечи» и совершенствует свой инструментарий так же, как человек развивается через опыт.

✔ Демка, с которой всё началось: агент сам понял, что ему нужно создать инструмент — и создал его

В опубликованном demo пользователь задаёт задачу анализа данных ACT по штатам США.
Агент начинает нормально:

анализирует запрос
планирует
выбирает инструменты

…но сталкивается с ограничением: нужного инструмента нет.

Тогда происходит магия:

агент создаёт новый инструмент прямо в процессе выполнения,
замечает ошибку,
сам её исправляет
продолжает работать

Это — не заранее прописанная логика. Это спонтанное, контекстно управляемое создание инструмента, подкреплённое последующим использованием.

✔ Агент создал 128 инструментов — «с нуля» — пока проходил бенчмарки

Исследователи дали агенту пройти 5 сложнейших бенчмарков: HLE (Humanity’s Last Exam), DeepSearchQA, FinSearch Comp, XBench.

И что произошло?

на старте у агента 0 инструментов
он начинает решать задачи и создаёт новый инструмент, когда тот нужен
спустя 2000 задач — 97 инструментов
после почти 4000 задач — 128 завершённых, стабильно используемых инструментов
затем рост прекращается: багаж инструментов стал достаточным

Графики показывают ключевой эффект:
агент останавливается сам, когда инструментальный набор покрывает все новые задачи.

Это уже не brute‑force. Это — обучение на опыте, осознанная оптимизация.

✔ Инструменты, которые агент создаёт — удивительно «человечны»

Вот топ‑50 инструментов, которые агент создавал и использовал больше всего:

Web search
Content fetcher
Calculator
PDF обработчик
CSV загрузчик
Академический поиск
Downloader
Файловые преобразования

То есть он создаёт ровно те базовые утилиты, с которыми работает человек‑аналитик или инженер.
Причём:

большая часть работы делается через несколько лучших инструментов
возникает сильный эффект Парето
инструменты становятся универсальными и многократно применимыми

Это значит:
агент не просто создаёт всё подряд — он формирует методологию работы, пригодную для разных задач.

✔ Результаты: агент почти догнал GPT‑5.2‑Pro‑agent и обошёл всех Gemini‑агентов

На сложных задачах вроде HLE агент:

превосходит официальные Gemini‑based агенты на 10–20 баллов
работает в режиме one‑take (без попыток перезапуска)
демонстрирует устойчивость и высокую обобщающую способность

Несмотря на то что GPT‑5.2‑Pro остаётся лучшим, Zero‑Skill‑агент вплотную приблизился — при этом:

не требовал обучения
не имел готовых Skills
всё построил сам по пути

✔ Как это работает: «оригинальная» (in‑situ) самоэволюция агента

Традиционная self‑evolution происходит только на этапе обучения, основана на:

больших датасетах
разметке
supervised fine‑tuning
огромных вычислениях

После деплоя модель застывает.

Новая парадигма — In‑situ Self‑Evolution:

эволюция происходит не на этапе обучения, а во время выполнения задач
нет внешней разметки
нет истинных ответов
агент развивается только на основе своего опыта и результатов инструментов

Это не ASI, но это шаг к автономному онлайн‑обучению.

Вместо изменения параметров модели агент развивает три подсистемы:

Workflows
Memory
Tools ← ключевой фокус

Команда выбрала стратегию «tool‑first», потому что:

инструменты дают бинарный сигнал ошибок (работает/не работает)
могут быть строго проверены
безопаснее
масштабируются
универсальны

✔ Архитектура: 4 роли, работающие как мини‑команда

Агент состоит из четырёх суб‑агентов:

Manager
Анализирует задачу, решает — хватает ли инструментов.
Tool Developer
Строит новый инструмент, если нужно.
Executor
Выполняет задачу с имеющимися инструментами.
Integrator
Формирует финальный ответ и обновляет репозиторий инструментов.

После каждой задачи — ревизия, дистилляция опыта, улучшение.

Чтобы ускорить эволюцию, используется пакетная параллельная обработка (parallel batch evolution) — агент учится сразу на куче задач.

Почему это важно для индустрии: открытые модели получают «динамическое преимущество»

Текущая проблема открытых моделей:

они мощные, но статичные
пользователи их используют, но вклад в улучшение почти нулевой
нет «циклического эффекта Линукс», где каждый пользователь = вклад

Zero‑Skill‑агенты меняют уравнение: каждый пользовательский запрос → улучшение инструментария агента.

Это значит:

open‑source модели теперь получают механизм самоулучшения
инструменты могут обобщаться между задачами, как функции ОС
экосистема начинает работать как Linux, только для AI

Skills были первым шагом. Zero‑Skill‑agents — логичное продолжение.
«Инструментальная эволюция» превращает открытые модели в саморазвивающиеся системы.

Вывод: наступает эпоха агентов, которые учатся в процессе работы — без фаинтюна, без разметки, без Skills

Эта работа показывает:

агент может развить мощные способности без дополнительных моделей
он формирует базовый набор инструментов через опыт
достигает SOTA‑результатов на сложных задачах
имеет естественную точку остановки (конвергенцию)
построен на полностью открытой архитектуре

Это один из самых серьёзных шагов к истинной автономности агентов за последние годы.

Если Skills стали «библиотекой приложений» для AI, то Zero‑Skill‑агенты — это операционная система, способная писать свои собственные приложения.

И впервые открытый мир получает инструмент, который может эволюционировать быстрее, чем закрытые модели.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/