2026 год приносит в мир AI‑агентов ещё один сдвиг парадигмы. Skills едва успели стать мейнстримом, как появилась новая модель разработки: агенты, которые умеют эволюционировать и создавать инструменты сами — без Skills, без GitHub, без человеческой помощи.
Исследование показало: агент, работающий поверх Gemini 3 Pro, может сам создавать, исправлять и сохранять инструменты, необходимые для решения задач — и обгонять модели, использующие вручную созданные Skills, на десятки баллов.
Это выглядит как появление нового типа искусственного интеллекта: агента, который в процессе работы «куёт себе мечи» и совершенствует свой инструментарий так же, как человек развивается через опыт.
✔ Демка, с которой всё началось: агент сам понял, что ему нужно создать инструмент — и создал его
В опубликованном demo пользователь задаёт задачу анализа данных ACT по штатам США.
Агент начинает нормально:
- анализирует запрос
- планирует
- выбирает инструменты
…но сталкивается с ограничением: нужного инструмента нет.
Тогда происходит магия:
- агент создаёт новый инструмент прямо в процессе выполнения,
- замечает ошибку,
- сам её исправляет
- продолжает работать
Это — не заранее прописанная логика. Это спонтанное, контекстно управляемое создание инструмента, подкреплённое последующим использованием.
✔ Агент создал 128 инструментов — «с нуля» — пока проходил бенчмарки
Исследователи дали агенту пройти 5 сложнейших бенчмарков: HLE (Humanity’s Last Exam), DeepSearchQA, FinSearch Comp, XBench.
И что произошло?
- на старте у агента 0 инструментов
- он начинает решать задачи и создаёт новый инструмент, когда тот нужен
- спустя 2000 задач — 97 инструментов
- после почти 4000 задач — 128 завершённых, стабильно используемых инструментов
- затем рост прекращается: багаж инструментов стал достаточным
Графики показывают ключевой эффект:
агент останавливается сам, когда инструментальный набор покрывает все новые задачи.
Это уже не brute‑force. Это — обучение на опыте, осознанная оптимизация.
✔ Инструменты, которые агент создаёт — удивительно «человечны»
Вот топ‑50 инструментов, которые агент создавал и использовал больше всего:
- Web search
- Content fetcher
- Calculator
- PDF обработчик
- CSV загрузчик
- Академический поиск
- Downloader
- Файловые преобразования
То есть он создаёт ровно те базовые утилиты, с которыми работает человек‑аналитик или инженер.
Причём:
- большая часть работы делается через несколько лучших инструментов
- возникает сильный эффект Парето
- инструменты становятся универсальными и многократно применимыми
Это значит:
агент не просто создаёт всё подряд — он формирует методологию работы, пригодную для разных задач.
✔ Результаты: агент почти догнал GPT‑5.2‑Pro‑agent и обошёл всех Gemini‑агентов
На сложных задачах вроде HLE агент:
- превосходит официальные Gemini‑based агенты на 10–20 баллов
- работает в режиме one‑take (без попыток перезапуска)
- демонстрирует устойчивость и высокую обобщающую способность
Несмотря на то что GPT‑5.2‑Pro остаётся лучшим, Zero‑Skill‑агент вплотную приблизился — при этом:
- не требовал обучения
- не имел готовых Skills
- всё построил сам по пути
✔ Как это работает: «оригинальная» (in‑situ) самоэволюция агента
Традиционная self‑evolution происходит только на этапе обучения, основана на:
- больших датасетах
- разметке
- supervised fine‑tuning
- огромных вычислениях
После деплоя модель застывает.
Новая парадигма — In‑situ Self‑Evolution:
- эволюция происходит не на этапе обучения, а во время выполнения задач
- нет внешней разметки
- нет истинных ответов
- агент развивается только на основе своего опыта и результатов инструментов
Это не ASI, но это шаг к автономному онлайн‑обучению.
Вместо изменения параметров модели агент развивает три подсистемы:
- Workflows
- Memory
- Tools ← ключевой фокус
Команда выбрала стратегию «tool‑first», потому что:
- инструменты дают бинарный сигнал ошибок (работает/не работает)
- могут быть строго проверены
- безопаснее
- масштабируются
- универсальны
✔ Архитектура: 4 роли, работающие как мини‑команда
Агент состоит из четырёх суб‑агентов:
- Manager
Анализирует задачу, решает — хватает ли инструментов. - Tool Developer
Строит новый инструмент, если нужно. - Executor
Выполняет задачу с имеющимися инструментами. - Integrator
Формирует финальный ответ и обновляет репозиторий инструментов.
После каждой задачи — ревизия, дистилляция опыта, улучшение.
Чтобы ускорить эволюцию, используется пакетная параллельная обработка (parallel batch evolution) — агент учится сразу на куче задач.
Почему это важно для индустрии: открытые модели получают «динамическое преимущество»
Текущая проблема открытых моделей:
- они мощные, но статичные
- пользователи их используют, но вклад в улучшение почти нулевой
- нет «циклического эффекта Линукс», где каждый пользователь = вклад
Zero‑Skill‑агенты меняют уравнение: каждый пользовательский запрос → улучшение инструментария агента.
Это значит:
- open‑source модели теперь получают механизм самоулучшения
- инструменты могут обобщаться между задачами, как функции ОС
- экосистема начинает работать как Linux, только для AI
Skills были первым шагом. Zero‑Skill‑agents — логичное продолжение.
«Инструментальная эволюция» превращает открытые модели в саморазвивающиеся системы.
Вывод: наступает эпоха агентов, которые учатся в процессе работы — без фаинтюна, без разметки, без Skills
Эта работа показывает:
- агент может развить мощные способности без дополнительных моделей
- он формирует базовый набор инструментов через опыт
- достигает SOTA‑результатов на сложных задачах
- имеет естественную точку остановки (конвергенцию)
- построен на полностью открытой архитектуре
Это один из самых серьёзных шагов к истинной автономности агентов за последние годы.
Если Skills стали «библиотекой приложений» для AI, то Zero‑Skill‑агенты — это операционная система, способная писать свои собственные приложения.
И впервые открытый мир получает инструмент, который может эволюционировать быстрее, чем закрытые модели.
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru
Сайт https://www.smssystems.ru/razrabotka-ai/