Найти в Дзене
Social Mebia Systems

Новое поколение AI, которое само создаёт себе инструменты

2026 год приносит в мир AI‑агентов ещё один сдвиг парадигмы. Skills едва успели стать мейнстримом, как появилась новая модель разработки: агенты, которые умеют эволюционировать и создавать инструменты сами — без Skills, без GitHub, без человеческой помощи. Исследование показало: агент, работающий поверх Gemini 3 Pro, может сам создавать, исправлять и сохранять инструменты, необходимые для решения задач — и обгонять модели, использующие вручную созданные Skills, на десятки баллов. Это выглядит как появление нового типа искусственного интеллекта: агента, который в процессе работы «куёт себе мечи» и совершенствует свой инструментарий так же, как человек развивается через опыт. ✔ Демка, с которой всё началось: агент сам понял, что ему нужно создать инструмент — и создал его В опубликованном demo пользователь задаёт задачу анализа данных ACT по штатам США.
Агент начинает нормально: …но сталкивается с ограничением: нужного инструмента нет. Тогда происходит магия: Это — не заранее прописанная

2026 год приносит в мир AI‑агентов ещё один сдвиг парадигмы. Skills едва успели стать мейнстримом, как появилась новая модель разработки: агенты, которые умеют эволюционировать и создавать инструменты сами — без Skills, без GitHub, без человеческой помощи.

Исследование показало: агент, работающий поверх Gemini 3 Pro, может сам создавать, исправлять и сохранять инструменты, необходимые для решения задач — и обгонять модели, использующие вручную созданные Skills, на десятки баллов.

Это выглядит как появление нового типа искусственного интеллекта: агента, который в процессе работы «куёт себе мечи» и совершенствует свой инструментарий так же, как человек развивается через опыт.

✔ Демка, с которой всё началось: агент сам понял, что ему нужно создать инструмент — и создал его

В опубликованном demo пользователь задаёт задачу анализа данных ACT по штатам США.
Агент начинает нормально:

  • анализирует запрос
  • планирует
  • выбирает инструменты

…но сталкивается с ограничением: нужного инструмента нет.

Тогда происходит магия:

  • агент создаёт новый инструмент прямо в процессе выполнения,
  • замечает ошибку,
  • сам её исправляет
  • продолжает работать

Это — не заранее прописанная логика. Это спонтанное, контекстно управляемое создание инструмента, подкреплённое последующим использованием.

✔ Агент создал 128 инструментов — «с нуля» — пока проходил бенчмарки

Исследователи дали агенту пройти 5 сложнейших бенчмарков: HLE (Humanity’s Last Exam), DeepSearchQA, FinSearch Comp, XBench.

И что произошло?

  • на старте у агента 0 инструментов
  • он начинает решать задачи и создаёт новый инструмент, когда тот нужен
  • спустя 2000 задач — 97 инструментов
  • после почти 4000 задач — 128 завершённых, стабильно используемых инструментов
  • затем рост прекращается: багаж инструментов стал достаточным

Графики показывают ключевой эффект:
агент останавливается сам, когда инструментальный набор покрывает все новые задачи.

Это уже не brute‑force. Это — обучение на опыте, осознанная оптимизация.

✔ Инструменты, которые агент создаёт — удивительно «человечны»

Вот топ‑50 инструментов, которые агент создавал и использовал больше всего:

  • Web search
  • Content fetcher
  • Calculator
  • PDF обработчик
  • CSV загрузчик
  • Академический поиск
  • Downloader
  • Файловые преобразования

То есть он создаёт ровно те базовые утилиты, с которыми работает человек‑аналитик или инженер.
Причём:

  • большая часть работы делается через несколько лучших инструментов
  • возникает сильный эффект Парето
  • инструменты становятся универсальными и многократно применимыми

Это значит:
агент не просто создаёт всё подряд — он формирует
методологию работы, пригодную для разных задач.

✔ Результаты: агент почти догнал GPT‑5.2‑Pro‑agent и обошёл всех Gemini‑агентов

На сложных задачах вроде HLE агент:

  • превосходит официальные Gemini‑based агенты на 10–20 баллов
  • работает в режиме one‑take (без попыток перезапуска)
  • демонстрирует устойчивость и высокую обобщающую способность

Несмотря на то что GPT‑5.2‑Pro остаётся лучшим, Zero‑Skill‑агент вплотную приблизился — при этом:

  • не требовал обучения
  • не имел готовых Skills
  • всё построил сам по пути

✔ Как это работает: «оригинальная» (in‑situ) самоэволюция агента

Традиционная self‑evolution происходит только на этапе обучения, основана на:

  • больших датасетах
  • разметке
  • supervised fine‑tuning
  • огромных вычислениях

После деплоя модель застывает.

Новая парадигма — In‑situ Self‑Evolution:

  • эволюция происходит не на этапе обучения, а во время выполнения задач
  • нет внешней разметки
  • нет истинных ответов
  • агент развивается только на основе своего опыта и результатов инструментов

Это не ASI, но это шаг к автономному онлайн‑обучению.

Вместо изменения параметров модели агент развивает три подсистемы:

  1. Workflows
  2. Memory
  3. Tools ← ключевой фокус

Команда выбрала стратегию «tool‑first», потому что:

  • инструменты дают бинарный сигнал ошибок (работает/не работает)
  • могут быть строго проверены
  • безопаснее
  • масштабируются
  • универсальны

✔ Архитектура: 4 роли, работающие как мини‑команда

Агент состоит из четырёх суб‑агентов:

  1. Manager
    Анализирует задачу, решает — хватает ли инструментов.
  2. Tool Developer
    Строит новый инструмент, если нужно.
  3. Executor
    Выполняет задачу с имеющимися инструментами.
  4. Integrator
    Формирует финальный ответ и обновляет репозиторий инструментов.

После каждой задачи — ревизия, дистилляция опыта, улучшение.

Чтобы ускорить эволюцию, используется пакетная параллельная обработка (parallel batch evolution) — агент учится сразу на куче задач.

Почему это важно для индустрии: открытые модели получают «динамическое преимущество»

Текущая проблема открытых моделей:

  • они мощные, но статичные
  • пользователи их используют, но вклад в улучшение почти нулевой
  • нет «циклического эффекта Линукс», где каждый пользователь = вклад

Zero‑Skill‑агенты меняют уравнение: каждый пользовательский запрос → улучшение инструментария агента.

Это значит:

  • open‑source модели теперь получают механизм самоулучшения
  • инструменты могут обобщаться между задачами, как функции ОС
  • экосистема начинает работать как Linux, только для AI

Skills были первым шагом. Zero‑Skill‑agents — логичное продолжение.
«Инструментальная эволюция» превращает открытые модели в саморазвивающиеся системы.

Вывод: наступает эпоха агентов, которые учатся в процессе работы — без фаинтюна, без разметки, без Skills

Эта работа показывает:

  • агент может развить мощные способности без дополнительных моделей
  • он формирует базовый набор инструментов через опыт
  • достигает SOTA‑результатов на сложных задачах
  • имеет естественную точку остановки (конвергенцию)
  • построен на полностью открытой архитектуре

Это один из самых серьёзных шагов к истинной автономности агентов за последние годы.

Если Skills стали «библиотекой приложений» для AI, то Zero‑Skill‑агенты — это операционная система, способная писать свои собственные приложения.

И впервые открытый мир получает инструмент, который может эволюционировать быстрее, чем закрытые модели.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/