Найти в Дзене
Social Mebia Systems

Как ИИ за двое суток переворачивает 20 лет исследовательской практики

Бывший директор по AI в Tesla и один из основателей OpenAI Анджей Карпати опубликовал открытый проект autoresearch — минималистичный, но рабочий фреймворк, в котором автономный AI‑агент круглосуточно и самостоятельно проводит эксперименты по улучшению моделей. Проект взорвал сообщество: репозиторий уже собрал десятки тысяч звёзд и тысячи наблюдателей, а первые результаты заставляют по‑новому смотреть на роль человека в научной работе. Что такое autoresearch и как он устроен Autoresearch — это компактный Python‑репозиторий (~630 строк кода), спроектированный так, чтобы AI‑агент мог: Важные компоненты: Фиксированное время тренировки (5 минут) обеспечивает прямую сравнимость экспериментов: около 12 запусков в час, ~100 запусков за ночь. Это позволяет агенту быстро пробовать большое число модификаций и выявлять действительно работающие идеи на конкретном оборудовании (пока поддерживается одна NVIDIA GPU). Первые результаты — двухдневный эксперимент и прирост эффективности В опубликованном

Бывший директор по AI в Tesla и один из основателей OpenAI Анджей Карпати опубликовал открытый проект autoresearch — минималистичный, но рабочий фреймворк, в котором автономный AI‑агент круглосуточно и самостоятельно проводит эксперименты по улучшению моделей.

Проект взорвал сообщество: репозиторий уже собрал десятки тысяч звёзд и тысячи наблюдателей, а первые результаты заставляют по‑новому смотреть на роль человека в научной работе.

Что такое autoresearch и как он устроен

Autoresearch — это компактный Python‑репозиторий (~630 строк кода), спроектированный так, чтобы AI‑агент мог:

  • модифицировать единственный файл train.py (архитектура модели, гиперпараметры, оптимизатор и тренировочный цикл);
  • запускать короткие тренировки фиксированной продолжительности (по умолчанию 5 минут);
  • автоматически оценивать изменения по метрике val_bpb (валидационный бит‑на‑байт);
  • сохранять улучшения и откатывать неудачные варианты.

Важные компоненты:

  • prepare.py — неизменяемая часть: загрузка данных, подготовка токенизатора, утилиты и функции оценки;
  • train.py — единственный файл, доступный агенту для правок;
  • program.md — человек пишет контекст и инструкции в Markdown, агент исполняет их как «исследовательскую задачу».

Фиксированное время тренировки (5 минут) обеспечивает прямую сравнимость экспериментов: около 12 запусков в час, ~100 запусков за ночь. Это позволяет агенту быстро пробовать большое число модификаций и выявлять действительно работающие идеи на конкретном оборудовании (пока поддерживается одна NVIDIA GPU).

Первые результаты — двухдневный эксперимент и прирост эффективности

В опубликованном примере Karpathy запустил autoresearch на упрощённой модели nanoChat (глубина 12) и дал агенту поработать около двух суток. Итоги:

  • проведено 276 экспериментов;
  • отобрано 29 рабочих улучшений;
  • совокупное улучшение эффективности тренировки — примерно +11% (время «достичь уровня GPT‑2» сократилось с ~2.02 ч до ~1.80 ч).

Позже Карпати упомянул, что агент в сумме сделал порядка 700 попыток изменений, а сообщество уже расширило опыт — в фанатских ветках запустили ~3000 экспериментов и зафиксировали ≈82 полезные правки.

Исходный репозиторий: karpathy/autoresearch. Карпати также публиковал итерации и наблюдения в своих постах в X (Twitter): пост 1, пост 2.

Почему это важно — от «наблюдения за процессом» к «освобождению исследователя»

Karpathy описывает цель проекта предельно просто: создать агента, который сможет непрерывно продвигать исследование без человеческого вмешательства. В его словах — и вызов, и обещание: если агент может самостоятельно придумывать, тестировать и валидировать улучшения, то базовая рутина (запуск сотен экспериментов, мелкие гиперпараметрические правки) может быть полностью автоматизирована. Это меняет привычные роли в лаборатории:

  • аспиранты и инженеры смогут меньше времени тратить на «присмотр за тренировками» и больше — на формулировку идей, анализ и концептуальную работу;
  • ускоряются итерации и обнаружение локально эффективных решений для конкретного железа.

Karpathy идёт дальше и предлагает видение «агрегированного научного сообщества из агентов» — множество автономных агентов, действующих асинхронно, обменивающихся результатами и совместно генерирующих идеи, подобно распределённой сети исследователей.

Autoresearch — не замена учёному, а мощный инструмент: «помощник‑скорострел», способный в короткое время перебрать сотни гипотез. Следующие шаги, по замыслу автора и сообщества, — сделать агенты более кооперативными, добавлять асинхронную многомашинную координацию, расширять набор метрик и обеспечить надёжность/контроль качества предложений агента.

В перспективе такие инструменты могут стать стандартной частью лабораторного пайплайна: агент ищет быстрые эмпирические выигрыши на малых моделях, люди переводят лучшие идеи на большие модели и формируют научные обоснования.

Хотите создать уникальный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/