Добавить в корзинуПозвонить
Найти в Дзене
Neurogen

OpenEnv

OpenEnv Meta и Hugging Face запустили отрытое сообщество и платформу для создания и обмена агентными средами Агенты могут автономно выполнять тысячи задач, но как правило одной lm мало. Агентам нужен доступ к правильным инструментам, но предоставлять доступ к миллионам инструментов напрямую небезопасно и нерационально. Решение: Агентные Среды Агентные среды - это защищённые песочницы, которые определяют всё необходимое для выполнения задачи: Инструменты и API - только то, что нужно для конкретной задачи Безопасность - изолированное выполнение с гарантиями Аутентификация - безопасный доступ к внешним сервисам Чёткая семантика - понимание требований задачи OpenEnv Hub интегрируется в новый пост-тренинговый стек от Meta вместе с библиотеками TRL, SkyRL и Unsloth. Возможности для разработчиков: ✅Создавать и делиться средами, совместимыми с OpenEnv ✅Взаимодействовать с средами как человек-агент ✅Тестировать модели на решении задач в контролируемых условиях ✅Изучать доступные инструмен

OpenEnv

Meta и Hugging Face запустили отрытое сообщество и платформу для создания и обмена агентными средами

Агенты могут автономно выполнять тысячи задач, но как правило одной lm мало. Агентам нужен доступ к правильным инструментам, но предоставлять доступ к миллионам инструментов напрямую небезопасно и нерационально.

Решение: Агентные Среды

Агентные среды - это защищённые песочницы, которые определяют всё необходимое для выполнения задачи:

Инструменты и API - только то, что нужно для конкретной задачи

Безопасность - изолированное выполнение с гарантиями

Аутентификация - безопасный доступ к внешним сервисам

Чёткая семантика - понимание требований задачи

OpenEnv Hub интегрируется в новый пост-тренинговый стек от Meta вместе с библиотеками TRL, SkyRL и Unsloth.

Возможности для разработчиков:

✅Создавать и делиться средами, совместимыми с OpenEnv

✅Взаимодействовать с средами как человек-агент

✅Тестировать модели на решении задач в контролируемых условиях

✅Изучать доступные инструменты и структуру наблюдений

Спецификация и RFCs

Выпущена OpenEnv 0.1 Spec (RFC) для сбора отзывов сообщества. В разработке находятся:

RFC 001 - архитектура основных компонентов (Environment, Agent, Task)

RFC 002 - базовый интерфейс окружения, упаковка и изоляция

RFC 003 - поддержка MCP инструментов

RFC 004 - расширенная поддержка вызовов инструментов

Применение

RL пост-тренинг - обучение RL-агентов с TRL, TorchForge, VeRL

Создание сред - разработка и тестирование собственных окружений

Воспроизведение SOTA - репликация методов вроде Code World Model

Развёртывание - единая среда для тренировки и инференса

Интеграции

OpenEnv уже поддерживается:

TRL от Hugging Face

Unsloth

Lightning.AI

Ссылки на openenv

Hugging Face

GitHub репозиторий с примерами

Google Colab

обсуждение в Discord