Добавить в корзинуПозвонить
Найти в Дзене

🚀 Meta Autodata делает генерацию датасетов агентным циклом: данные проверяются и улучшаются сами

Meta представила Autodata — фреймворк, который превращает языковую модель в автономного «учёного-данных»: он сам создаёт обучающие примеры, проверяет их и корректирует следующий шаг. Схема «создание → проверка → выводы → улучшение» крутится итеративно, а не завершает работу после генерации. Внутри есть Challenger, Weak Solver (слабый решатель), Strong Solver (сильный решатель) и Judge (верификатор): пример считается качественным, когда сильная модель решает задачу, а слабая — нет. Главная новизна — мета-оптимизация самого агента: внешний цикл обучает не только данные, но и «рецепт», по которому агент их производит. В экспериментах модель, дообученная на таких данных, показала лучшее качество, чем на CoT Self-Instruct, а цифры пока не выглядят как магия — скорее как системная работа с обратной связью. Код выходит в рамках проекта RAM (Reasoning, Alignment, Memory) под MIT-лицензией, а основной практический эффект — меньше ручного проектирования синтетических данных и фильтрации «брак

🚀 Meta Autodata делает генерацию датасетов агентным циклом: данные проверяются и улучшаются сами

Meta представила Autodata — фреймворк, который превращает языковую модель в автономного «учёного-данных»: он сам создаёт обучающие примеры, проверяет их и корректирует следующий шаг.

Схема «создание → проверка → выводы → улучшение» крутится итеративно, а не завершает работу после генерации. Внутри есть Challenger, Weak Solver (слабый решатель), Strong Solver (сильный решатель) и Judge (верификатор): пример считается качественным, когда сильная модель решает задачу, а слабая — нет.

Главная новизна — мета-оптимизация самого агента: внешний цикл обучает не только данные, но и «рецепт», по которому агент их производит. В экспериментах модель, дообученная на таких данных, показала лучшее качество, чем на CoT Self-Instruct, а цифры пока не выглядят как магия — скорее как системная работа с обратной связью.

Код выходит в рамках проекта RAM (Reasoning, Alignment, Memory) под MIT-лицензией, а основной практический эффект — меньше ручного проектирования синтетических данных и фильтрации «бракованных» примеров, особенно для редких сложных кейсов.

Детали и сравнение с Self-Instruct/Evol-Instruct/Self-Challenging — в исходном релизе и changelog; репозиторий — в facebookresearch/RAM.

#tool #release #Meta #Agentic #MoE #GRPO #RL

🔗 Meta Introduces Autodata: An Agentic Framework That Turns AI Models into Autonomous Data Scientists for High-Quality Training Data Creation