Meta представила Autodata — фреймворк, который превращает языковую модель в автономного «учёного-данных»: он сам создаёт обучающие примеры, проверяет их и корректирует следующий шаг. Схема «создание → проверка → выводы → улучшение» крутится итеративно, а не завершает работу после генерации. Внутри есть Challenger, Weak Solver (слабый решатель), Strong Solver (сильный решатель) и Judge (верификатор): пример считается качественным, когда сильная модель решает задачу, а слабая — нет. Главная новизна — мета-оптимизация самого агента: внешний цикл обучает не только данные, но и «рецепт», по которому агент их производит. В экспериментах модель, дообученная на таких данных, показала лучшее качество, чем на CoT Self-Instruct, а цифры пока не выглядят как магия — скорее как системная работа с обратной связью. Код выходит в рамках проекта RAM (Reasoning, Alignment, Memory) под MIT-лицензией, а основной практический эффект — меньше ручного проектирования синтетических данных и фильтрации «брак
🚀 Meta Autodata делает генерацию датасетов агентным циклом: данные проверяются и улучшаются сами
3 мая3 мая
1 мин