3 дня назад
AutoCode: ИИ-«постановщик задач» для соревновательного программирования от UCSD, OpenAI и соавторов
Зачем учить ИИ не только решать, но и задавать задачи Ответ LiveCodeBench Pro: AutoCode — замкнутый многоагентный контур, где LLM не только создаёт условия и эталонные решения, но и формирует тестовые данные индустриального уровня строгости. Базовая архитектура: Validator–Generator–Checker (+Interactor) Ключевой прицел — минимизация FPR при неизбежно широком покрытии. Команда строго различает test cases (пары вход–ответ) и test data (слои инфраструктуры оценки: чекеры, интеркаторы и т.п.). Бенчмарки...