2 дня назад
Open-source модель программирования Ornith-1.0 самостоятельно создает каркас обучения для Reinforcement Learning
Агентная модель кодирования с открытым исходным кодом Ornith-1.0, выпущенная сегодня под лицензией MIT, использует самосовершенствующийся цикл обучения с подкреплением для написания собственного обучающего каркаса, сообщая 82.4 по SWE-Bench Verified и 62.2 по более сложному SWE-Bench Pro — результаты, которые независимые исследователи должны рассматривать как. DeepReinforce сегодня выпустила Ornith-1.0 — семейство моделей для кодирования с открытым исходным кодом, построенных на механизме, которого...