📝 Кратко: OpenAI рекомендовала разработчикам больше не использовать бенчмарк SWE-bench Verified для проверки способностей ИИ-моделей к программированию. Этот набор задач был создан самой компанией в 2024 году и быстро стал одним из ключевых стандартов для сравнения coding-моделей. Читать далее 🔗 Читать оригинальную статью (ссылка) 📊 Источник: Habr ⏰ Время: 25.02.2026 18:13 📱 Другие каналы: 🪙 ВКрипту | 🎮 ВИгрухи | 🏎️ ВТачки | ✈️ ВТравелу #gadgets #гаджеты #технологии
⚡ ОpenAI призвала отказаться от использования SWE-bench Verified для оценки моделей
ВчераВчера
~1 мин