📝 Кратко: MiniMax выпустили MiniMax-M2.5. Модель обучали с RL в сотнях тысяч реальных окружений. Фокус — кодинг, tool use, поиск и офисные сценарии.По бенчмаркам:– 80.2% на SWE-Bench Verified– 51.3% на Multi-SWE-Bench– 76.3% на BrowseComp (с управлением контекстом)SWE-Bench Verified M2.5 проходит на 37% быстрее, чем M2.1: среднее время снизилось с 31.3 до 22.8 минут. Это сопоставимо с Opus 4.6 (22.9 мин)... 🔗 Читать оригинальную статью (ссылка) 📊 Источник: Habr ⏰ Время: 12.02.2026 17:36 📱 Другие каналы: 🪙 ВКрипту | 🎮 ВИгрухи | 🏎️ ВТачки | ✈️ ВТравелу #gadgets #гаджеты #технологии
⚡ MiniMax представили M2.5 — флагманскую модель для кодинга и агентных задач
СегодняСегодня
~1 мин