79 подписчиков

Новый ИИ MiniMax M2.7: «самоэволюционирующая» модель, которая делает до 50% работы за исследователей

19 марта19 мар

4 мин

Новая проприетарная AI-модель MiniMax M2.7 способна автономно выполнять 30-50% рабочего процесса в reinforcement learning, выступая как «самоэволюционирующий» соавтор собственного прогресса. Она оптимизирует собственный код, анализирует ошибки и планирует модификации, сокращая потребность в человеческом вмешательстве. Telegram-канал ProAi регулярно освещает подобные прорывы в мире искусственного интеллекта. Вот что по-настоящему удивило. Согласно документации компании, предыдущие версии M2.7 использовались для создания исследовательского агента, который управляет пайплайнами данных, тренировочными средами и инфраструктурой оценки. Модель автономно запускала чтение логов, отладку и анализ метрик — и справлялась с существенной частью своей же разработки. Это не просто автоматизация рутины. M2.7 оптимизировала собственные программы, анализируя траектории ошибок и планируя модификации кода за 100 итерационных циклов. Инженеры MiniMax объясняют: они специально обучали модель лучше планирова

Оглавление

Как ИИ начал улучшать сам себя — и что это значит для всех нас
Петля самоэволюции: когда код пишет себя сам
Цифры не врут: M2.7 против предшественника

Как ИИ начал улучшать сам себя — и что это значит для всех нас

Петля самоэволюции: когда код пишет себя сам

Вот что по-настоящему удивило. Согласно документации компании, предыдущие версии M2.7 использовались для создания исследовательского агента, который управляет пайплайнами данных, тренировочными средами и инфраструктурой оценки. Модель автономно запускала чтение логов, отладку и анализ метрик — и справлялась с существенной частью своей же разработки.

Это не просто автоматизация рутины. M2.7 оптимизировала собственные программы, анализируя траектории ошибок и планируя модификации кода за 100 итерационных циклов. Инженеры MiniMax объясняют: они специально обучали модель лучше планировать и уточнять требования с пользователем. Следующий шаг — более сложный симулятор пользователя.

В сложных средах типа MLE Bench Lite, серии машинных соревнований, модель показала результат в 66.6% получения медалей. Это уровень Google Gemini 3.1 и приближается к текущим топ-результатам Claude Opus 4.6. Цель? Полная автономия в обучении моделей и архитектуре вывода без участия человека.

Цифры не врут: M2.7 против предшественника

По сравнению с M2.5, выпущенной в феврале 2026, новая модель демонстрирует серьёзный рывок в инженерии и профессиональных задачах. Если M2.5 блистала в коде, то M2.7 заточена под реальный мир.

Программная инженерия: 56.22% на SWE-Pro — уровень топовых мировых конкурентов вроде GPT-5.3-Codex.
Обработка документов: Elo-рейтинг 1495 на GDPval-AA, что, по заявлениям компании, лучший результат среди открыто доступных моделей.
Снижение галлюцинаций: Рейтинг +1 на AA-Omniscience Index против -40 у M2.5. Это огромный скачок! Сам уровень галлюцинаций — 34%, ниже чем у Claude Sonnet 4.6 (46%) и Gemini 3.1 Pro Preview (50%).
Понимание систем: 57.0% на Terminal Bench 2 — модель демонстрирует глубокое понимание операционной логики, а не просто генерирует код.
Экономия токенов: Способности к рассуждению эквивалентны GLM-5, но использует на 20% меньше выходных токенов для схожих результатов.

И да, есть и обратная сторона: на BridgeBench, наборе задач для «виб-кодинга», M2.7 заняла 19-е место против 12-го у M2.5. Так что прогресс не всегда линейный.

Доступ, цены и интеграция: демократизация frontier-моделей

MiniMax M2.7 доступна через API компании и платформы создания агентов. Ядро модели закрыто, но компания продолжает вклад в экосистему через открытый проект OpenRoom.

А вот цены — отдельная история. Через API и OpenRouter модель предлагает лидирующую стоимость: 0.30 доллара за 1 миллион входных токенов и 1.20 доллара за 1 миллион выходных. Только xAI Grok 4.1 Fast дешевле. Представь: frontier-модель по цене, доступной многим. Для доступа к зарубежным сервисам и API можно использовать удобные виртуальные карты от сервисов Wanttopay или Плати по миру.

Для разных масштабов MiniMax предлагает структурированные Token Plan с подписками разного уровня — от энтузиастов до крупных производственных нагрузок. Есть и реферальная программа с 10% скидкой для новых пользователей.

Что это значит на практике?

Для технических специалистов выпуск M2.7 — знак: агентный ИИ перешёл от прототипов к готовым рабочим инструментам. Способность модели сокращать время восстановления рабочих инцидентов до трёх минут, автономно сопоставляя метрики мониторинга с репозиториями кода, может изменить подход SRE и DevOps команд.

С финансовой точки зрения — это прорыв в эффективности. Анализ показывает: запуск M2.7 стоит менее трети от стоимости GLM-5 при эквивалентном уровне интеллекта. Например, стандартный индекс интеллекта обошёлся в 176 долларов на M2.7 против 547 долларов для GLM-5.

Рынок насыщен высокопроизводительными моделями, но специфическая оптимизация M2.7 для работы с Office Suite и высокие результаты в GDPval-AA делают её главным кандидатом для организаций, сфокусированных на документообороте и финансовом моделировании.

Конечно, есть нюансы: модель от китайской компании со штаб-квартирой в Шанхае, подчиняется местным законам, не доступна для офлайн-использования. Это может быть препятствием для западных предприятий, особенно в регулируемых отраслях. При необходимости работы с такими моделями через защищённые соединения можно воспользоваться надёжными прокси от proxyline.

Но сам тренд на самоэволюционирующие модели говорит об одном: отдача от инвестиций в ИИ всё больше будет зависеть от рекурсивного роста самой системы. Организации, которые внедрят модели, способные улучшать свои же инструменты, могут оказаться на более быстрой кривой развития. А с агрессивной интеграцией MiniMax в современный стек разработчиков, барьер для тестирования этих автономных рабочих процессов резко упал. Конкурентам придётся соответствовать.

🔔 Чтобы читать больше про нейросети, AI-сервисы и практические кейсы, подписывайся на канал «ProAI» в Telegram!