Добавить в корзинуПозвонить
Найти в Дзене

Microsoft MAI: в 10 раз дешевле GPT, но слабее Claude 4.8

Microsoft заменила OpenAI в Copilot своими моделями MAI, сэкономив в 10 раз. Но эта «независимость» обернулась заметной потерей качества. Звучит как триумф, пока не копнёшь в цифры. Представь, что ты годами снимал дорогущий пентхаус у соседа, переплачивая за каждый квадратный метр. А потом внезапно решил построить свой собственный небоскрёб прямо напротив. Теперь можно переставлять стены как хочешь, не спрашивать разрешения и, главное, перестать платить аренду. Именно это сейчас сделала Microsoft с бэкендом Copilot и VS Code. Для Сатьи Наделлы этот переезд — вопрос не столько технологий, сколько бухгалтерии. Затраты на токены упали в 10 раз по сравнению с решениями OpenAI. Когда у тебя миллионы пользователей, которые ежедневно просят ИИ поправить отступ в коде, такая экономия превращается в миллиарды долларов. Технически Microsoft развернула семейство моделей MAI на базе архитектуры MoE, где из общего триллиона параметров в работу включаются только 35 миллиардов. Чтобы всё это летало,
Оглавление

Microsoft заменила OpenAI в Copilot своими моделями MAI, сэкономив в 10 раз. Но эта «независимость» обернулась заметной потерей качества. Звучит как триумф, пока не копнёшь в цифры.

Представь, что ты годами снимал дорогущий пентхаус у соседа, переплачивая за каждый квадратный метр. А потом внезапно решил построить свой собственный небоскрёб прямо напротив. Теперь можно переставлять стены как хочешь, не спрашивать разрешения и, главное, перестать платить аренду. Именно это сейчас сделала Microsoft с бэкендом Copilot и VS Code.

Свой небоскрёб вместо аренды: производительность LLM против экономии

Для Сатьи Наделлы этот переезд — вопрос не столько технологий, сколько бухгалтерии. Затраты на токены упали в 10 раз по сравнению с решениями OpenAI. Когда у тебя миллионы пользователей, которые ежедневно просят ИИ поправить отступ в коде, такая экономия превращается в миллиарды долларов.

Технически Microsoft развернула семейство моделей MAI на базе архитектуры MoE, где из общего триллиона параметров в работу включаются только 35 миллиардов. Чтобы всё это летало, они даже свои чипы Maia 200 запилили. В итоге получилось решение, которое идеально интегрировано в VS Code и Azure. Но тут возникает главный вопрос: стал ли твой код лучше, или ты просто помог Microsoft сэкономить на аренде мозгов?

Ловушка версий и «почти топ»

В пресс-релизах Microsoft с гордостью заявляет, что их флагман MAI-Thinking-1 работает на уровне Claude Opus 4.6. Звучит солидно, пока ты не открываешь календарь. Оказывается, актуальный лидер рынка Claude Opus 4.8 вышел ещё в мае и просто разносит новинку от Microsoft в пух и прах.

Если смотреть на SWE-Bench Pro, где проверяют реальные навыки решения задач в репозиториях, MAI выдаёт около 53%. А Opus 4.8 забирает почти 70%. Разница в 17% — это настоящая пропасть. Microsoft пытается выдать догоняющую модель за фронтир, для этого аккуратно подбирая версию конкурента для сравнения. Это как если бы ты хвастался новым смартфоном, сравнивая его с моделью двухлетней давности, чтобы казаться лидером.

Иллюзия лидерства

Пока Microsoft празднует обретение независимости, настоящий передел рынка происходит в другом месте. Если тебе нужна сырая мощность и реальная экономия, ты идёшь к DeepSeek. Их V4-Pro дешевле западных моделей и обходит MAI по всем значимым метрикам кодинга.

Microsoft же просто делает Copilot достаточно хорошим. Им важно, чтобы инструмент работал стабильно и не сжигал бюджет компании, даже если они не первые в мире по качеству рассуждений. MAI-Code-1-Flash теперь рулит в VS Code, и ты, скорее всего, даже не заметишь подмены, если не просишь ИИ спроектировать сложную архитектуру с нуля. Для простых правок и автодополнения этого хватит, но называть это суперинтеллектом — значит слишком сильно верить собственному маркетингу.

Подбираю и внедряю модели под задачи бизнеса без переплаты — за деталями в телеграм @dmitra_ai или ВКонтакте.

В итоге мы получили ситуацию, как с бюджетным ремонтом в квартире. Стены покрашены в модный цвет, сантехника новая, и вообще всё выглядит очень современно. Но если присмотреться, то звукоизоляция так себе, а в ванной иногда подтекает кран. Жить можно, даже приятно, но соседний пятизвёздочный отель всё ещё остаётся недосягаемым идеалом.