На ежегодной конференции Build 2026 подразделение Microsoft AI официально представило масштабное обновление технологического стека — собственную независимую линейку искусственного интеллекта под названием MAI. В этот релиз вошли сразу семь конфигураций нейросетей, каждая из которых создавалась инженерами компании с нуля, без привлечения сторонних технологий или заимствования архитектурных решений у партнеров. Разработчики особо подчеркивают, что при обучении моделей не использовался метод дистилляции знаний из систем конкурентов. Всю базу данных для обучения составили исключительно коммерчески лицензированные текстовые и мультимедийные массивы, а также тщательно отфильтрованные и очищенные от мусора веб-страницы.
Главная практическая цель создания этого семейства — радикальное снижение стоимости обработки токенов, уменьшение задержки при генерации ответов и общая энергоэффективность. Вместо бесконечного раздувания масштаба ИИ, инженеры сделали упор на точечную оптимизацию под конкретные рабочие сценарии, корпоративный софт и автоматизацию повседневных задач. При этом по своим возможностям модели напрямую конкурируют с крупнейшими коммерческими аналогами на рынке.
Полный разбор линейки: семь новых инструментов
В состав новой экосистемы вошли специализированные алгоритмы для работы с текстом, программным кодом, статичной графикой и звуком. Архитектурно они разделены на тяжелые флагманские версии и быстрые субмодели с приставкой Flash.
1. MAI-Thinking-1. Центральный элемент всей презентации. Это флагманская текстовая модель, разработанная специально для выполнения сложных многошаговых логических рассуждений, глубокого анализа данных, решения математических задач и проектирования архитектуры программного обеспечения. Модель построена на базе архитектуры Mixture of Experts (MoE — смесь экспертов). Внутри нее задействовано около 35 миллиардов активных параметров при общем объеме системы в районе 1 триллиона параметров. Модель оснащена внушительным контекстным окном емкостью 256 тысяч токенов, что позволяет загружать в нее огромные массивы документов целиком. Первые результаты закрытых слепых тестов демонстрируют, что в решении комплексных логических задач и программировании модель идет на равных с Claude Sonnet 4.6.
2. MAI-Code-1-Flash. Максимально облегченная, быстрая и экономически доступная модель, созданная исключительно для написания и аудита программного кода. Общий объем составляет 137 миллиардов параметров, однако в момент генерации активируются лишь 5 миллиардов из них. Такая структура позволяет интегрировать инструмент непосредственно в среды разработки (IDE) в качестве умного автодополнения строк. Модель минимизирует время ожидания ответа и существенно снижает затраты на поддержку ИИ-ассистентов для программистов.
3. MAI-Image-2.5. Проприетарная модель нового поколения для генерации и глубокого редактирования графического контента. Разработчики сфокусировались на трех ключевых аспектах: фотореалистичном отображении текстур и анатомии, точном рендеринге печатного текста внутри сгенерированных изображений (что раньше вызывало проблемы у многих систем) и четком следовании сложным пространственным макетам из текстового запроса.
4. MAI-Image-2.5-Flash. Скоростная модификация графического движка. Она уступает старшей версии в детализации микротекстур, но оптимизирована для моментальной генерации картинок "на лету". Ее основная задача — быстрая визуализация идей, создание эскизов и работа в интерфейсах, где критически важна скорость отклика.
5. MAI-Transcribe-1.5. Специализированный аудиомодуль, предназначенный для высокоточного распознавания речи и перевода звуковых дорожек в текстовый формат. На момент официального релиза заявлена полноценная и корректная поддержка 43 языков, включая распознавание сложных технических терминов, профессионального сленга и специфических региональных акцентов. Ближайшие обновления добавят функцию потоковой транскрипции в режиме реального времени.
6. MAI-Voice-2. Модель обратного действия — генерация естественной человеческой речи из печатного текста. Система получила значительно расширенную языковую базу и библиотеку новых голосов с реалистичными интонациями, паузами для вздохов и адаптивным ударением. Подходит для профессиональной озвучки текстовых материалов, книг и создания аудиоконтента.
7. MAI-Voice-2-Flash. Оптимизированный речевой движок, главная фишка которого заключается в снижении задержки обработки звукового сигнала до абсолютного минимума. Модель создавалась специально для интеграции в голосовые интерфейсы, интерактивные помощники и сервисы клиентской поддержки, где диалог должен строиться без пауз и зависаний со стороны робота.
Где и как протестировать новые модели на практике
Доступ к экосистеме MAI сейчас открывается поэтапно и зависит от профиля пользователя, задач и используемых платформ. На данный момент развернуты следующие каналы тестирования:
Для разработчиков, инженеров и корпоративного сектора. Весь массив новых моделей постепенно разворачивается в рамках облачной инфраструктуры Azure на специализированной платформе Microsoft Foundry. На текущий момент там полностью открыто тестирование графического блока моделей. Что касается главного текстового флагмана MAI-Thinking-1, то он сейчас доступен в режиме закрытого предварительного просмотра (private preview) для ограниченного круга ранних корпоративных партнеров и крупных клиентов компании. Технические спецификации, инструкции по интеграции через API и документация по развертыванию опубликованы на официальном информационном портале learn.microsoft.com
Для обычных пользователей и создателей контента. Microsoft внедряет элементы новых речевых технологий и алгоритмы генерации изображений напрямую в свои потребительские продукты. Инструменты линейки MAI постепенно интегрируются в экосистему персональных ассистентов Copilot, модули автоматического создания графики и слайдов внутри офисного пакета PowerPoint, а также в интеллектуальные функции каталогизации и поиска внутри облачного хранилища OneDrive.
Для быстрых экспериментов в браузере. Оценить базовые возможности обработки звука, генерации речи и создания изображений можно на официальной демонстрационной площадке microsoft.ai в специальном новостном хабе и интерактивной тестовой зоне MAI Playground. Кроме того, самая первая ознакомительная текстовая версия под техническим названием MAI-1-preview ранее уже была загружена на краудсорсинговую платформу тестирования lmarena.ai, где ее базовые возможности работы с текстом можно проверить в режиме слепого сравнительного голосования против других ИИ.