Добавить в корзинуПозвонить
Найти в Дзене
Social Mebia Systems

Microsoft AI представляет свои первые собственные модели: мощный голосовой синтез и ответ CEO о разрыве с OpenAI

Компания Microsoft сделала значительный шаг в области искусственного интеллекта, представив свои первые полностью собственные большие языковые модели. Это событие знаменует новый этап в развитии её AI-стратегии и заставляет по-новому взглянуть на отношения с ключевым партнёром, OpenAI. Дебют собственных разработок: MAI-1 и голосовой синтезатор 29 августа подразделение Microsoft AI (MAI) анонсировало две новые модели: Примечательно, что релиз MAI-Voice-1 совпал по времени с анонсом новой голосовой модели от OpenAI. Это совпадение подогрело спекуляции о растущей конкуренции между давними союзниками. MAI-Voice-1: Невероятная гибкость и «игривость» Журналисты, протестировавшие MAI-Voice-1, отмечают её исключительную настраиваемость. Пользователи могут выбирать не только эмоциональную окраску (радость, гнев, печаль и т.д.), но и один из 40+ стилей речи и персонажей. Модель может говорить как робот, пират, вампир, диктор новостей или даже сова — каждый со своим уникальным тембром, манерами и

Компания Microsoft сделала значительный шаг в области искусственного интеллекта, представив свои первые полностью собственные большие языковые модели. Это событие знаменует новый этап в развитии её AI-стратегии и заставляет по-новому взглянуть на отношения с ключевым партнёром, OpenAI.

Дебют собственных разработок: MAI-1 и голосовой синтезатор

29 августа подразделение Microsoft AI (MAI) анонсировало две новые модели:

  • MAI-1-preview: собственная базовая модель смешанного типа (Mixture of Experts), обученная с нуля. По данным издания «智东西» (Zhìdōngxī), её обучение проводилось на кластере примерно из 15 000 GPU NVIDIA H100. Модель ориентирована на выполнение инструкций и повседневное взаимодействие с пользователями.
  • MAI-Voice-1: высококачественная голосовая модель, способная генерировать выразительный и эмоциональный аудиоконтент.

Примечательно, что релиз MAI-Voice-1 совпал по времени с анонсом новой голосовой модели от OpenAI. Это совпадение подогрело спекуляции о растущей конкуренции между давними союзниками.

MAI-Voice-1: Невероятная гибкость и «игривость»

Журналисты, протестировавшие MAI-Voice-1, отмечают её исключительную настраиваемость. Пользователи могут выбирать не только эмоциональную окраску (радость, гнев, печаль и т.д.), но и один из 40+ стилей речи и персонажей. Модель может говорить как робот, пират, вампир, диктор новостей или даже сова — каждый со своим уникальным тембром, манерами и характерными «словечками».

Технически модель эффективна: по заявлению Microsoft, она работает на одном GPU и генерирует одну минуту аудио за секунду. На данный момент модель поддерживает только английский язык, автоматически преобразуя любой введённый текст (включая китайский) в английский для озвучки.

Зачем Microsoft свои модели, если есть OpenAI? Отвечает CEO

Появление собственных моделей закономерно вызвало вопрос: означает ли это охлаждение в отношениях с OpenAI? Генеральный директор Microsoft AI Мустафа Сулейман (Mustafa Suleyman) в интервью Semafor дал прямые ответы.

1. Стратегия многообразия, а не замещения
Сулейман заявил, что разработка собственных моделей была начата 14 месяцев назад как фундаментальная необходимость для бизнеса такого масштаба, как Microsoft. «AI имеет фундаментальное значение для Microsoft... нам необходимо иметь внутренние экспертные возможности для создания самых мощных моделей в мире».

При этом он подчеркнул, что компания будет придерживаться стратегии «выбора»:

  • Продолжение сотрудничества с OpenAI. Сулейман назвал партнёрство «невероятно успешным» и выразил уверенность в его продолжении.
  • Использование открытых (open-source) моделей.
  • Развитие собственных моделей.

Ключевым звеном будущего, по его словам, станет не сама модель, а «оркестратор» — интеллектуальный маршрутизатор, который будет решать, какую модель (партнёрскую, собственную или открытую) использовать для лучшего ответа на конкретный запрос пользователя.

2. Эффективность против грубой силы
Отвечая на вопрос о сравнительно скромном (по нынешним меркам) кластере для обучения, Сулейман отметил, что важна не только мощность, но и эффективность. Команда MAI сделала ставку на тщательный отбор высококачественных данных для обучения, чтобы максимально эффективно использовать каждый цикл GPU. Результат, по его словам, — «модель мирового класса, превосходящая свой вес».

3. Модель как «сырьё для личности»
Сулейман охарактеризовал MAI-1-preview как «сырую личность» или «заготовку». В процессе дообучения и с помощью инженерных промтов эта база может быть превращена в миллионы различных персонажей с уникальными чертами для разных продуктов и брендов.

Он предрёк бум персонализированных AI-личностей в ближайшие годы, призвав одновременно responsibly подходить к рискам, связанным с созданием AI, который слишком убедительно имитирует человека.

4. Скептицизм относительно «сознания» ИИ
Глава Microsoft AI высказал мнение, что большие языковые модели по своей природе «полые» (hollow). Они brilliantly имитируют человеческий опыт, но не обладают сознанием, волей или мотивацией. Поэтому, по его словам, исследования в области интерпретируемости (объяснения работы модели), хоть и важны, вряд ли откроют тайны сознания, а скорее являются формой «очеловечивания» машины.

Взгляд в будущее

Мустафа Сулейман подтвердил, что Microsoft продолжает масштабные инвестиции в AI, строя одни из крупнейших в мире кластеров на базе GPU NVIDIA GB200. Уже ведётся работа над следующей, более крупной и мощной версией модели MAI-2.

Первая собственная модель Microsoft — это не разрыв с прошлым, а заявление о зрелости. Компания больше не хочет зависеть от единственного поставщика передовых AI-технологий, даже от самого близкого партнёра. Её будущее — в гибкой экосистеме, где собственные разработки, модели OpenAI и open-source решения сосуществуют под управлением интеллектуального «оркестратора», что сделает Copilot и другие продукты ещё более мощными и универсальными.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/