81 подписчик

Zoom обогнала Google и OpenAI в тесте на искусственный интеллект: как видеоконференция стала лидером AI

18 декабря 202518 дек 2025

8 мин

Zoom Video Communications — компания, которую все знают как спасителя удаленных работников во время пандемии — буквально на днях заявила о чем-то совершенно неожиданном. Она якобы набрала самый высокий результат за всю историю одного из самых сложных тестов искусственного интеллекта. Представляете? Технологическая индустрия буквально взорвалась от удивления, скептицизма и любопытства. Компания из Сан-Хосе сообщила, что её система ИИ набрала 48,1 процента на Humanity’s Last Exam — это такой тест, придуманный экспертами со всего мира специально, чтобы сломить даже самые продвинутые ИИ модели. И что? Zoom опередила Gemini 3 Pro от Google, которая до этого держала рекорд на отметке 45,8 процента. «Zoom достигла нового рекорда на сложном тесте Humanity’s Last Exam, набрав 48,1 процента — это на 2,3 процента выше предыдущего рекорда», — написал Сюдун Хуан, главный технолог Zoom, в своём блоге. И тут же возникает вопрос, который уже дни толку занимает экспертов: как это возможно? Как видеокон

Оглавление

Вопрос, который волнует весь AI-мир
Zoom не создала свою модель. Вот что она реально сделала
AI-сообщество раскололось: что считать настоящей инновацией?

Компания из Сан-Хосе сообщила, что её система ИИ набрала 48,1 процента на Humanity’s Last Exam — это такой тест, придуманный экспертами со всего мира специально, чтобы сломить даже самые продвинутые ИИ модели. И что? Zoom опередила Gemini 3 Pro от Google, которая до этого держала рекорд на отметке 45,8 процента.

«Zoom достигла нового рекорда на сложном тесте Humanity’s Last Exam, набрав 48,1 процента — это на 2,3 процента выше предыдущего рекорда», — написал Сюдун Хуан, главный технолог Zoom, в своём блоге.

Вопрос, который волнует весь AI-мир

И тут же возникает вопрос, который уже дни толку занимает экспертов: как это возможно? Как видеоконференц-приложение — компания, которая никогда не занималась обучением больших языковых моделей — вдруг обогнала Google, OpenAI и Anthropic на тесте, который якобы измеряет границы машинного интеллекта?

Ответ на этот вопрос говорит нам многое. И в зависимости от того, кого слушать — это либо гениальный ход практической инженерии, либо выдача чужой работы за свою.

Zoom не создала свою модель. Вот что она реально сделала

Слушайте внимательно. Zoom не тренировала собственную большую языковую модель. Вместо этого компания разработала то, что называется «федеративным подходом к ИИ» — это такая система, которая маршрутизирует запросы к уже существующим моделям от OpenAI, Google и Anthropic. А затем использует собственное программное обеспечение, чтобы выбрать, объединить и улучшить их результаты.

В центре этой системы находится так называемый «Z-scorer» — механизм, который оценивает ответы разных моделей и выбирает лучший для каждой конкретной задачи. Плюс к этому идёт стратегия «исследуй-проверь-объедини», агентский процесс, который уравновешивает исследовательское рассуждение с проверкой через несколько систем ИИ.

«Наш федеративный подход объединяет собственные небольшие языковые модели Zoom с продвинутыми открытыми и закрытыми моделями», — объяснил Хуан. Вся эта система «управляет разными моделями, чтобы они генерировали, оспаривали и совершенствовали рассуждения через диалектическое сотрудничество».

Проще говоря: Zoom построила умный трафик-контроллер для ИИ. Не сам ИИ, а контроллер!

Это различие огромно. В индустрии, где права на хвастовство часто стоят миллиарды в оценке компании, очень важно, кто может заявить о самой мощной модели. Большие лаборатории ИИ тратят сотни миллионов на обучение систем. Zoom же, похоже, просто очень умно объединила уже существующие системы.

AI-сообщество раскололось: что считать настоящей инновацией?

Реакция из AI-сообщества была быстрой и жёсткой.

Макс Рампф, инженер ИИ, который тренировал современные языковые модели, написал остроумную критику в соцсетях: «Zoom просто натянула API-запросы к Gemini, GPT, Claude и так далее, и слегка улучшила результат на бенчмарке, который не приносит никакой пользы её клиентам. А потом заявляет о рекорде». Справедливо, да?

Но Рампф критиковал не сам подход. Использовать несколько моделей для разных задач — это, по его мнению, «на самом деле довольно умно, и все приложения должны так делать». Он даже привёл пример компании Sierra, которая занимается ИИ в сфере обслуживания клиентов и использует многомодельную стратегию.

Его возражение было конкретнее: «Они не тренировали модель, а просто скрыли этот факт в твите. Присвоение чужой работы глубоко ранит людей».

Но другие посмотрели на это совсем по-другому. Хончэн Чжу, разработчик, предложил более взвешенную оценку: «Чтобы выиграть в тесте ИИ, вам почти наверняка нужна федерация моделей, как у Zoom. Это как на Kaggle — каждый конкурсант знает, что нужно объединять модели, чтобы победить».

Сравнение с Kaggle — платформой для data science-соревнований, где объединение моделей — это стандартная практика побеждающих команд — переворачивает восприятие подхода Zoom. Это уже не трюк, а лучшая практика индустрии. Научные исследования давно показали: объединённые модели обычно работают лучше отдельных.

Но дебаты выявили один момент. Райан Прим, основатель Exoria AI, был категоричен: «Zoom просто натягивает обвязку вокруг чужой большой языковой модели и об этом говорит. Это просто шум». Кто-то шутливо заметил: «Что видеоконференц-приложение ZOOM создаст модель на уровне SOTA и наберёт 48% на HLE — это не было в моём списке ожидаемого».

Самая острая критика касалась приоритетов. Рампф писал, что Zoom могла направить ресурсы на реальные проблемы пользователей. «Поиск информации в транскриптах звонков не решается просто благодаря SOTA LLM», — отметил он. «Пользователи Zoom, похоже, заботятся об этом намного больше, чем о Humanity’s Last Exam».

За спиной всего этого — ветеран Microsoft

Если результат Zoom появился ниоткуда, то её главный технолог — нет.

Сюдун Хуан пришёл в Zoom из Microsoft, где он десятилетиями создавал AI-возможности компании. Он основал группу речевых технологий Microsoft в 1993 году и руководил командами, которые достигли того, что Microsoft называла человеческим паритетом в распознавании речи, машинном переводе, понимании естественного языка и компьютерном зрении.

Хуан имеет докторскую степень по электротехнике Эдинбургского университета. Он избранный член Национальной академии инженерии и Американской академии искусств и наук. Он также fellow IEEE и ACM. Его учётные данные — это среди самых впечатляющих в индустрии.

Его присутствие в Zoom говорит, что амбиции компании в AI серьёзные. Даже если методы отличаются от лабораторий, которые кричат со страниц новостей. В твите, где Хуан праздновал результат, он фреймировал достижение как подтверждение стратегии Zoom: «Мы разблокировали более сильные способности в исследовании, рассуждении и многомодельном сотрудничестве, превосходя пределы любой отдельной модели».

Это финальное предложение — «превосходя пределы любой отдельной модели» — может быть самым главным. Хуан не утверждает, что Zoom создала лучшую модель. Он утверждает, что Zoom создала лучшую систему для использования моделей.

Что вообще такое этот тест Humanity’s Last Exam?

Тест, из-за которого вся эта история, — Humanity’s Last Exam — был разработан, чтобы быть исключительно сложным. В отличие от более ранних тестов, которые ИИ-системы научились проходить через простое нахождение паттернов, HLE предлагает проблемы, требующие настоящего понимания, многошагового рассуждения и синтеза информации через сложные области знания.

Экзамен собран из вопросов экспертов со всего мира: от продвинутой математики до философии и специализированного научного знания. Результат 48,1 процента может звучать неплохо обычному человеку, привыкшему к школьным отметкам. Но в контексте HLE это представляет текущий потолок производительности машин.

«Этот бенчмарк был разработан экспертами-практиками по всему миру и стал критическим показателем для измерения прогресса ИИ в сторону человеческого уровня производительности на сложных интеллектуальных задачах», — заявила Zoom в своём анонсе.

Улучшение на 2,3 процента в сравнении с предыдущим рекордом Google может выглядеть скромно. Но когда речь идёт о конкурентном бенчмаркировании, где прибыль часто идёт на доли процента — это внимание привлекает.

О чём это говорит будущему корпоративного ИИ?

Подход Zoom несёт следствия, которые выходят за пределы просто таблиц лидеров. Компания сигнализирует о видении корпоративного ИИ, которое радикально отличается от стратегий OpenAI, Anthropic и Google.

Вместо того, чтобы ставить всё на одну карту — создание одной самой мощной модели — Zoom позиционирует себя как слой управления. Компания, которая интегрирует лучшие возможности от нескольких поставщиков и доставляет их через продукты, которые бизнес уже каждый день использует.

Эта стратегия защищает от критической неопределённости на рынке ИИ: никто не знает, какая модель будет лучше в следующем месяце, не говоря уже о следующем году. Создав инфраструктуру, которая может переключаться между поставщиками, Zoom избегает привязанности к одному поставщику. При этом теоретически предлагает клиентам лучший доступный ИИ для любой задачи.

Анонс GPT-5.2 от OpenAI на следующий день подчеркнул эту динамику. Сама OpenAI назвала Zoom партнёром, который оценил новую модель «через свои ИИ-рабочие нагрузки и увидел измеримое улучшение во всём». Zoom — и клиент фронтальных лабораторий, и одновременно конкурент на их же бенчмарках, использующий их собственные технологии.

Это может быть устойчивым. У основных провайдеров моделей есть все стимулы продавать доступ через API широко, даже компаниям, которые могут агрегировать их результаты. Более интересный вопрос: являются ли возможности управления Zoom настоящей интеллектуальной собственностью или просто умным prompt-инжинирингом, который другие могут скопировать?

Реальный тест придёт, когда начнут спрашивать 300 миллионов пользователей

Zoom озаглавила свой раздел про отношения с индустрией так: «Совместное будущее». Хуан через всё своё заявление проводил благодарность и сотрудничество. «Будущее ИИ — совместное, а не конкурентное», — написал он. «Объединяя лучшие инновации со всей индустрии с нашими собственными прорывами, мы создаём решения, которые больше, чем сумма своих частей».

Такой фрейм позиционирует Zoom как благороднейшего интегратора, соединяющего лучшую работу индустрии на пользу корпоративных клиентов. Критики видят иное: компания, претендующая на престиж AI-лаборатории без фундаментального исследования, которое его заслуживает.

Дебаты, похоже, будут разрешены не таблицами результатов, а реальными продуктами. Когда AI Companion 3.0 доберётся до сотен миллионов пользователей Zoom в ближайшие месяцы, они сами отдадут свой вердикт. Не о тестах, о которых они никогда не слышали, а о том, правда ли суммаризация встречи поймала суть, имели смысл action items, и сэкономил ли ИИ их время или его потратил впустую.

В конечном счёте, самое провокационное заявление Zoom может быть вообще не о том, что она топит бенчмарк. Это может быть молчаливый аргумент, что в эру ИИ лучшая модель — не та, которую ты строишь. Это та, которую ты умеешь использовать.

Эта история показывает, как AI-индустрия меняется прямо на наших глазах — и это просто начало. Если хочешь понимать, как будут работать реальные AI-системы завтра, нужно следить за этим трендом.🔔 Чтобы узнать больше о трендах в AI, интеграции моделей и перспективах корпоративного интеллекта, подпишись на канал «ProAI» в Telegram!