Добавить в корзинуПозвонить
Найти в Дзене
Интерсвязь

«Последний экзамен человечества»: сможет ли его пройти ИИ?

Современные модели искусственного интеллекта развиваются с невероятной скоростью, легко справляясь с тестами, которые еще вчера считались вершиной сложности. Это заставляет исследователей всего мира искать новые, гораздо более сложные способы оценки возможностей ИИ. Представьте себе самый сложный экзамен на свете. Там нет вопросов про столицы или таблицу умножения. Вместо этого вас спросят о тонкостях анатомии колибри или о квантовой физике. Такой тест придумали для искусственного интеллекта, и он называется «Последний экзамен человечества». Давайте разберемся, что это за испытание и как умные машины с ним справляются. В 2025 году разработчики ИИ осознали: их творения стали слишком умными. Старые тесты они щелкали как орешки – результаты выше 90 %. Нужен был новый, суперсложный вызов – более требовательный эталон для оценки прогресса. Так и появился «Последний экзамен человечества». Его главная цель – проверить способности больших языковых моделей в условиях, максимально приближенных
Оглавление

Современные модели искусственного интеллекта развиваются с невероятной скоростью, легко справляясь с тестами, которые еще вчера считались вершиной сложности. Это заставляет исследователей всего мира искать новые, гораздо более сложные способы оценки возможностей ИИ.

Представьте себе самый сложный экзамен на свете. Там нет вопросов про столицы или таблицу умножения. Вместо этого вас спросят о тонкостях анатомии колибри или о квантовой физике. Такой тест придумали для искусственного интеллекта, и он называется «Последний экзамен человечества».

Давайте разберемся, что это за испытание и как умные машины с ним справляются.

Что это за экзамен такой?

В 2025 году разработчики ИИ осознали: их творения стали слишком умными. Старые тесты они щелкали как орешки – результаты выше 90 %. Нужен был новый, суперсложный вызов – более требовательный эталон для оценки прогресса.

Так и появился «Последний экзамен человечества». Его главная цель – проверить способности больших языковых моделей в условиях, максимально приближенных к границам человеческих знаний.

Идея создания такого теста принадлежит исследователю в области машинного обучения Дэну Хендриксу.

Тест включает 2500 уникальных вопросов, охватывающих более 100 научных дисциплин: от математики, физики и биологии до социальных наук и инженерии. Около 24 % вопросов предполагают множественный выбор, а остальные требуют развернутого и однозначного ответа. Особенность – наличие заданий на интерпретацию графиков и изображений, что делает его еще сложнее. Некоторые задания настолько узкоспециальные, что даже профессора с многолетним стажем над ними задумаются.

Вот, например, один из реальных вопросов:

«Колибри имеют особую парную косточку в месте прикрепления хвостовых мышц. Так сколько же пар сухожилий поддерживают эту косточку?».

Именно такие задачки и ждут ИИ в тесте.

Как придумали этот тест?

Идея родилась у исследователя Дэна Хендрикса после разговора с Илоном Маском. Маск как-то сказал, что нынешние тесты для ИИ – это слишком просто. Команда Хендрикса вместе с компанией Scale AI взялась за дело.

Для сбора вопросов привлекли более тысячи экспертов из 50 стран: профессоров, исследователей и обладателей ученых степеней.

Отбор проходил в два строгих этапа:

  1. Сначала тысячи вопросов были предложены ведущим ИИ. Если модель не могла на них ответить, вопрос отбирался для дальнейшего рассмотрения.
  2. Отобранные вопросы прошли двойную проверку рецензентами уровня выпускников и организаторами теста.

Текущие результаты: кто в лидерах?

Первые результаты в начале 2025 года были провальными: ни одна модель не смогла набрать даже 10 %.

Но машины учатся быстро. Уже летом ИИ показали результат куда лучше! Лидером гонки является модель Grok 4 от xAI Илона Маска – 25,4 %. Этот показатель увеличился до 44,4 % с версией Grok 4 Heavy, которая использует несколько ИИ-агентов для решения задач. Немного отстают модели GPT 5 от OpenAI (25,3 %) и Gemini 2.5 Pro от Google (21,6 %).

-2

Эти результаты демонстрируют невероятную скорость развития технологий. Разработчики уверены, что к концу года их творения смогут набрать заветные 50 %, что поставит их в один ряд с экспертами-людьми мирового класса.

Пока ИИ соревнуются, мы работаем над тем, чтобы ваше подключение к цифровому миру было мгновенным и бесперебойным. Подключите интернет от Интерсвязи и получайте 100 % удовольствия от серфинга по Сети.

Что будет, когда ИИ сдаст экзамен?

Это главный вопрос. Авторы теста считают, что если ИИ преодолеет рубеж в 90 %, его можно будет считать «оракулом» – существом, которое знает абсолютно все. Он сможет давать ответы на любые вопросы точнее любого человека-эксперта.

Но означает ли это, что он станет по-настоящему «разумным»? Не обязательно. Ученые проводят границу между «знанием фактов» и «способностью открывать новое». Можно выучить весь учебник физики, но так и не совершить собственное открытие. Пока что ИИ – талантливый студент, а не гений-исследователь.