Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

GPT-5.2 и Gemini 3 Pro разделили лидерство в рейтинге IQ ИИ

Сайт Tracking AI опубликовал обновленный рейтинг искусственного интеллекта по уровню IQ. Лидерами стали GPT-5.2 Thinking и Gemini 3 Pro, показавшие равные результаты в обоих тестах: 141 балл в классическом тесте Mensa Norway и 127 баллов в оффлайн-тесте. Mensa Norway – это онлайн-тест из 35 задач на закономерности, средний балл для человека – 100. Учитывая открытость задач, существует вероятность их попадания в обучающие данные ИИ. Для более объективной оценки авторы Tracking AI разработали закрытый оффлайн-тест. Модели оцениваются в двух режимах: Vision, где ИИ самостоятельно анализирует условия задачи, и текстовом, где условия описываются. Это позволяет оценить мультимодальные возможности ИИ. Примечательно, что в оффлайн-тесте GPT-5.2 Thinking превзошла более продвинутую и дорогую GPT-5 Pro. Однако Pro-версия показала лучший результат в классическом тесте Mensa Norway, что может указывать на более качественную подготовку к данному тесту. Чат-версия GPT-5.2 без режима рассуждений набр

Сайт Tracking AI опубликовал обновленный рейтинг искусственного интеллекта по уровню IQ. Лидерами стали GPT-5.2 Thinking и Gemini 3 Pro, показавшие равные результаты в обоих тестах: 141 балл в классическом тесте Mensa Norway и 127 баллов в оффлайн-тесте.

Mensa Norway – это онлайн-тест из 35 задач на закономерности, средний балл для человека – 100. Учитывая открытость задач, существует вероятность их попадания в обучающие данные ИИ. Для более объективной оценки авторы Tracking AI разработали закрытый оффлайн-тест.

Модели оцениваются в двух режимах: Vision, где ИИ самостоятельно анализирует условия задачи, и текстовом, где условия описываются. Это позволяет оценить мультимодальные возможности ИИ.

Примечательно, что в оффлайн-тесте GPT-5.2 Thinking превзошла более продвинутую и дорогую GPT-5 Pro. Однако Pro-версия показала лучший результат в классическом тесте Mensa Norway, что может указывать на более качественную подготовку к данному тесту. Чат-версия GPT-5.2 без режима рассуждений набрала 120 баллов, что соответствует результату Claude Opus 4.5.

Итак, ИИ теперь умнее нас, или просто лучше решает тесты, которые уже видел? В любом случае, скоро они будут писать эти новости сами, так что наслаждайтесь, пока это делаю я.