84,9 тыс подписчиков

OpenAI выпустила флагманскую модель GPT-5.2. Сравниваем с Gemini 3 Pro

ВчераВчера

2 мин

Оглавление

Что говорят синтетические тесты
Тестирование 4PDA: кодинг, инструкции и работа с изображениями

Почти через месяц после дебюта нейросети GPT-5.1 в свет выходит GPT-5.2. Несмотря на скромное изменение в нумерации, новинка существенно опережает предшественницу по бенчмаркам. Протестировали передовую модель вместе с другим лидером, Gemini 3 Pro, в нескольких сценариях.

Что говорят синтетические тесты

Семейство GPT-5.2 на самом деле включает три вариации: Instant, Thinking и Pro. Как можно догадаться, вторая «размышляет» перед ответом — в итоге получаются более подробные и точные результаты, особенно в задачах программирования и математики. GPT-5.2 Pro расходует на «раздумья» ещё больше времени и энергии. ChatGPT умеет переключаться между Instant и Thinking автоматически, ориентируясь на суть запроса.

Gemini 3 Pro — тоже «думающая» модель, но у Google есть и более скоростная Gemini 3. Логично сравнивать между собой Gemini 3 Pro и GPT-5.2 Thinking, поскольку Pro доступна только подписчикам 200-долларового ChatGPT Pro.

Знания GPT-5.2 заканчиваются на августе 2025 года, а для свежих данных модели нужен доступ в интернет. Gemini 3 знает об актуальных событиях ещё меньше: её датасет ограничен январём 2025-го.

Сопоставили результаты конкурентов в основных бенчмарках:

Выходит, что господство Gemini 3 Pro в мире текстовых нейросетей продлилось меньше месяца. GPT-5.2 Thinking опережает конкурента в большинстве задач.

Тестирование 4PDA: кодинг, инструкции и работа с изображениями

Одно из важных применений ИИ — разработка ПО. Современные модели научились писать функциональные веб-приложения с неплохим интерфейсом с одного промпта.

GPT-5.2 Thinking справился с задачей создания трекера привычек куда качественнее. В его реализации есть поиск и более подробная статистика, а эффект Liquid Glass выглядит правдоподобнее. Все функции работают. Gemini 3 Pro тоже выдал неплохой результат, пусть и с нюансом: у кнопки добавления привычки нет значка или подписи.

Переходим к более приземлённой задаче: нужно объяснить, как установить велосипед на велостанок. Здесь GPT-5.2 Thinking тоже показал себя лучше соперника. Модель OpenAI сходила в интернет, нашла инструкцию конкретной модели и расписала всё по шагам. Не без огрехов: вопрос монтажа кассеты со звёздами уместился в одно предложение, хотя на деле не всё так просто.

Удивительно, но Gemini 3 Pro пренебрегла знаниями из сети и выдала общие рекомендации. Тоже полезно, но не хватает конкретики.

GPT-5.2 и Gemini 3 — мультимодальные версии, то есть «понимают» не только текст, но и изображения. Попросим ИИ разобраться в обозначениях режимов духовки.

Нейросеть OpenAI не просто разобрала не очень чёткую фотографию, но и нанесла подсказки поверх неё. На всё ушло почти восемь минут. Зато была допущена лишь одна ошибка. Gemini же не стала рисовать «легенду», ограничившись текстовым ответом. Три значка нейросеть не разглядела, однако с остальными справилась.

Стоит учитывать, что надёжно и справедливо сравнить столь сложные системы в рамках текстового материала не представляется возможным. Но первое впечатление однозначное: OpenAI оправилась от удара Google и как минимум догнала Gemini 3 Pro.

Успели попробовать GPT-5.2? Делитесь впечатлениями в комментариях!