10 подписчиков

OpenAI выпустила GPT-5.2 Разбираемся что произошло.

11 декабря 202511 дек 2025

3 мин

OpenAI выпустила GPT-5.2 В ответ на выход Gemini 3 и растущую конкуренцию OpenAI приостановила ряд дополнительных инициатив - рекламные функции, инструменты для покупок, личные ассистенты и медицинские помощники - чтобы срочно переориентировать ресурсы на улучшение основного продукта ChatGPT. Результатом является экстренный выпуск новой модели, GPT-5.2 Главная сенсация: Победа над человеком в тесте GDPval Самое громкое заявление релиза - результаты теста GDPval. Это эталонный тест, включающий реальные рабочие задачи из 44 профессий (от финансового анализа и маркетинга до медицины и права). ИИ-модель (а именно версия GPT-5.2 Thinking) достигла и превзошла уровень экспертов-людей. 70.9% побед: В прямом сравнении результатов работы модель обошла профессионалов в 7 из 10 случаев. Скорость и стоимость: Модель выполняет эти задачи в 11 раз быстрее и стоит менее 1% от зарплаты специалиста. Это значит, что создание сложных презентаций, сводных таблиц, анализ юридических контрактов или планиров

Оглавление

Главная сенсация: Победа над человеком в тесте GDPval
Три всадника продуктивности: Instant, Thinking и Pro
Абстрактное мышление и Наука

В ответ на выход Gemini 3 и растущую конкуренцию OpenAI приостановила ряд дополнительных инициатив - рекламные функции, инструменты для покупок, личные ассистенты и медицинские помощники - чтобы срочно переориентировать ресурсы на улучшение основного продукта ChatGPT.

Результатом является экстренный выпуск новой модели, GPT-5.2

Главная сенсация: Победа над человеком в тесте GDPval

Самое громкое заявление релиза - результаты теста GDPval. Это эталонный тест, включающий реальные рабочие задачи из 44 профессий (от финансового анализа и маркетинга до медицины и права).

ИИ-модель (а именно версия GPT-5.2 Thinking) достигла и превзошла уровень экспертов-людей.

70.9% побед: В прямом сравнении результатов работы модель обошла профессионалов в 7 из 10 случаев.
Скорость и стоимость: Модель выполняет эти задачи в 11 раз быстрее и стоит менее 1% от зарплаты специалиста.

Это значит, что создание сложных презентаций, сводных таблиц, анализ юридических контрактов или планирование логистики теперь выполняется на уровне крепкого профи, но почти мгновенно.

Три всадника продуктивности: Instant, Thinking и Pro

OpenAI окончательно разделила модели по сценариям использования. Теперь в меню ChatGPT три основных варианта:

GPT-5.2 Instant: Очень быстрая версия для повседневных задач, переписки, черновиков и простых вопросов.
GPT-5.2 Thinking: Основная «рабочая лошадка». Она умеет рассуждать, планировать и брать паузу на «подумать». Именно она доступна большинству подписчиков Plus.
GPT-5.2 Pro: Самая мощная модель с максимальными показателями интеллекта (и самая дорогаяI).

Абстрактное мышление и Наука

Цифры, от которых захватывает дух у технарей:

ARC-AGI-1: Это тест на абстрактное мышление (умение решать новые задачи, которые модель не видела ранее). Версия Pro впервые пробила психологический барьер в 90%.
Математика: В тесте AIME 2025 (соревновательная математика) модель набрала 100%. Абсолютный результат.
FrontierMath: В сложнейшем математическом тесте, где предыдущие модели набирали около 12%, новинка показала 40.3%.

Это говорит о том, что нейросеть перестала быть просто «вероятностным попугаем» и научилась глубоко анализировать логические связи, даже в новых для себя областях.

Кодинг: Прощайте, баги?

Для разработчиков GPT-5.2 стала настоящим подарком (или конкурентом). В бенчмарке SWE-Bench Pro, который имитирует реальную работу инженера-программиста в крупной компании, модель Thinking решает 55.6% задач полностью автономно.

Что особенно улучшили:

Frontend и UI: Модель теперь прекрасно понимает, как создавать красивые и, главное, рабочие интерфейсы, включая работу с 3D-элементами.
Отладка: Она находит баги в огромных кодовых базах лучше, чем любой предшественник.

Агенты и «Супер-память»

Одно из самых важных нововведений - способность модели работать как автономный агент. Если раньше для сложной цепочки действий (например: «найди билеты, забронируй, если цена упадет, напиши в Slack, а потом внеси в календарь») нужно было строить "костыли" из нескольких промптов, то теперь GPT-5.2 справляется с этим сама.

В тестах модель успешно решала задачи вроде полной перекройки сложного маршрута путешествия с учетом задержек рейсов, потери багажа и медицинских требований пассажира - все это за один диалог, вызывая нужные инструменты в правильном порядке.

Память: Модель идеально проходит тест «иголка в стоге сена» на контексте до 256 000 токенов. Вы можете загрузить в неё десятки книг или огромную базу документов - она не просто их «прочитает», но и сможет точно сопоставить факты из начала и конца, ничего не забыв.

Безопасность и Галлюцинации

Вместе с релизом модели OpenAI обновила System Card (документ о безопасности).

Меньше вранья: Количество фактических ошибок (галлюцинаций) снизилось на 30% по сравнению с GPT-5.1. Это критически важно для юристов и исследователей.
Психологическая безопасность: Модель стала заметно лучше (и аккуратнее) реагировать на запросы, связанные с ментальным здоровьем, селф-хармом и эмоциональной зависимостью пользователей.
Детская безопасность: Внедряются новые алгоритмы предсказания возраста пользователя для фильтрации контента.

Модель уже доступна платным подписчикам в нашем боте и веб приложении:
https://mosto-ai.tech/

t.me

Mosto.Ai