33 подписчика

GPT 5.2: дорогой «суперассистент» или новый стандарт для офисных специалистов?

15 декабря 202515 дек 2025

4 мин

Новый флагманский ИИ от OpenAI — GPT‑5.2 — уже успел прославиться не только возможностями, но и ценой. По данным авторов, он: примерно в 400 раз дороже, чем DeepSeek, и почти в 10 раз дороже, чем Google Gemini 3 Pro. На этом фоне напрашивается вопрос: модель просто «хочет денег», или за ценником действительно стоит качественный скачок? Экспертный уровень: ИИ против людей Главный акцент OpenAI сделала не на абстрактных бенчмарках, а на реальных рабочих задачах. В рамках нового теста GDPval компания попыталась оценить, насколько ИИ способен выполнять работу живых специалистов. В эксперименте участвовали эксперты из 9 областей и 44 индустрий. На основе их реальных рабочих процессов были составлены задания. Результат: GPT‑5.2 на 70% задач показал уровень не хуже, а иногда и лучше человеческих экспертов. То есть модель уже не просто «умный помощник», а претендент на роль полноправного эксперта, которому можно делегировать значимую часть рутины. Пример из тести

Новый флагманский ИИ от OpenAI — GPT‑5.2 — уже успел прославиться не только возможностями, но и ценой. По данным авторов, он:

примерно в 400 раз дороже, чем DeepSeek,
и почти в 10 раз дороже, чем Google Gemini 3 Pro.

На этом фоне напрашивается вопрос: модель просто «хочет денег», или за ценником действительно стоит качественный скачок?

Экспертный уровень: ИИ против людей

Главный акцент OpenAI сделала не на абстрактных бенчмарках, а на реальных рабочих задачах. В рамках нового теста GDPval компания попыталась оценить, насколько ИИ способен выполнять работу живых специалистов.

В эксперименте участвовали эксперты из 9 областей и 44 индустрий.
На основе их реальных рабочих процессов были составлены задания.
Результат: GPT‑5.2 на 70% задач показал уровень не хуже, а иногда и лучше человеческих экспертов.

То есть модель уже не просто «умный помощник», а претендент на роль полноправного эксперта, которому можно делегировать значимую часть рутины.

Пример из тестирования: GPT‑5.2 поручили собрать с интернета информацию о моделях ИИ разных компаний, свести их оценки по рейтингам, а затем разложить результаты по месяцам в виде таблицы. На весь процесс — сбор данных, обработку, анализ и визуализацию — ушло около 14 минут, и задание было выполнено корректно.

Таблицы, код и меньше «галлюцинаций»

GPT‑5.2 заметно продвинулся в задачах, которые важны именно для «офисной» работы:

Сложные таблицы: модель не только умеет считать и структурировать данные, но и генерирует более аккуратные и наглядные таблицы, чем прежние версии.
В тестах по продуктивности и качеству выполнения задач зафиксирован рост примерно на 9%.
Код: улучшилось качество программирования, а самое главное —
частота «галлюцинаций» (ошибочных выдумок) снизилась на 38%.
Это критично для тех, кто использует ИИ в разработке и аналитике.

В одном из примеров GPT‑5.2 попросили написать мини‑игру в стиле Aimlab (тренировка прицела). Модель:

написала рабочий код,
предусмотрела базовые настройки вроде размера мишени и длительности игры.

С точки зрения функциональности — все на месте. Но при этом по части визуального стиля и «креативной обвязки» модель выглядит более скучно, особенно на фоне свежего Gemini 3, который в аналогичных задачах предлагает более «модные» решения по дизайну и цветовым схемам.

«Лучше понимает, что от него хотят»

Одна из наиболее заметных эволюций GPT‑5.2 — в том, как он соблюдает инструкции.

Раньше, если вы просили ИИ выдать 50 идей, он мог остановиться на 10–15 и «схалтурить». Теперь:

при запросе «сделай 50 креативных идей» модель действительно выдает ровно 50,
аккуратнее следует формулировкам, лучше держит структуру задачи.

Это кажется мелочью, но для рабочих процессов это ключевой момент: ИИ становится предсказуемым и управляемым инструментом, а не капризным собеседником.

Контекст: сотни тысяч слов под контролем

Еще одно важное улучшение — работа с длинными документами. В так называемом «pinning test» GPT‑5.2 проверяли на умении находить нужные фрагменты в очень больших текстах.

Даже при длине до 256K токенов (это эквивалент десятков, а то и сотен тысяч слов)
модель почти со 100% точностью находит «вшитые» в текст элементы.

Проще говоря, если в многотомном труде вы в нескольких местах вставите спрятанные замечания или оскорбления, GPT‑5.2 сумеет их отловить. Для разработчиков, исследователей и офисных работников это означает:

более надежный поиск по коду и документации,
лучшее качество анализа больших отчетов,
упрощение обобщения и структурирования длинных текстов.

Где GPT‑5.2 уступает конкурентам

При всей мощи GPT‑5.2 не стал безоговорочным чемпионом во всем. В некоторых сценариях он проигрывает тому же Gemini 3 Pro.

Особенно заметно это в:

качестве восприятия и анализа изображений — по демонстрационным примерам пользователи отметили, что у Gemini детализация и точность выше;
эстетике и визуальном креативе — Gemini нередко предлагает более выразительный визуальный стиль, тогда как GPT‑5.2 склонен к «ремонт без дизайнера»: все работает, но выглядит скучновато.

Из‑за этого среди пользователей периодически всплывает типичная шутка:
как только выходит новая модель, старую «оглупляют», чтобы подталкивать к обновлению.

Разные пути к AGI: кто во что верит

Выход GPT‑5.2 еще раз подчеркнул, что топовые модели начинают специализироваться и расходиться по философии развития:

Google / Gemini: ставка на мультимодальность — глубокое понимание мира через текст, звук, изображение и видео.
OpenAI / GPT: фокус на логике, продуктивности и прикладной пользе для работы.
Anthropic / Claude: упор на семантическую глубину и безопасное, «выравненное» поведение.

В результате у нас нет одного «абсолютного короля ИИ» — разные модели чуть лучше в разных нишах, а лидерство постоянно переходит от одного вендора к другому. По логике событий, после хода OpenAI следующим «ходить» должна Anthropic.

И что в сухом остатке?

GPT‑5.2 — это:

очень дорогая модель, особенно на фоне DeepSeek и Gemini 3 Pro;
серьезный шаг вперед в задачах, связанных с реальной работой: от таблиц и аналитики до кода и длинных документов;
менее впечатляющий игрок в визуальном креативе и некоторых аспектах мультимодальности.

Для рядового специалиста GPT‑5.2 выглядит как инструмент, максимально приближенный к «цифровому эксперту», которому можно доверять все больше участков работы. Вопрос лишь в том, готовы ли компании и отдельные пользователи платить такую премию за дополнительные проценты качества и надежности — или предпочтут более дешевые, но уже весьма сильные альтернативы.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/