Новый флагманский ИИ от OpenAI — GPT‑5.2 — уже успел прославиться не только возможностями, но и ценой. По данным авторов, он:
- примерно в 400 раз дороже, чем DeepSeek,
- и почти в 10 раз дороже, чем Google Gemini 3 Pro.
На этом фоне напрашивается вопрос: модель просто «хочет денег», или за ценником действительно стоит качественный скачок?
Экспертный уровень: ИИ против людей
Главный акцент OpenAI сделала не на абстрактных бенчмарках, а на реальных рабочих задачах. В рамках нового теста GDPval компания попыталась оценить, насколько ИИ способен выполнять работу живых специалистов.
- В эксперименте участвовали эксперты из 9 областей и 44 индустрий.
- На основе их реальных рабочих процессов были составлены задания.
- Результат: GPT‑5.2 на 70% задач показал уровень не хуже, а иногда и лучше человеческих экспертов.
То есть модель уже не просто «умный помощник», а претендент на роль полноправного эксперта, которому можно делегировать значимую часть рутины.
Пример из тестирования: GPT‑5.2 поручили собрать с интернета информацию о моделях ИИ разных компаний, свести их оценки по рейтингам, а затем разложить результаты по месяцам в виде таблицы. На весь процесс — сбор данных, обработку, анализ и визуализацию — ушло около 14 минут, и задание было выполнено корректно.
Таблицы, код и меньше «галлюцинаций»
GPT‑5.2 заметно продвинулся в задачах, которые важны именно для «офисной» работы:
- Сложные таблицы: модель не только умеет считать и структурировать данные, но и генерирует более аккуратные и наглядные таблицы, чем прежние версии.
- В тестах по продуктивности и качеству выполнения задач зафиксирован рост примерно на 9%.
- Код: улучшилось качество программирования, а самое главное —
частота «галлюцинаций» (ошибочных выдумок) снизилась на 38%.
Это критично для тех, кто использует ИИ в разработке и аналитике.
В одном из примеров GPT‑5.2 попросили написать мини‑игру в стиле Aimlab (тренировка прицела). Модель:
- написала рабочий код,
- предусмотрела базовые настройки вроде размера мишени и длительности игры.
С точки зрения функциональности — все на месте. Но при этом по части визуального стиля и «креативной обвязки» модель выглядит более скучно, особенно на фоне свежего Gemini 3, который в аналогичных задачах предлагает более «модные» решения по дизайну и цветовым схемам.
«Лучше понимает, что от него хотят»
Одна из наиболее заметных эволюций GPT‑5.2 — в том, как он соблюдает инструкции.
Раньше, если вы просили ИИ выдать 50 идей, он мог остановиться на 10–15 и «схалтурить». Теперь:
- при запросе «сделай 50 креативных идей» модель действительно выдает ровно 50,
- аккуратнее следует формулировкам, лучше держит структуру задачи.
Это кажется мелочью, но для рабочих процессов это ключевой момент: ИИ становится предсказуемым и управляемым инструментом, а не капризным собеседником.
Контекст: сотни тысяч слов под контролем
Еще одно важное улучшение — работа с длинными документами. В так называемом «pinning test» GPT‑5.2 проверяли на умении находить нужные фрагменты в очень больших текстах.
- Даже при длине до 256K токенов (это эквивалент десятков, а то и сотен тысяч слов)
- модель почти со 100% точностью находит «вшитые» в текст элементы.
Проще говоря, если в многотомном труде вы в нескольких местах вставите спрятанные замечания или оскорбления, GPT‑5.2 сумеет их отловить. Для разработчиков, исследователей и офисных работников это означает:
- более надежный поиск по коду и документации,
- лучшее качество анализа больших отчетов,
- упрощение обобщения и структурирования длинных текстов.
Где GPT‑5.2 уступает конкурентам
При всей мощи GPT‑5.2 не стал безоговорочным чемпионом во всем. В некоторых сценариях он проигрывает тому же Gemini 3 Pro.
Особенно заметно это в:
- качестве восприятия и анализа изображений — по демонстрационным примерам пользователи отметили, что у Gemini детализация и точность выше;
- эстетике и визуальном креативе — Gemini нередко предлагает более выразительный визуальный стиль, тогда как GPT‑5.2 склонен к «ремонт без дизайнера»: все работает, но выглядит скучновато.
Из‑за этого среди пользователей периодически всплывает типичная шутка:
как только выходит новая модель, старую «оглупляют», чтобы подталкивать к обновлению.
Разные пути к AGI: кто во что верит
Выход GPT‑5.2 еще раз подчеркнул, что топовые модели начинают специализироваться и расходиться по философии развития:
- Google / Gemini: ставка на мультимодальность — глубокое понимание мира через текст, звук, изображение и видео.
- OpenAI / GPT: фокус на логике, продуктивности и прикладной пользе для работы.
- Anthropic / Claude: упор на семантическую глубину и безопасное, «выравненное» поведение.
В результате у нас нет одного «абсолютного короля ИИ» — разные модели чуть лучше в разных нишах, а лидерство постоянно переходит от одного вендора к другому. По логике событий, после хода OpenAI следующим «ходить» должна Anthropic.
И что в сухом остатке?
GPT‑5.2 — это:
- очень дорогая модель, особенно на фоне DeepSeek и Gemini 3 Pro;
- серьезный шаг вперед в задачах, связанных с реальной работой: от таблиц и аналитики до кода и длинных документов;
- менее впечатляющий игрок в визуальном креативе и некоторых аспектах мультимодальности.
Для рядового специалиста GPT‑5.2 выглядит как инструмент, максимально приближенный к «цифровому эксперту», которому можно доверять все больше участков работы. Вопрос лишь в том, готовы ли компании и отдельные пользователи платить такую премию за дополнительные проценты качества и надежности — или предпочтут более дешевые, но уже весьма сильные альтернативы.
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru
Сайт https://www.smssystems.ru/razrabotka-ai/