Погоня за поездом №273/274 Северобайкальск — Адлер
📝 Главное из System Card GPT-5.2
📝 Главное из System Card GPT-5.2 — GPT-5.2 стала заметно честнее. В реальном продакшн-трафике случаи обмана у версии Thinking снизились до 1.6% против 7.7% у GPT-5.1. Модель гораздо реже врёт или искажает информацию о работе с инструментами. — Модель лучше держит удар при провокациях. В специальных тестах, где её пытаются склонить к обману, показатель снизился с 11.8% до 5.4%. То есть GPT-5.2 устойчивее к манипулятивным подсказкам. — Защита от prompt-injection стала сильнее. Instant и Thinking почти полностью проходят известные тесты (0...
OpenAI выпустила флагманскую модель GPT-5.2. Сравниваем с Gemini 3 Pro
Почти через месяц после дебюта нейросети GPT-5.1 в свет выходит GPT-5.2. Несмотря на скромное изменение в нумерации, новинка существенно опережает предшественницу по бенчмаркам. Протестировали передовую модель вместе с другим лидером, Gemini 3 Pro, в нескольких сценариях. Семейство GPT-5.2 на самом деле включает три вариации: Instant, Thinking и Pro. Как можно догадаться, вторая «размышляет» перед ответом — в итоге получаются более подробные и точные результаты, особенно в задачах программирования и математики...