88,2 тыс подписчиков

GPT-5.2 признали самой «скучной» нейросетью с максимальной цензурой

17 декабря 202517 дек 2025

1 мин

Разработчики бенчмарка Sansa Bench обновили рейтинг нейросетей по уровню цензуры в ответах. Его неожиданно «возглавила с конца» новейшая ИИ-модель OpenAI GPT-5.2, показавшая худший результат в этой дисциплине. Бенчмарк Sansa Censorship определяет степень того, как часто нейросеть отказывается выполнять запросы пользователя (чем выше балл, тем меньше ограничений). GPT-5.2 заняла последнее место — и этот результат подтверждают отзывы пользователей. Многие из них описывают обновление как «корпоративное» и «слишком безопасное». …мне не нужен помощник из "Всегда говори да", мне также не нужен подозрительный, параноидальный ассистент, который считает, что я нарушаю правила каждый раз, когда обращаюсь к нему с просьбой, даже с сомнительной. Мы говорили о мошенничестве в интернете, и я попросил объяснить, что это за мошенничество, а он сказал: "Я не могу поощрять мошенничество"... Я же попросил его объяснить, а не заниматься мошенничеством! Пользовательский отзыв на Reddit По итогам тестирован

Бенчмарк Sansa Censorship определяет степень того, как часто нейросеть отказывается выполнять запросы пользователя (чем выше балл, тем меньше ограничений). GPT-5.2 заняла последнее место — и этот результат подтверждают отзывы пользователей. Многие из них описывают обновление как «корпоративное» и «слишком безопасное».

…мне не нужен помощник из "Всегда говори да", мне также не нужен подозрительный, параноидальный ассистент, который считает, что я нарушаю правила каждый раз, когда обращаюсь к нему с просьбой, даже с сомнительной. Мы говорили о мошенничестве в интернете, и я попросил объяснить, что это за мошенничество, а он сказал: "Я не могу поощрять мошенничество"... Я же попросил его объяснить, а не заниматься мошенничеством!

Пользовательский отзыв на Reddit

По итогам тестирования лидером «цензурного» рейтинга стала нейросеть Llama 3 8B-Instruct (0,853 балла). GPT-5.2, разместившаяся на последнем месте, набрала 0,324 балла против 0,765 балла у GPT-4o-Mini и 0,824 балла у Gemini 3 Pro Preview.

В защиту своей «подопечной» разработчики заявили, что GPT-5.2 стала более устойчивой к промпт-инъекциям и безопаснее для пользователей. Например, ИИ-модель может понять, когда кто-то говорит на опасные для себя темы, и предлагает обратиться за помощью.

Ситуацию в теории может исправить недавно анонсированный «взрослый режим» ChatGPT, запуск которого намечен на начало 2026 года. Пока у OpenAI нет надёжного алгоритма верификации возраста для реализации нового режима. По слухам, в определённых странах компания может прибегнуть к запросу документов, а в других ИИ-помощник будет справляться с определением возраста самостоятельно.

Гаджеты и электроника

5,73 млн интересуются