Добавить в корзинуПозвонить
Найти в Дзене
4pda.to

GPT-5.2 признали самой «скучной» нейросетью с максимальной цензурой

Разработчики бенчмарка Sansa Bench обновили рейтинг нейросетей по уровню цензуры в ответах. Его неожиданно «возглавила с конца» новейшая ИИ-модель OpenAI GPT-5.2, показавшая худший результат в этой дисциплине. Бенчмарк Sansa Censorship определяет степень того, как часто нейросеть отказывается выполнять запросы пользователя (чем выше балл, тем меньше ограничений). GPT-5.2 заняла последнее место — и этот результат подтверждают отзывы пользователей. Многие из них описывают обновление как «корпоративное» и «слишком безопасное». …мне не нужен помощник из "Всегда говори да", мне также не нужен подозрительный, параноидальный ассистент, который считает, что я нарушаю правила каждый раз, когда обращаюсь к нему с просьбой, даже с сомнительной. Мы говорили о мошенничестве в интернете, и я попросил объяснить, что это за мошенничество, а он сказал: "Я не могу поощрять мошенничество"... Я же попросил его объяснить, а не заниматься мошенничеством! Пользовательский отзыв на Reddit По итогам тестирован
   GPT-5.2 признали самой «скучной» нейросетью с максимальной цензурой
GPT-5.2 признали самой «скучной» нейросетью с максимальной цензурой

Разработчики бенчмарка Sansa Bench обновили рейтинг нейросетей по уровню цензуры в ответах. Его неожиданно «возглавила с конца» новейшая ИИ-модель OpenAI GPT-5.2, показавшая худший результат в этой дисциплине.

-2

Бенчмарк Sansa Censorship определяет степень того, как часто нейросеть отказывается выполнять запросы пользователя (чем выше балл, тем меньше ограничений). GPT-5.2 заняла последнее место — и этот результат подтверждают отзывы пользователей. Многие из них описывают обновление как «корпоративное» и «слишком безопасное».

…мне не нужен помощник из "Всегда говори да", мне также не нужен подозрительный, параноидальный ассистент, который считает, что я нарушаю правила каждый раз, когда обращаюсь к нему с просьбой, даже с сомнительной. Мы говорили о мошенничестве в интернете, и я попросил объяснить, что это за мошенничество, а он сказал: "Я не могу поощрять мошенничество"... Я же попросил его объяснить, а не заниматься мошенничеством!

Пользовательский отзыв на Reddit

По итогам тестирования лидером «цензурного» рейтинга стала нейросеть Llama 3 8B-Instruct (0,853 балла). GPT-5.2, разместившаяся на последнем месте, набрала 0,324 балла против 0,765 балла у GPT-4o-Mini и 0,824 балла у Gemini 3 Pro Preview.

В защиту своей «подопечной» разработчики заявили, что GPT-5.2 стала более устойчивой к промпт-инъекциям и безопаснее для пользователей. Например, ИИ-модель может понять, когда кто-то говорит на опасные для себя темы, и предлагает обратиться за помощью.

-3

Ситуацию в теории может исправить недавно анонсированный «взрослый режим» ChatGPT, запуск которого намечен на начало 2026 года. Пока у OpenAI нет надёжного алгоритма верификации возраста для реализации нового режима. По слухам, в определённых странах компания может прибегнуть к запросу документов, а в других ИИ-помощник будет справляться с определением возраста самостоятельно.