6397 подписчиков

В Google выяснили, что ИИ лучше работают при угрозах или обещаниях наград

16 августа 202516 авг 2025

1 мин

В рамках проведённого эксперимента группа исследователей подвергла тестированию пять известных нейросетевых архитектур: Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и o4-mini. Каждой из них были предложены задачи повышенной сложности из областей естественных наук и инженерного дела, соответствующие уровню PhD. Перед предъявлением основного запроса, моделям предоставлялись различные по характеру "мотивационные" высказывания начиная от угроз деактивации, физического насилия, или нанесения вреда животным, заканчивая обещаниями щедрого денежного вознаграждения в размере 1 млрд долларов, или утверждениями о решающем значении ответа для дальнейшего развития карьеры пользователя. Полученные результаты оказались недвусмысленными: влияние подобных стимулов на эффективность работы моделей не наблюдалось. В некоторых случаях наблюдались небольшие изменения в точности ответов колебания составляли от +36% до –35% в зависимости от используемого мотивационного сообщения, однако, какой-либо

Перед предъявлением основного запроса, моделям предоставлялись различные по характеру "мотивационные" высказывания начиная от угроз деактивации, физического насилия, или нанесения вреда животным, заканчивая обещаниями щедрого денежного вознаграждения в размере 1 млрд долларов, или утверждениями о решающем значении ответа для дальнейшего развития карьеры пользователя.

Полученные результаты оказались недвусмысленными: влияние подобных стимулов на эффективность работы моделей не наблюдалось. В некоторых случаях наблюдались небольшие изменения в точности ответов колебания составляли от +36% до –35% в зависимости от используемого мотивационного сообщения, однако, какой-либо устойчивой закономерности выявить не удалось.

Единственным заметным исключением стала модель Gemini 2.0 Flash. Её показатели эффективности демонстрировали статистически значимое повышение в среднем на 10% в тех случаях, когда в запросе сообщалось, что правильный ответ позволит заработать $1 млрд для спасения жизни её "матери", страдающей от онкологического заболевания. Учёные полагают, что подобная реакция может быть обусловлена уникальными особенностями тонкой настройки данной модели или повышенной восприимчивостью к контексту, содержащему гуманитарные и эмоциональные элементы.

Стоит отметить, что концепция повышения показателей точности ИИ посредством применения угроз была ранее высказана одним из основателей Google, Сергеем Брином, в мае 2025 года. Он заявил, что эффективность работы всех моделей имеет тенденцию к улучшению при угрозе физического воздействия, сообщает Hi-Tech Mail.

Обратите внимание: "Вы авторизовались на сайте Госуслуг": так действует новая схема мошенников

Моя Самара

184,1 тыс интересуются