В рамках проведённого эксперимента группа исследователей подвергла тестированию пять известных нейросетевых архитектур: Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и o4-mini. Каждой из них были предложены задачи повышенной сложности из областей естественных наук и инженерного дела, соответствующие уровню PhD. Перед предъявлением основного запроса, моделям предоставлялись различные по характеру "мотивационные" высказывания начиная от угроз деактивации, физического насилия, или нанесения вреда животным, заканчивая обещаниями щедрого денежного вознаграждения в размере 1 млрд долларов, или утверждениями о решающем значении ответа для дальнейшего развития карьеры пользователя. Полученные результаты оказались недвусмысленными: влияние подобных стимулов на эффективность работы моделей не наблюдалось. В некоторых случаях наблюдались небольшие изменения в точности ответов колебания составляли от +36% до –35% в зависимости от используемого мотивационного сообщения, однако, какой-либо
В Google выяснили, что ИИ лучше работают при угрозах или обещаниях наград
16 августа 202516 авг 2025
3
1 мин