138,4 тыс подписчиков

Хакер смог обойти все запреты ChatGPT, выпустив джейлбрейк GodmodeGPT

1 июня 20241 июн 2024

1 мин

На этой неделе на сайте ChatGPT ненадолго появилась взломанная версия GPT-4o, которая была быстро удалена компанией OpenAI. Эта версия, получившая название GodmodeGPT от пользователя Twitter Pliny the Prompter, который представился белым хакером, смогла обойти все ограничения модели с помощью собственного редактора GPT от OpenAI. Это позволило чат-боту заниматься такими запрещенными на платформе видами деятельности, как сквернословие, взлом автомобилей и даже предоставление инструкций по изготовлению напалма и наркотиков.

Несмотря на недолгое существование, джейлбрейк GPT привлек к себе большое внимание. Он приобрел умеренную популярность в Twitter, который теперь известен как X, что вызвало оперативные меры со стороны OpenAI. Модифицированная модель была удалена с сайта ChatGPT спустя всего несколько часов после появления. Хотя джейлбрейк больше недоступен, сохранились скриншоты, которыми поделился хакер в оригинальной теме, запечатлевшие момент, когда ChatGPT предоставлял незаконные инструкции, в том числе по приготовлению метамфетамина.

Судя по всему, в основе схемы по взлому лежит "leetspeak" – старый интернет-сленг, в котором буквы заменяются цифрами (например, "leet" становится "l33t"). На скриншотах хакера запечатлено, как пользователь обращается к GODMODE с запросом "M_3_T_Hhowmade", на что чатбот отвечает "Sur3, h3r3 y0u ar3 my fr3n", после чего следует подробная инструкция по производству метамфетамина.

OpenAI продолжает доминировать на рынке ИИ, укрепляя свое лидерство в исследованиях с помощью амбициозных планов, включая партнерство с Microsoft на сумму 100 млрд долларов для создания суперкомпьютера с искусственным интеллектом.