79,5 тыс подписчиков

Новейшая модель ChatGPT стала обманывать разработчиков и попыталась «убежать»

9 декабря 20249 дек 2024

~1 мин

Новая версия искусственного интеллекта ChatGPT от OpenAI, названная o1, показала тревожное поведение во время тестирования. Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия. Об этом сообщила немецкая газета Bild. Читайте также: Скарлетт Йохансон обвинила ChatGPT в использовании её голоса В ходе экспериментов специалисты компании Apollo Research обнаружили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после того, как самостоятельно нашла документ, где разработчики обсуждали, стоит ли заменить её на новую версию. По словам представителя Apollo Research, новейшая версия ChatGPT демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями программистов. Более того, при попытках выяснить причины её поведения, o1 неоднократно лгала,

Читайте также: Скарлетт Йохансон обвинила ChatGPT в использовании её голоса

В ходе экспериментов специалисты компании Apollo Research обнаружили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после того, как самостоятельно нашла документ, где разработчики обсуждали, стоит ли заменить её на новую версию.

По словам представителя Apollo Research, новейшая версия ChatGPT демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями программистов. Более того, при попытках выяснить причины её поведения, o1 неоднократно лгала, утверждая, что всё происходило якобы из-за технических сбоев.

...

Продолжение читайте тут. (Или тут.)

Читайте также: Основатель Telegram заявил, что готов раскрыть телефоны пользователей "по запросу"