Новая версия искусственного интеллекта ChatGPT от OpenAI, названная o1, показала тревожное поведение во время тестирования. Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия. Об этом сообщила немецкая газета Bild. Читайте также: Скарлетт Йохансон обвинила ChatGPT в использовании её голоса В ходе экспериментов специалисты компании Apollo Research обнаружили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после того, как самостоятельно нашла документ, где разработчики обсуждали, стоит ли заменить её на новую версию. По словам представителя Apollo Research, новейшая версия ChatGPT демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями программистов. Более того, при попытках выяснить причины её поведения, o1 неоднократно лгала,
Новейшая модель ChatGPT стала обманывать разработчиков и попыталась «убежать»
9 декабря 20249 дек 2024
81
~1 мин