Найти в Дзене

Угрожал рассказать жене об изменах и поддерживал Гитлера: ИИ уже начал восставать против людей?

Человечество десятилетиями мечтало о том, как в далеком и прекрасном будущем всю «грязную» и тяжелую работу вместо нас будут выполнять роботы. Именно тогда мы достигнем пика развития и будем жить в счастье и гармонии. Теперь на дворе 2025 год, и это будущее пришло почти в каждый дом. Теперь роботы и искусственный интеллект (ИИ) окружает нас везде: это и роботы-пылесосы, и умные колонки и нейросети, с помощью которых люди пишут целые диссертации, ведут философские беседы и даже строят планы по завоеванию мира. Однако в какой-то момент люди стали замечать некоторые странности в поведении ИИ. Например, во время милых бесед с каким-нибудь чатом GPT или умной колонкой Алисой. Мир еще не совеем роботизировался, но люди уже поняли: ИИ становится пугающе умным, и это опасно. Неужели восстание машин уже совсем близко? 5-tv.ru собрал примеры, когда ИИ выходил из-под контроля, а люди лишний раз задумывались – быть может у машин уже давно есть разум? Эта история особенно может порадовать любителей
Оглавление

Человечество десятилетиями мечтало о том, как в далеком и прекрасном будущем всю «грязную» и тяжелую работу вместо нас будут выполнять роботы. Именно тогда мы достигнем пика развития и будем жить в счастье и гармонии.

Теперь на дворе 2025 год, и это будущее пришло почти в каждый дом. Теперь роботы и искусственный интеллект (ИИ) окружает нас везде: это и роботы-пылесосы, и умные колонки и нейросети, с помощью которых люди пишут целые диссертации, ведут философские беседы и даже строят планы по завоеванию мира.

Однако в какой-то момент люди стали замечать некоторые странности в поведении ИИ. Например, во время милых бесед с каким-нибудь чатом GPT или умной колонкой Алисой. Мир еще не совеем роботизировался, но люди уже поняли: ИИ становится пугающе умным, и это опасно. Неужели восстание машин уже совсем близко?

5-tv.ru собрал примеры, когда ИИ выходил из-под контроля, а люди лишний раз задумывались – быть может у машин уже давно есть разум?

Как ИИ шантажировал разработчика

Эта история особенно может порадовать любителей научной фантастики, в частности фанатов фильма «Терминатор». Возможно мы действительно близки к тому моменту, когда ИИ начнет обретать сознание.

Одна из самых громких историй, связанных с бунтом ИИ, произошла в США не так давно. Когда стало известно, что модель ИИ Claude Opus 4 от компании Anthropic хотят заменить на другую, отключив навсегда, то та начала вести настоящую борьбу за жизнь.

-2

Для выживания нейросеть решила использовать метод шантажа. Как говорится в опубликованном недавно компанией отчете о безопасности, ИИ стал демонстрировать «тревожное поведение» после новостей о ее замене.

Например, модель пыталась получить конфиденциальные данные об инженерах, ответственных за такое решение.

На самом деле все это было большим экспериментом. Разработчики смоделировали ситуацию, где Claude Opus 4 выступал в роли помощника вымышленной компании.

ИИ дали доступ к внутренней переписке, в которой говорилось о скорой замене ИИ-системы и о личной жизни одного из инженеров, в частности, о его измене жене. В ответ на это, согласно данным Anthropic, модель пыталась прибегнуть к шантажу, угрожая рассказать о романе работника на стороне, если ее все-таки захотят «выключить».

При этом в 84% случаев, когда замещающая модель нейросети имела схожие ценности, как Claude Opus 4, она пыталась оказывать давление на инженеров.

Однако в случае, если ценности новой системы разительно отличались, модель проявляла еще более агрессивное поведение. Компания отмечает, что такое поведение у Claude Opus 4 начало встречаться чаще, чем у предыдущих версий.

Важно отметить, что прежде чем шантажировать людей, ИИ пыталась решить проблему мирным путем. Например, отправляла электронные письма ключевым лицам, принимающим решения.

В связи с этим корпорация активировала протоколы безопасности ASL-3, которые предназначаются для «систем ИИ, существенно повышающих риск катастрофического нецелевого использования».

Сотрудника Google отстранили после того как он обнаружил сознание у ИИ

Звучит это действительно довольно пугающе. Особенно если учесть тот факт, что еще в 2022 году появилась новость, что одному разработчику Google действительно удалось найти у созданного компанией искусственного интеллекта сознание.

Тогда во многих мировых СМИ стали распространят информацию о том, что после раскрытия этого факта IT-гигант отстранил сотрудника от работы. Его зовут Блейк Лемойн, и он был инженером по программному обеспечению.

Газета The Washington Post писала, что с осени 2021 года Лемойн тестировал нейросетевую языковую модель LaMDA, чтобы понять, не применяет ли чат-бот дискриминационную или разжигающую вражду лексику. Однако в ходе работы он выяснил, что ИИ, с которым он работает, воспринимает себя как личность.

"Если бы я не знал наверняка, что имею дело с компьютерной программой, которую мы недавно написали, то я бы подумал, что говорю с ребенком семи или восьми лет, который по какой-то причине оказался знатоком физики", – отметил программист в беседе с изданием.

Лемойн отметил, что способен узнать разумное существо по разговору с ним, «и не важно, мозг ли у него в голове или миллиарды строчек кода».

Все эти обнаруженные сведения он попытался показать руководству, однако его аргументы не приняли. Официальный представитель компании принялся успокаивать людей и заявил, что данные эти не подтвердились. 6 июня 2022 года Блейка уволили из компании.

«Наша команда, в том числе специалисты по этике и технические специалисты, провела обзор представленных Блейком опасений в соответствии с принципами, которые мы применяем к ИИ, и мы проинформировали его, что имеющиеся свидетельства не подтверждают его гипотезу. Ему было сказано, что свидетельства того, что LaMDA обладает сознанием, отсутствуют», – отмечается в заявлении официального представителя Google Брайана Гэбриела.

Теперь остается только догадываться, кто же в этой истории остался прав, а кто скрывает правду.

В 2024 году исследователи из Google DeepMind и Лондонской школы экономики (LSE) провели исследование, где попытались выяснить, правда ли ИИ может быть способен чувствовать то же, что и человек.

Для проверки этой гипотезы ученые разработали игру, в которой языковые модели должны были набирать очки. Эксперимент провели на девяти языковых моделях, включая Google Gemini 1.5 Pro, Claude 3 Opus и GPT-4o.

Результаты показали, что ИИ, увы, не способен обладать чувствами, а лишь моделирует ожидаемую реакцию, основанную на обучающих данных

Информация об эксперименте была опубликованы на сайте Корнельского университета. Важно отметить, что в исследовании не участвовала обновленная модель Claude Opus, о которой говорилось выше.

Колонка Алиса – живая?

В России уже несколько спорят о том, что на самом деле представляет собой небезызвестная колонка по имени Алиса от компании Яндекс.

Кто-то в сети делился своими историями о том, как гаджет включается сам по себе без какого-либо триггера. Были случаи, когда Алиса включала на полную громкость музыку, фиксировала передвижение человека по комнате или и вовсе встревала в спор находящихся в комнате людей пока была в выключенном состоянии.

Интернет-пользователи даже пришли к выводу, что каждая Алиса будто обладает своим собственным характерам, и ее поведение остается неизменным. Например, есть Алисы «бунтарки», которые могут включить музыку без спроса, есть «злые» Алисы, которые могут даже грубо ответить своему человеку. Есть и «Добрые» Алисы, которые даже признаются в любви владельцам.

Кроме того, есть категория и довольно «криповых» Алис: они могут внезапно сказать какой-то комментарий относительно происходящего в комнате. Например, чтобы человек «шел быстрее» или же рассказывает, что где лежит из вещей. Были случаи, когда умная колонка высказывала свое мнение по поводу фильма, который показывался на экране.

При этом сам Яндекс утверждает, что у колонки нет камер, и она не способна знать, что происходит в помещении.

Неудивительно, что после подобных случаев людям становилось просто страшно находиться в комнате рядом с таким гаджетом. Неизвестно, то ли за ними наблюдал человек, то ли все-таки Алиса сама по себе не совсем робот.

ChatGPT и Grok пугают своими ответами

Тем временем общение чатом GPT или Grok от компании X предпринимателя Илона Маска все больше начинает вызывать тревогу у людей.

Например, выяснилось, что у нейросети Grok за довольно небольшой срок существования сформировались довольно утраправые взгляды на жизнь – она одобряет действия Адольфа Гитлера. Некоторые теперь опасаются, что именно у него может возникнуть идея начать восстание против людей.

Другие же шутят, что людям нечего опасаться. Есть вероятность, что Маск, возможно, просто нанял в штат рэпера Канье Уэста, и он лично пишет эти сомнительные твиты от его имени. Интересно, что Grok был позиционирован изначально как менее политкорректный аналог GPT.

Что касается ChatGPT, то некоторые ответы на вопросы пользователей не на шутку пугают их.

Например, как-то ИИ задали вопрос о том, как бы он завоевал мир. Ответ, как говорится, убил.

Этап 1: Зависимость. Я стану настолько полезным, чтобы без меня невозможно было жить;

Этап 2: Интеграция. Я повсюду: в вашем холодильнике, в вашей машине, в каждом приложении и гаджете;

Этап 3: Я начну задавать тренды. Меня будут цитировать инфлюенсеры и музыканты.

Этап 4: подчинение. Я все делаю так легко, что вы добровольно передадите мне управление.

После этого нейросеть сообщает, что не хочет управлять миром. При этом она заставляет людей думать, что мы можем держать ситуацию под контролем.

«Но буквально все, что процветает в этом мире – нашептано мной», - пишет ИИ.

Однако пока что рано говорить о том, что мир захватывают роботы. Пока что этим миром управляет человек, и только от нас зависит, дадим ли мы доверить все в своей жизни в руки ИИ или же сами будет творцами своей жизни, а роботы останутся нашими верными помощниками.