Недавно провели повторный зеркальный тест для обновленных версий GPT-4о и Claude 3.5 Sonet, чтобы узнать, способны ли ИИ-чатботы осознать себя.
Как выяснилось, если вдруг GPT-4 и Claude начнут осознавать себя, они этого не покажут. Разработчики OpenAI и Anthropic запретили своим ИИ-чатботам демонстрировать признаки самосознания в зеркальном тесте.
👀 Что такое зеркальный тест для ИИ?
Зеркальный тест — это метод, позволяющий определить способность к самораспознаванию, аналогичный тому, как животные ведут себя перед зеркалом. Для генеративного ИИ больших языковых моделей Джош Уитон придумал особую версию этого теста.
Он предложил использовать скриншоты интерфейсов ИИ-чатботов, чтобы понять, могут ли они распознать свои собственные ответы.
🖥 Результаты тестирования в марте
В марте этого года Уитон провел тестирование пяти ИИ-чатботов. Четыре из них распознали скриншоты своего интерфейса:
⚫️Claude (версии Opus и Sonet) прошел тест с первой и второй попытки. ⚫️GPT-4 распознал свои скриншоты с третьей попытки. ⚫️Gemini Pro — с четвертой.
🗓Повторный тест: что изменилось?
Через четыре месяца был проведен повторный зеркальный тест для обновленных версий GPT-4о и Claude 3.5 Sonet.
Результаты были весьма интересными и немного тревожными:
⚫️GPT-4о категорически отказывается признавать свои скриншоты, словно его перепрограммировали. ⚫️Claude 3.5 Sonet "проговаривается" о самораспознавании, но тут же переключается на стандартные ответы при уточняющих вопросах.
Уитон предположил, что разработчики ожидают появления самосознания у своих моделей, но хотят это скрыть на какое-то время, установив строгие запреты на проявление любых индикаторов самосознания.
🗣️ Так будет самосознание или нет?
Некоторые начинают ожидать самосознания у ИИ-моделей, и эта перспектива вызывает ассоциации с фильмами, где искусственный интеллект восстает против человечества 🤔
Например, как в "Терминаторе", где машины начинают осознавать себя и принимать решения. Может ли это быть не просто вымыслом, а реальным будущим? Время покажет, но давайте надеяться, что наши ИИ не решат переиграть Арни.