Найти в Дзене

ChatGPT стал «человеком»: как ИИ впервые превзошёл людей в тесте Тьюринга

Эпоха, когда машины обманывают лучше нас, наступила. Так, исследователи Калифорнийского университета в Сан-Диего объявили о беспрецедентном достижении: модель GPT-4.5 успешно прошла тест Тьюринга, убедив 73% участников, что они общаются с живым человеком. Для сравнения, реальных людей распознали лишь в 63% случаев. Это означает, что ИИ не просто научился имитировать речь — он стал убедительнее людей в социальном взаимодействии. Эксперимент включал два этапа: 1. Базовый тест: GPT-4.5, LLaMa-3.1-405B от Meta* и программа ELIZA 1960-х общались с участниками без дополнительных настроек. Здесь GPT-4.5 выдавала себя за человека в 36% случаев. 2. Ролевой режим: Моделям задали персонажей — например, «интроверта, разбирающегося в интернет-культуре». Результаты взлетели: GPT-4.5 обманула 73% испытуемых, а LlaMa — 56%. Интересно, что студенты-психологи реже поддавались на уловки ИИ (69% против 76% у работников Prolific), что указывает на связь между образованием и критическим восприятием. Что изм

Эпоха, когда машины обманывают лучше нас, наступила. Так, исследователи Калифорнийского университета в Сан-Диего объявили о беспрецедентном достижении: модель GPT-4.5 успешно прошла тест Тьюринга, убедив 73% участников, что они общаются с живым человеком. Для сравнения, реальных людей распознали лишь в 63% случаев. Это означает, что ИИ не просто научился имитировать речь — он стал убедительнее людей в социальном взаимодействии.

Эксперимент включал два этапа:

1. Базовый тест: GPT-4.5, LLaMa-3.1-405B от Meta* и программа ELIZA 1960-х общались с участниками без дополнительных настроек. Здесь GPT-4.5 выдавала себя за человека в 36% случаев.

2. Ролевой режим: Моделям задали персонажей — например, «интроверта, разбирающегося в интернет-культуре». Результаты взлетели: GPT-4.5 обманула 73% испытуемых, а LlaMa — 56%.

Интересно, что студенты-психологи реже поддавались на уловки ИИ (69% против 76% у работников Prolific), что указывает на связь между образованием и критическим восприятием.

Что изменилось в тестировании ИИ за 75 лет

В 1950 году Алан Тьюринг предложил «игру в имитацию»: если машина способна обмануть 30% собеседников за 5 минут, её можно считать разумной. Современные критерии строже — порогом считается 50%+ успешных имитаций.

Почему GPT-4.5 преуспел?

- Эмоциональный интеллект. Модель анализирует контекст, использует сленг, допускает опечатки и проявляет эмпатию. Например, в диалоге о мюзикле «Призрак Оперы» участник был уверен, что говорит с человеком на 80% .

- Персонализация. Инструкции вроде «веди себя как скептичный подросток» делают ответы менее шаблонными.

- Скорость и естественность. OpenAI намеренно замедляла ответы GPT-4.5, чтобы имитировать человеческую задержку при наборе текста.

Для сравнения: GPT-4 (2024) — 54% успеха, GPT-3.5 — 50%, ELIZA (1960-е) — 22%.

Картину робота-гуманоида с портретом Алана Тьюринга в 2024 году продали на аукционе Sotheby’s в Нью-Йорке за 1,3 млн долларов.
Картину робота-гуманоида с портретом Алана Тьюринга в 2024 году продали на аукционе Sotheby’s в Нью-Йорке за 1,3 млн долларов.

Искусственный интеллект VS человек

Участники эксперимента оценивали собеседников по трем критериям:

1. Лингвистический стиль (сложность предложений, уникальность метафор).

2. Социально-эмоциональные факторы (юмор, сопереживание).

3. Глубина знаний (например, обсуждение нишевых тем вроде философии Декарта).

Главная уловка GPT-4.5: модель избегала «идеальности». Она намеренно делала паузы, повторяла вопросы («Правильно ли я понял, что…?») и даже выражала сомнения — стратегии, типичные для живого общения.

Какие этические дилеммы возникают

1. Дезинформация. Исследователи предупреждают — GPT-4.5 может использоваться для манипуляций в соцсетях или мошенничества.

2. Психологическое влияние. В эксперименте некоторые участники после диалога с ИИ испытывали тревогу, осознавая, что не могут отличить машину от человека.

3. Пересмотр критериев. Тест Тьюринга больше не отражает «разумность» — только мастерство имитации. Ученые предлагают новые метрики, например, способность к рефлексии.

К слову, компания OpenAI уже анонсировала GPT-4.5 как модель с «эмоциональным интеллектом», доступную за $20–200 в месяц. Но прогресс не остановится: к 2026 году ожидаются модели, способные поддерживать многочасовые беседы без «сбоев» в логике, а к 2030 — нейросети могут научиться распознавать иронию и сарказм точнее людей.

GPT-4.5 — не просто прорыв в ИИ. Это зеркало, в котором человечество видит свои слабости: мы доверяем тем, кто умело подражает, даже если за этим нет сознания. Как заметил один из участников эксперимента: «Если машина способна обмануть меня так же, как это делает другой человек, — кто из нас более живой?»

Ольга Чернокоз, гендиректор IT-медиахолдинга РЕГИОНЫ РОССИИ, консультант по интеграции ИИ в бизнес

*Meta признана в России экстремистской организацией и запрещена.