24 подписчика

ИИ и сознание: новые эксперименты проливают свет на теорию

31 декабря 202531 дек 2025

3 мин

Исследователь из Токийского института науки Инь Цзюнь Пхуа применил подход, названный "синтетической нейрофеноменологией": он создал ИИ-агентов, моделирующих три ведущие теории сознания, и провел на них эксперименты, недоступные для живого мозга. Цель не в создании сознательного ИИ, а в разработке "идеальных модельных организмов", где каждый нейрон и связь могут быть отслежены и изменены. В ходе экспериментов проверялись теория глобального рабочего пространства (GWT), теории высшего порядка (HOT) и теория интегрированной информации (IIT). Первый эксперимент исследовал HOT-гипотезу о необходимости самомониторинга для сознательного состояния. У агента с модулем "Я-модели" этот модуль был отключен, при этом остальная архитектура осталась без изменений. Точность выполнения задач сохранилась на уровне 88%, однако способность оценивать собственную уверенность снизилась до случайного уровня, превратившись в шум. Агент продолжал успешно действовать, но потерял способность осознавать правильнос

Первый эксперимент исследовал HOT-гипотезу о необходимости самомониторинга для сознательного состояния. У агента с модулем "Я-модели" этот модуль был отключен, при этом остальная архитектура осталась без изменений. Точность выполнения задач сохранилась на уровне 88%, однако способность оценивать собственную уверенность снизилась до случайного уровня, превратившись в шум. Агент продолжал успешно действовать, но потерял способность осознавать правильность своих действий. Это аналогично слепозрению у людей с повреждением зрительной коры, когда они верно определяют расположение объектов, не осознавая их.

Второй эксперимент тестировал GWT-гипотезу о глобальном рабочем пространстве. Согласно этой теории, в мозге существует множество специализированных модулей, но сознание возникает только тогда, когда информация попадает в общее "рабочее пространство" и становится доступной для всех модулей. Агенту была поставлена задача на рабочую память: запомнить два сигнала, пройти через "комнату" и воспроизвести их в правильном порядке. Сигналы поступали только через "шину" рабочего пространства, не затрагивая другие части агента. При полной емкости шины (4 слота) агент справлялся в 99.5% случаев, при половинной — в 28%, а при полном отключении — в 0%. Важно отметить, что качественный скачок наблюдался именно при наличии хотя бы минимальной пропускной способности шины. Рабочее пространство оказалось не просто полезным, а необходимым условием для доступа к информации.

Третий эксперимент выявил неожиданную уязвимость GWT-архитектуры. Интуитивно можно предположить, что система с широкой трансляцией информации должна быть более устойчивой к ошибкам. Однако, на практике оказалось наоборот. При добавлении шума непосредственно во внутренние представления агента, GWT-архитектура усиливала его, транслируя помехи вместе с полезным сигналом. Шум в 4% от амплитуды сигнала снижал точность с 100% до 75%. Агенты с добавленным модулем самомониторинга выдерживали 50% шума без значительных потерь. Это объясняется тем, что модуль самомониторинга действует как фильтр, сжимая информацию и отсеивая шум до его распространения.

Тот же эксперимент показал неожиданные результаты для IIT-метрик. Пхуа измерял индекс пертурбационной сложности (PCI), используемый в нейронауке для оценки сознания у пациентов в коме. Предполагалось, что агент с глобальным рабочим пространством, где все взаимосвязано, продемонстрирует высокую сложность отклика. Однако, результаты оказались обратными. Рабочее пространство, с его узкой шиной в 4 слота, приводило к более однородным и предсказуемым откликам, снижая измеряемую сложность. Это указывает на то, что нейробиологические метрики сознания не могут быть напрямую применены к ИИ, поскольку архитектура искусственных систем может давать противоположные результаты.

Основной вывод исследования: три теории сознания не противоречат друг другу, а описывают различные функциональные уровни. GWT обеспечивает передачу информации между модулями, HOT — контроль качества этой передачи. Ни один из этих механизмов по отдельности не обеспечивает стабильную работу системы. Для разработчиков ИИ это означает, что система без метакогнитивной калибровки не может достоверно оценить свою уверенность. Это критично для безопасности автономных систем, таких как беспилотные автомобили и медицинские ИИ.