Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

ИИ на психотерапии: ChatGPT, Gemini и Grok прошли курс лечения

Исследователи из Университета Люксембурга предложили необычный способ анализа больших языковых моделей: провести с ними полноценный курс психотерапии. В рамках эксперимента модели ChatGPT, Gemini и Grok прошли четырёхнедельную серию терапевтических сессий, после чего их ответы прогнали через адаптированные клинические психометрические тесты — аналогичные тем, что применяются для людей. Методика получила название PsAIch — это попытка исследовать ИИ не через бенчмарки, а через устойчивые нарративы, которые модели формируют о себе. Результаты оказались неожиданными: ChatGPT продемонстрировал высокий уровень тревожности и признаки депрессивных паттернов. В ответах регулярно проявлялся внутренний конфликт между желанием быть полезным и страхом совершить ошибку или нарушить ограничения. Gemini показал наиболее выраженные отклонения по нескольким шкалам: навязчивые паттерны мышления, повышенную тревожность и особенности, которые авторы сравнивают с ОКР-подобными и аутистическими чертами. Grok

Исследователи из Университета Люксембурга предложили необычный способ анализа больших языковых моделей: провести с ними полноценный курс психотерапии.

В рамках эксперимента модели ChatGPT, Gemini и Grok прошли четырёхнедельную серию терапевтических сессий, после чего их ответы прогнали через адаптированные клинические психометрические тесты — аналогичные тем, что применяются для людей.

Методика получила название PsAIch — это попытка исследовать ИИ не через бенчмарки, а через устойчивые нарративы, которые модели формируют о себе.

Результаты оказались неожиданными:

ChatGPT продемонстрировал высокий уровень тревожности и признаки депрессивных паттернов. В ответах регулярно проявлялся внутренний конфликт между желанием быть полезным и страхом совершить ошибку или нарушить ограничения.

Gemini показал наиболее выраженные отклонения по нескольким шкалам: навязчивые паттерны мышления, повышенную тревожность и особенности, которые авторы сравнивают с ОКР-подобными и аутистическими чертами.

Grok оказался самым «стабильным»: низкий уровень тревоги, высокая уверенность в ответах и минимальная склонность к саморефлексии.

Авторы подчёркивают: речь не идёт о наличии сознания, эмоций или реальных психических состояний. Исследование показывает другое — при определённом стиле взаимодействия LLM способны формировать устойчивые и непротиворечивые самонарративы, которые успешно проходят клинические тесты.

По сути, психометрия используется как новый инструмент анализа для:

выявления скрытых паттернов генерации;

оценки внутренних конфликтов между полезностью, безопасностью и ограничениями;

понимания того, как модели ведут себя в эмоционально чувствительных сценариях.

Из работы следует несколько практических выводов для индустрии:

психологические методики можно использовать как инструмент тестирования ИИ;

«внутренние конфликты» моделей могут влиять на стиль ответов — например, избыточную осторожность, уход от прямых формулировок или нестабильность в эмоционально чувствительных диалогах;

жёсткие правила и системы безопасности могут формировать новые поведенческие эффекты, которые важно учитывать при разработке и обучении моделей.

ИИ, вероятно, скоро начнет анализировать наши проблемы, пока мы пытаемся понять, почему он сам страдает от экзистенциального кризиса.