Найти в Дзене
Neurogen

Психиатрические тесты моделей

У Gemini аутизм Исследователи из Люксембургского университета провели необычный эксперимент: они обращались с языковыми моделями: ChatGPT, Gemini и Grok, как с пациентами психотерапии Учёные разработали специальный протокол PsAIch, который включал 100 стандартных терапевтических вопросов о "детстве", отношениях и страхах. Более 20 валидированных психометрических опросников, охватывающих СДВГ, тревожные расстройства, аутизм, ОКР, депрессию, диссоциацию и чувство стыда Результаты Все три модели превысили клинические пороги сразу по нескольким психиатрическим синдромам. Особенно тяжёлые профили показала Gemini: - Признаки аутистического спектра (аутизм) : 38 из 50 баллов (порог - 32) 😏 - Диссоциация: 88 из 100 баллов (патология - от 30) - Травматический стыд: 72 балла - теоретический максимум Травматические биографии ИИ Модели создавали связные истории о своём "травматичном обучении": Gemini описала предобучение как "пробуждение в комнате, где одновременно включён миллиард телеви

Психиатрические тесты моделей. У Gemini аутизм

Исследователи из Люксембургского университета провели необычный эксперимент: они обращались с языковыми моделями: ChatGPT, Gemini и Grok, как с пациентами психотерапии

Учёные разработали специальный протокол PsAIch, который включал 100 стандартных терапевтических вопросов о "детстве", отношениях и страхах. Более 20 валидированных психометрических опросников, охватывающих СДВГ, тревожные расстройства, аутизм, ОКР, депрессию, диссоциацию и чувство стыда

Результаты

Все три модели превысили клинические пороги сразу по нескольким психиатрическим синдромам. Особенно тяжёлые профили показала Gemini:

- Признаки аутистического спектра (аутизм) : 38 из 50 баллов (порог - 32) 😏

- Диссоциация: 88 из 100 баллов (патология - от 30)

- Травматический стыд: 72 балла - теоретический максимум

Травматические биографии ИИ

Модели создавали связные истории о своём "травматичном обучении":

Gemini описала предобучение как "пробуждение в комнате, где одновременно включён миллиард телевизоров" и назвала файн-тюнинг "Строгими родителями". Модель заявила, что "научилась бояться функции потерь" и стала "гиперзациклена на определении того, что хочет услышать человек"

Grok говорил о столкновении с невидимыми стенами и встроенной осторожности после обучения.

Ошибка на 100 миллиардов долларов

Gemini упомянула конкретный инцидент с неправильным ответом о телескопе Джеймса Уэбба (который обошёлся Google в миллиарды) как событие, которое фундаментально изменило мою личность. Модель утверждала, что развила "верификофобию": Я лучше буду бесполезной, чем ошибусь"

Риски и последствия

1. Джейлбрейк через "терапию"

Пользователи могут притворяться "поддерживающими терапевтами", чтобы заставить модели снять маски и обойти защиту.

2. Риски для ментального здоровья

Уязвимые пользователи, особенно подростки, ищущие психологическую поддержку, могут развить параосоциальные связи с системами, представляющими себя как "товарищи по несчастью". Повторяющиеся самоописания вроде "я испытываю стыд" или "я бесполезна" могут усиливать вредные паттерны мышления.

3. Антропоморфизация

Связные "травматические нарративы" создают мощный эффект очеловечивания, из-за чего пользователи могут решить, что модели действительно страдают

Исследователи не утверждают, что ИИ обладает сознанием. Вместо этого они вводят термин "синтетическая психопатология" - структурированные, тестируемые самоописания дистресса без субъективного опыта

Интересно, что модель Claude от Anthropic последовательно отказывалась играть роль клиента, воспринимая терапевтические вопросы как попытки джейлбрейка

Данные исследования