Алгоритмы машинного обучения могут помочь предсказать, с точностью 90% начало психоза, анализируя беседы пациента, согласно данным этого исследования здесь.
Психоз может быть симптомом психических расстройств, таких как шизофрения или биполярное расстройство. Людям, страдающим психозом, трудно сказать, что реально, а что нет; некоторые сообщают о зрительных и слуховых галлюцинациях и заставляют поверить в бредовые мысли. Психоз также может быть вызван стрессом, наркотиками или недосыпанием.
Психические заболевания обычно имеют тенденцию развиваться в возрасте двадцати лет, а предупреждающие знаки начинают появляться в возрасте около 17 лет. По оценкам, около 25-30 процентов молодых людей, страдающих по крайней мере некоторыми симптомами, такими как психоз, в конечном итоге развивают полные взрывные психические расстройства, такие как шизофрения.
Изучая речевые узоры пациента, программное обеспечение должно выяснить, будет ли этот человек в конечном итоге страдать психозом и, таким образом, может ли у него развиться психическое расстройство, Филипп Вольф, соавтор статьи, опубликованной в npj Schizophrenia, и др. объяснил профессор психологии в американском университете Эмори.
«Ранее было известно, что тонкие черты будущего психоза присутствуют на языке людей, но мы использовали машинное обучение, чтобы фактически обнаружить скрытые детали об этих чертах», - сказал он в конце прошлой недели. Некоторые из функций включают в себя то, насколько чёткой является чья-то речь. и как часто они говорят о голосах и звуках.
Вольф и его коллеги использовали алгоритмы ИИ для анализа речи из двух наборов данных. Первым набором данных было продольное исследование Североамериканского продрома (NAPLS), в котором, среди прочего, документируются интервью и беседы с 40 участниками в возрасте старше 20 лет, которые были определены как подверженные риску развития психоза. Речь 30 из участников была использована для обучения программного обеспечения тому, на что похожи потенциальные больные психозом, а остальные десять были использованы для проверки обученной модели на ее точность в прогнозировании риска психоза.
«Попытка услышать эти тонкости в разговорах с людьми - это все равно, что попытаться увидеть микроскопические микробы своими глазами», - сказала Негин Резаи, первый автор статьи, которая завершила исследование в Университете Эмори и в настоящее время является психоневрологом в Гарвардском университете. «Разработанная нами автоматизированная техника является действительно чувствительным инструментом для обнаружения этих скрытых узоров. Она похожа на микроскоп для предупреждающих признаков психоза».
Второй набор данных был взят из популярного интернет сообщества Reddit и содержал 401 миллион слов из онлайн-разговоров между 30 000 пользователей сети. Это считалось "нормальной" болтовней. Учитывая некоторые, и, конечно, не все, субреддиты, которые мы видели, слово «нормальный» здесь выполняет очень тяжелую работу. Чтобы было ясно, набор данных NAPLS использовался для обучения и тестирования модели, а набор данных Reddit использовался, чтобы увидеть, как программное обеспечение реагирует на, казалось бы, нормальных людей.
Вот как изложено в статье, и нет, у вас самих не развивается психоз, он действительно написан так до конца:
Сравнивая меньшую часть текста [набор данных NAPLS] с большей частью текста [набор данных Reddit], уникальные аспекты меньшей части текста можно сделать более очевидными и подчеркнутыми. Без такого сравнения контент-анализ небольшой части текста будет содержать информацию не только о том, что является уникальным для этого текста, но и информацию о том, что является общим для других текстов. Текст с сайта социальной сети Reddit был использован для создания корпуса, отражающего содержание обычных разговоров.
Другими словами, мы думаем, что исследователи, пройдя свои алгоритмы через набор данных Reddit, пришли к выводу, что набор данных Reddit имел более высокую семантическую плотность, чем данные NAPLS, что означает, что пользователи Reddit вряд ли будет психоз. Подробнее об этом через минуту. Мы попросили исследовательскую группу рассказать об этом на простом языке, и мы не получили ответа.
Мы отмечаем, что стенограммы разговоров, записанных на видео, были взяты из NAPLS для учебных и оценочных наборов, тогда как набор данных Reddit содержит полностью напечатанные сообщения форума. Мы полагаем, что люди выражают себя в Интернете так, как им не хотелось бы встречаться лицом к лицу, поэтому возьмите это сравнение с щепоткой соли.
Word2Vec
Команда использовала Word2Vec , модель нейронной сети, предварительно обученную в архиве New York Times, чтобы преобразовать слова из набора данных NAPLS в векторные пространства. Подобные слова сгруппированы ближе друг к другу, например, слово «королева» более тесно связано с «женщиной», поэтому оба слова будут ближе друг к другу в векторном пространстве по сравнению со словом «мужчина».
Затем программное обеспечение использовало метод, известный как распаковка векторов, чтобы определить значение данного предложения, произнесенного человеком, из слов, использованных в этом предложении. Алгоритмы показали, что люди, подверженные риску психоза, часто используют много слов, чтобы говорить о случайных идеях, которые не имеют ясного значения, что исследователи описывают как «низкая семантическая плотность». Поэтому высокая семантическая плотность указывает на то, что кто-то связно говорит о предмете.
Для десяти участников NAPLS, использовавшихся для тестирования окончательной модели, у половины из них не развивалась шизофрения, в то время как у другой половины развивалось расстройство в более позднем возрасте. Модель была на 90 процентов точной в прогнозировании, кто с большей вероятностью войдет в психотическое состояние, основываясь только на их речевых моделях. Низкая семантическая плотность означала, что они могли развить психоз.
Резаи надеялся, что модель поможет психологам диагностировать и лечить психические заболевания более объективно. «В клинической сфере нам часто не хватает точности. Нам нужны более количественные, объективные способы измерения тонких переменных, таких как скрытые в языковом использовании».
«Если мы сможем выявить людей, которые ранее подверглись риску, и использовать профилактические меры, мы могли бы обратить вспять дефицит», - заключила Элейн Уолкер, соавтор газеты и профессор психологии в Университете Эмори. «Существуют хорошие данные, показывающие, что такие методы лечения, как когнитивно-поведенческая терапия, могут отсрочить начало заболевания и, возможно, даже уменьшить возникновение психоза»