Найти тему
Знанио

Двоечники и отличники распознаются по постам в соцсетях

Учёные Высшей школы экономики создали компьютерную модель, которая распознает двоечников и отличников по написанию постов в соцсетях. Прогноз успеваемости строится на основе характерных слов и особенностей речи. Точность прогноза составляет 94%.

В будущем данная модель сможет определить депрессивные состояния и оценить психологическое благополучие у школьников и студентов. Исследование опубликовано в EPJ Data Science.

«Мы разрабатываем систему, которая смогла бы по активности человека в социальной сети выявить у него психологические трудности, в частности, такое состояние, как депрессия. Нельзя быть уверенным в том, как эта модель будет работать, если вначале не валидировать ее на характеристике, информация о которой широко доступна, например, на академической успеваемости», – отмечает автор статьи и руководитель проекта по гранту РНФ Иван Смирнов.

В выборкудля исследования попали более миллиона постов от 38 833 пользователей. Сначала исследователи проанализировали посты с открытых страниц «ВКонтакте» (всего более 130 тысяч сообщений) от 2468 испытуемых, которые сдавали тест PISA. Напомним, данный тест позволяет оценить грамотность подростка, а также его умение применять знания на практике.Далее проанализировали посты студентов из сотни крупнейших вузов страны.

В ходе анализа исследователи выяснили, что тексты «отличников», как правило, более объемные, с длинными словами, заимствованиями и богатой лексикой. Такие ученики чаще обсуждают физику, литературу (в текстах встречаются фамилии и имена писателей, персонажей) и используют выражения, описывающие мыслительный процесс («думаю», «считаю» и так далее).

Тексты «двоечников» пестрят ошибками, восклицаниями и словами, написанными заглавными буквами. Также в текстах часто встречаются смайлы. Эти ученики чаще обсуждают гороскопы, военную службу и ДТП.

Читайте также другие статьи по теме: