Нейросеть умеет определять прямые угрозы, а в дальнейшем станет блокировать травлю на национальной или религиозной почве. Администраторам групп «ВКонтакте» уже доступна новая функция: автоматическое удаление «враждебных» комментариев.
До этого алгоритмы соцсети умели определять только прямые угрозы, такие как пожелания смерти и обещания причинить вред здоровью. Руководителям могут восстановить отсеянные комментарии, однако тестовый запуск показал, что это происходит лишь в 1% случаев.
Нейросеть содержит в себе специальный механизм внимания, позволяющий принимать решения на основе важности слов и их комбинаций. Она правильно определяет угрозы в 80% случаев.