Лжи в интернете свойственна
общая стилистика написания,
предвзятость
и опора на не надёжные СМИ.
Исследователи из Американского университета создали статистическую модель, которую можно использовать для обнаружения дезинформации в социальных сетях. Она также позволяет избежать главной проблемы для учёных – слепых зон с непрослеживаемой логикой, свойственных обычно алгоритмам ИИ.
Используя набор данных Twitter с дезинформационными сообщениями о COVID-19, Зойс Букувалас, доцент кафедры математики и статистики Колледжа искусств и наук Австралии, показывает, как статистические модели могут обнаруживать дезинформацию в социальных сетях во время таких событий, как пандемия или стихийное бедствие, и то, как решения модели совпадают с решениями человека.
Новый метод – это разновидность всё того же машинного обучения, но уже с использованием статистики. Основой управляемого данными решения, выступает модель скрытых переменных, называемая независимым анализом компонентов (ICA), где небольшая потеря точности по сравнению с другими моделями ИИ компенсируется интерпретируемыми контекстными представлениями.
«Мы хотели бы знать, о чем думает машина, когда принимает решения, и как и почему она соглашается с людьми, которые её обучали», – говорит он. – Мы не хотим блокировать чью-либо учётную запись в социальных сетях, потому что модель принимает необъективное решение».
Для тестового набора из 112 настоящих и дезинформационных твитов модель достигла высокой эффективности прогнозирования и правильно классифицировала их с точностью почти 90 процентов. Это дало понимание о том, что, вопреки ожиданиям, использование такого компактного набора данных оказалось довольно эффективным способом проверки того, как метод обнаруживал дезинформационные сообщения.
«Как только мы добавляем эти входные данные в модель, она пытается понять основные факторы, которые приводят к разделению хорошей и плохой информации, – поясняет другой участник исследования, профессор компьютерных наук Натали Япкович – Это изучение контекста и того, как слова взаимодействуют».
Однако, несмотря на успехи в области машинного обучения, помогающие бороться с дезинформацией, Букувалас и Япкович считают, что человеческая интеллигентность и новостная грамотность остаются первой линией защиты в предотвращении распространения непроверенных или неточных данных, и уж теб более откровенной лжи.
По материалам АРМК.