Найти тему
Наталья Касперская

Сети для Всемирной паутины

Наталья Касперская, президент ГК InfoWatch
Наталья Касперская, президент ГК InfoWatch

О том, как информация в социальных сетях используется для предотвращения и раскрытия преступлений, рассказывает президент группы компаний InfoWatch, председатель правления Ассоциации разработчиков программных продуктов «Отечественный софт» Наталья Касперская.

Возможности анализа общедоступной информации о пользователях социальных сетей для решения практических и научных задач давно привлекают внимание маркетологов и психологов. Вместе с тем, такая информация может с успехом использоваться в правоохранительной деятельности.

Активные пользователи соцсетей составляют более половины населения земного шара. Из почти 146 миллионов граждан нашей страны ими пользуются 99 миллионов человек. Это практически всё взрослое население страны. Самым популярным является YouTube, насчитывающий 84,5 миллиона российских подписчиков. Если говорить о наиболее известных соцсетях, то меньше всего россияне интересуются Twitter (18,4 млн).

С помощью современных многофакторных систем мониторинга и анализа Интернета и социальных медиа – например, таких как «Крибрум» - можно за короткий срок получить серьёзный объём значимой информации. Эта информация может быть использована для составления психологического портрета, определения типа личности, образа жизни, предпочтений, взглядов и интересов человека.

«Крибрум» - мощная система, анализирующая социальные сети, интернет-СМИ, блоги, форумы, микроблоги, телеграм-каналы и видеохостинги в России, умеющая получать из них сообщения, до которых может «дотянуться», в том числе и закрытые протоколами. Эта сложная задача требует значительных технических мощностей для хранения информации. Ведь информация должна где-то аккумулироваться, лишь потом её анализируют и добывают нужные сведения.

Стоит отметить, что при проведении таких исследований анализируется в основном открытая (незашифрованная) информация. Однако не у любого пользователя есть специальные знания и технические возможности для анализа подобного объёма информации.

Существуют так называемые общедоступные профили пользователей. Но, как правило, заполнены они у малого числа людей. Большинство кроме имени, или просто ника, ничего о себе не сообщает. Поэтому из профиля можно почерпнуть немного. Но немало информации можно получить по изображениям, видеороликам, которые пользователи сами выкладывают в сеть. По их действиям – что они «лайкают», что постят, чем они интересуются – и по комментариям, которые они пишут, теоретически можно выявить их связи и склонности.

Не стоит забывать, что значительный объём информации размещается в социальных сетях в виде текстов. Их анализ способен не только дать представление о личности автора, но и обнаружить потенциальную угрозу совершения преступления или получить информацию об уже совершённых противоправных деяниях, например, экстремистского характера.

Можно изучать не только отдельную личность, но и анализировать сообщества, ведь социальные сети предоставляют возможность группового общения на различные темы, что даёт широкое поле для работы исследователя. Информация о группах людей выявляется с помощью сбора и обработки больших пользовательских данных в соцсетях, микроблогах, телеграм-каналах, на форумах и видеохостингах. По анализу можно вычислить тематику сообщества, его структуру, определить, из кого оно состоит, кто является лидером, кто последователем, кто случайно примкнул, и как можно этих случайных попутчиков отвадить от «плохой компании».

По нашим оценкам, сейчас в России почти 30 миллионов граждан вовлечены в деструктивные течения. Это значит, что они зашли в соответствующие группы более двух раз.

Как можно вести работу по регионам? Берётся региональный срез соцсетей и определяется, что происходит в той или иной республике или области, какие темы актуальны, какие события и проблемы обсуждают граждане на форумах, что их в данный момент особенно волнует. Также можно выявить социально-политический ландшафт региона – вычленить темы, вызывающие недовольство жителей региона, выявить региональных лидеров мнений, узнать об электоральных настроениях региона и т.д.

Протестную активность определить проще, чем высказывания отдельных деструктивно настроенных пользователей, потому что инициаторы активно выступают в соцсетях, привлекают сторонников. Они многословны, и поэтому легко узнать, где ядро, где – примкнувшие. Есть возможность понять, кто в какой связи находится.

В качестве примера работы с соцсетями для правоохранительных целей приведу проект по предотвращению незаконного оборота наркотиков. Сначала обнаруживается сообщение по такой теме, при этом используются лингвистические алгоритмы, где задействовано не только слово «наркотики», а целый спектр слов, которые используют распространители зелья в качестве синонимов. Соответственно, они перехватываются, и дальше по ним уже устанавливаются сообщества, в которых идёт распространение. Надо учитывать, что они закрытые, однако группы по вовлечению открыты, потому что дилерам нужно привлекать сбытчиков и покупателей. Последние можно выявлять и устанавливать их активных участников.

По закрытым группам тоже можно вести разработку, но для этого следует совместно с правоохранительными ведомствами проводить внедренческую работу, например, вступать в них в качестве участников.

Для правоохранителей важно прогнозирование численности участников планирующихся массовых акций. При правильном анализе можно довольно точно вычислить предполагаемое количество людей, которые, скажем, выйдут на несанкционированный митинг. Организаторы уличных выступлений находят своих сторонников именно в соцсетях, ведь это основной инструмент привлечения единомышленников. В целом в прогнозах фигурируют точные цифры, причём они гораздо точнее, чем при социологических опросах.

Также в соцсетях можно выявлять призывы к применению оружия, нападению на правоохранителей, пытаться на начальном этапе предотвратить превращение массового мероприятия в стихийную форму с призывами к насилию.

Отдельно скажу об исследовании молодёжной среды. Этим проектом мы занимаемся совместно с силовыми ведомствами, информация передаётся в соответствующие структуры и анализируется. Этой тихой работы по предупреждению страшных преступлений никто не видит. Между тем, с 2018 года, после керченской трагедии, у нас в стране было предотвращено более 30 случаев школьных расстрелов.

При этом надо понимать, что какую бы замечательную систему искусственного интеллекта не использовали, она даёт лишь вероятностный прогноз. Возможно, найдётся злоумышленник, просочившийся сквозь систему. Стопроцентной гарантии никто дать не сможет.

Сегодня информационная система выполняет 90 процентов работы, тем не менее остаётся 10 процентов «ручного» труда. Аналитик должен посмотреть, что выдала техника, вычленить самое ценное и сформировать точный и полный отчёт.

По российским сетям у нас хранится информация с 2010 года, это значит, что мы можем сделать ретроспективный анализ за 11 лет. Объём ретроспективной базы данных — 4 Птб. Информация снимается каждые 15 секунд, далее обрабатывается, но в целом в течение часа система точно распознаёт предполагаемое нарушение закона. Надо использовать эти возможности в полной мере.

По материалам выступления автора на межведомственной научно-практической специальной конференции «Цифровая полиция. ИКТ» в рамках XIII Международного салона средств обеспечения безопасности «Комплексная безопасность-2021»