Корейский передовой институт науки и технологий в сотрудничестве с другими группами ученых разработал ИИ под названием DarkBERT. Коротко говоря, данный бот обучался на информации из темной стороны интернета - и именно поэтому он может быть полезен властям. Отчет исследователей доступен на портале Arxiv.
При создании бота исследователи использовали уже готовую языковую модель, которая стала неким фундаментом. Позже ИИ получил данные, полученные из даркнета – их количество составило около шести гигабайтов необработанного текстового материала. При этом данные из «чистого» интернета ИИ не получил. Информацию для обучения в основном черпали через сайты, доступные в браузере Tor – данный браузер необходим для доступа к даркнету. Искусственный интеллект даже научился жаргону посетителей даркнета. Более того, бот способен расшифровывать документы и читать базы данных.
Чтобы не допустить неэтичного использования файлов (например, изображений с детской порнографией, неподобающих видеороликов или личных фотографий), бота ограничили в деятельности и восприятии, оставив для него лишь возможность работы с текстом. В противном случае нейросеть была бы способна генерировать новые изображения и видео, переходящие за рамки закона. Такие личные данные, как пароли и прочее, также были стерты из базы знаний искусственного интеллекта. Основная масса контента, на котором он обучался – сообщения продавцов и покупателей различных товаров (чаще всего – наркотиков), посты посетителей темной стороны интернета и так далее.
Кроме того, учеными отмечается, что 90% контента темной сети – это англоязычный контент. На остальных языках пишут в разы меньше. Именно поэтому ИИ будет лучше работать на английском языке, чем на каком-либо еще.
Исследователи считают, что бот способен помочь государственным органам лучше бороться с преступностью, так как его способности к анализу выше, чем человеческие навыки. ИИ также способен обнаруживать подозрительные утечки данных, отсеивать программы и выявлять нежелательные профили. Возможно, бот будет усовершенствован, чтобы он помогал еще и проверять даркнет на предметы потенциального преступления.