Данная разработка основана на технологиях искусственного интеллекта и обеспечивает очень точное обнаружение «нежелательной» информации в интернете.
В 2019 году компания Google создала новый алгоритм поиска BERT, отлично работающий со множеством языков. Эта разработка использует нейронную сеть для анализа не слов, а целых предложений, за счет чего выдача становится гораздо более релевантной. Выяснилось, что BERT может стать основой для высокоэффективного ИИ-цензора, и это помогло китайским разработчикам
Их детище способно отыскивать не внушающие доверия тексты, при этом точность работы превышает 90%, сообщают специалисты. Для сравнения: обнаружение по ключевым словам дает результативность 70%, а обученная человеком нейросеть – 80%.
Гугловский BERT с открытым кодом не способен к анализу текстов, содержащих свыше 512 слов. Для преодоления этого недостатка китайцы создали алгоритм, разбивающий тексты на приемлемые для BERT фрагменты, а затем эти куски автоматически воссоединяются в первоначальный единый текст. В результате ИИ-цензор даже способен определять замаскированный в материале подтекст между строк.
Напомним, что Всемирная сеть в КНР находится под жестким правительственным контролем и цензурой. Здесь не работают наиболее популярные всемирные социальные сети, а на доступных китайцам иностранных сайтах информация подвержена глубокой цензуре. Под строгим запретом для китайских пользователей интернета – порно, психоактивные вещества, оружие и экстремизм. Кроме того, запрещено высказываться критически о коммунистической партии Китая и об ее руководстве. Новинка в итоге позволит еще более ужесточить ограничения и эффективнее заблокировать нежелательную информацию.