В настоящее время бизнес находится в непростой ситуации: с одной стороны, персональные данные необходимы для качественной работы с клиентами. С другой – любая ошибка в обращении с ними может привести к огромным штрафам и репутационным потерям. Ранее мы уже рассказывали, как в целом можно защитить чувствительную информацию от утечек с помощью искусственного интеллекта. Теперь хотим подробнее остановиться на одной из технологий – Named Entity Recognition (NER), которая помогает находить и обезличивать конфиденциальные данные в текстах, тем самым защищая их от злоумышленников. NER – это технология обработки естественного языка, которая позволяет находить в тексте так называемые «сущности»: имена людей, адреса, телефоны, номера документов, компании, географические объекты, деньги, проценты и другие подобные элементы. Например, в сообщении: «Иван Петров оставил заявку с номера +7…» NER определит имя человека и номер телефона как отдельные сущности. Далее эти данные можно скрыть, заменить, з