Компания Google провела обновление сервиса Gmail, в результате которого был добавлен новый спам-фильтр, предназначенный для более эффективной фильтрации нежелательных сообщений и фишинговых писем. Основой для этого спам-фильтра стало недавно разработанное программное обеспечение под названием "RETVec", способное преобразовывать слова в числовые представления или векторы. Векторизация текста уже давно используется разработчиками для интерпретации и классификации человеческого языка компьютерными моделями, включая определение, является ли определенное письмо спамом или нет. Однако основная проблема состояла в том, что существующие модели классификации текста не могли эффективно выявлять мошенничество и фишинговые атаки.
Это связано с тем, что киберпреступники используют различные методы обхода защиты, например, использование нелатинских символов для создания ссылок на авторитетные бренды. Более того, модели классификации текста требовали больших словарей и вычислительных ресурсов для обнаружения вредоносного содержимого и понимания опечаток, утверждают исследователи компании в своей статье. В ответ на это, Google разработала и применила RETVec, который обучен обнаруживать и понимать манипуляции на уровне символов, включая опечатки в тексте, и при этом снижает вычислительные затраты.
В течение последнего года Google также проводила тестирование RETVec во всех системах компании, чтобы оценить его полезность, и обнаружила, что он обеспечивает высокую эффективность в области безопасности и защиты от злоупотреблений, сообщила компания в своем блоге. Результаты показали, что RETVec улучшил обнаружение спама на 38% по сравнению с предыдущим Gmail-фильтром, при этом снизив процент ложных срабатываний на 19% и используя на 83% меньше вычислительных ресурсов. Благодаря этим результатам, внедрение RETVec стало одним из самых значительных обновлений в системе защиты Gmail за последние годы, добавляет Google. Кроме того, эта система работает на более чем 100 языках.