Добавить в корзинуПозвонить
Найти в Дзене

Обнаружение мошеннических аккаунтов в социальных сетях с использованием гибридной модели глубокого трансформера

Высокий темп развития социальных медиа спровоцировал рост числа фейковых аккаунтов, что представляет собой серьезный риск для конфиденциальности пользователей и целостности платформы. Эти злонамеренные аккаунты сложно обнаружить из-за высокой многомерности, последовательности и несбалансированности данных о действиях пользователей. Появление фальшивых профилей в социальных медиа угрожает личной безопасности и доверию пользователей. Обнаружить такие аккаунты сложно, так как пользовательское поведение имеет высокую многомерность и последовательность. Текущие методы часто упускают сложные паттерны активности или даже переобучаются, и поэтому требуется мощная, масштабируемая и точная модель для обнаружения мошенничества в социальных медиа. Данное исследование предлагает новую архитектуру глубокого обучения, которая включает Временную свёрточную сеть (TCN) с дополнением данных на основе Генеративной состязательной сети (GAN) для генерации классов меньшинства и автоэнкодеры для уменьшения р
Оглавление

Аннотация

Высокий темп развития социальных медиа спровоцировал рост числа фейковых аккаунтов, что представляет собой серьезный риск для конфиденциальности пользователей и целостности платформы. Эти злонамеренные аккаунты сложно обнаружить из-за высокой многомерности, последовательности и несбалансированности данных о действиях пользователей. Появление фальшивых профилей в социальных медиа угрожает личной безопасности и доверию пользователей. Обнаружить такие аккаунты сложно, так как пользовательское поведение имеет высокую многомерность и последовательность. Текущие методы часто упускают сложные паттерны активности или даже переобучаются, и поэтому требуется мощная, масштабируемая и точная модель для обнаружения мошенничества в социальных медиа.

Данное исследование предлагает новую архитектуру глубокого обучения, которая включает Временную свёрточную сеть (TCN) с дополнением данных на основе Генеративной состязательной сети (GAN) для генерации классов меньшинства и автоэнкодеры для уменьшения размерности. Алгоритм оптимизации сеагулов (SOA), который является метаэвристическим, используется для оптимизации гиперпараметров, обеспечивая баланс между эффективностью и скоростью сходимости в глобальном поиске. Рамки тестируются на стандартизированных наборах данных (Cresci-2017 и TwiBot-22 ) и сравниваются с современными моделями. В экспериментах показано, что предложенная структура TCN-GAN-SOA демонстрирует лучшие результаты, с ROC-AUC 0.96 на Cresci-2017 и 0.95 на TwiBot-22, а также более высокие значения точности и полноты. Кроме того, вычислительная эффективность подтверждается анализом времени выполнения; примеры показывают мощь структуры при изменении различных ситуаций мошеннического поведения. Данное решение предлагает масштабируемую, надежную и точную методологию обнаружения мошенничества в социальных медиа на основе комбинации сложного последовательного моделирования, реалистичного увеличения данных и оптимизации гиперпараметров.

Введение

С миллиардами пользователей и огромным объемом материала, производимого каждый день, социальные медиа стали одной из самых влиятельных цифровых площадок. Facebook, Instagram, Twitter (X) и LinkedIn не только используются для личного общения, но и в активностях, цифровом маркетинге и политических дебатах. Тем не менее, такой широкий доступ и открытость также привлекают злоумышленников, которые используют социальные медиа для совершения мошенничества. Наиболее распространенные схемы мошенничества включают фишинг, финансовое мошенничество, кражу личных данных, дезинформацию и манипуляции на основе глубоких фейков.

Хотя в исследованиях обнаружения мошенничества наблюдается прогресс, современные системы неэффективны в решении специфических проблем, которые présentent социальные медиа. Тренды мошенничества быстро меняются и стремятся принимать форму реального пользовательского трафика, чтобы остаться незамеченными. Данные (текст, изображения, видео и сетевые ссылки) несструктурные и многомодальные, что усложняет их обнаружение. Кроме того, ручной или основанный на правилах мониторинг не может справиться с масштабной и постоянно развивающейся средой социальных медиа, что приводит к высокой доле ложных срабатываний в системах обнаружения мошенничества.

Данный проект направлен на разработку адаптивной архитектуры глубокого обучения, которая может обойти проблемы с последовательностями действий пользователей, высокоразмерными данными и несбалансированными классами. Направление работы включает использование TCN для изучения последовательностей поведения, дополнение данных на основе GAN для увеличения классов меньшинства и автоэнкодеры для уменьшения размерности.

Методология

Предложенная структура включает предварительную обработку данных с использованием GAN для уменьшения несбалансированности классов и автоэнкодеров для снижения размерности. TCN использует эпохи с каузальной растянутой сверткой. Алгоритм оптимизации SOA используется для оптимизации гиперпараметров, включая размер фильтра, коэффициент растяжения и глубину резистивного блока. Процесс обучения включает сравнение с современными методами, чтобы повысить эффективность обнаружения мошенничества.

Результаты и обсуждение

Экспериментальное сравнение производительности включает использование наборов данных Cresci 2017 и TwiBot-22. Результаты показывают, что предложенная структура TCN-GAN-SOA превосходит базовые модели по всем основным метрикам, включая точность, полноту и F1-меру, демонстрируя ее большую эффективность в обнаружении мошеннических аккаунтов.

Выводы показывают, что временные и поведенческие паттерны мошеннических аккаунтов различаются, что модель может эффективно захватывать. Указанная работа представляет надежную и масштабируемую систему, которая не только идентифицирует мошеннические действия, но и предлагает интерпретируемость выявленных паттернов, обеспечивая надежное решение для предотвращения мошенничества в онлайн-сетях.

==> Хотите узнать про автоматизации на n8n? — Здесь основные курсы n8n, вы научитесь автоматизировать бизнес-процессы! <==

-2