Найти в Дзене
IT Vibe

​​ИИ научился находить реальных людей за анонимами в интернете

Появилось исследование, которое может серьёзно изменить представление о приватности в интернете. Работа под названием “Large-scale online deanonymization with LLMs” показывает, что современные языковые модели способны автоматически деанонимизировать пользователей онлайн-платформ. Иными словами, связывать псевдонимные аккаунты с реальными людьми. Исследователи построили систему на базе LLM, которая выполняет несколько этапов анализа. Сначала модель извлекает из постов и комментариев пользователя факты, интересы, карьеру, демографию, стиль речи. Затем через поиск и семантические эмбеддинги она ищет потенциальные совпадения в интернете. После этого модель сопоставляет кандидатов и проверяет гипотезу о личности. Эксперименты проводились на нескольких датасетах с известной правильной идентификацией. Например, система сопоставляла аккаунты Hacker News с реальными профилями LinkedIn. В одном из тестов модель смогла правильно идентифицировать 226 из 338 пользователей, это около 67% случаев п

​​ИИ научился находить реальных людей за анонимами в интернете

Появилось исследование, которое может серьёзно изменить представление о приватности в интернете. Работа под названием Large-scale online deanonymization with LLMs показывает, что современные языковые модели способны автоматически деанонимизировать пользователей онлайн-платформ. Иными словами, связывать псевдонимные аккаунты с реальными людьми.

Исследователи построили систему на базе LLM, которая выполняет несколько этапов анализа. Сначала модель извлекает из постов и комментариев пользователя факты, интересы, карьеру, демографию, стиль речи. Затем через поиск и семантические эмбеддинги она ищет потенциальные совпадения в интернете. После этого модель сопоставляет кандидатов и проверяет гипотезу о личности.

Эксперименты проводились на нескольких датасетах с известной правильной идентификацией. Например, система сопоставляла аккаунты Hacker News с реальными профилями LinkedIn. В одном из тестов модель смогла правильно идентифицировать 226 из 338 пользователей, это около 67% случаев при точности 90%.

Важно, что это не какой-то новый тип данных. Алгоритм работает прямо с обычным текстом, постами, комментариями и обсуждениями. Предыдущие методы деанонимизации обычно требовали структурированные данные или сложную ручную работу, тогда как LLM может автоматизировать весь процесс.

Так называемая «практическая анонимность» в интернете больше не работает. Раньше многие пользователи полагались на то, что связать их аккаунты или установить личность слишком сложно и дорого. LLM не обязательно делают это лучше человека, но делают намного дешевле и масштабируемее.

Это не означает, что каждый аккаунт можно автоматически раскрыть. Но означает, что стоимость такого анализа резко падает. А значит, появляются новые риски масштабный OSINT, автоматизированный доксинг, усиление инструментов наблюдения со стороны платформ и государств.

Модели угроз для приватности в интернете нужно пересматривать, потому что эпоха псевдоанонимности по умолчанию заканчивается.

#AI #Privacy #LLM #Security

🔳 IT Vibe News