Появилось исследование, которое может серьёзно изменить представление о приватности в интернете. Работа под названием “Large-scale online deanonymization with LLMs” показывает, что современные языковые модели способны автоматически деанонимизировать пользователей онлайн-платформ. Иными словами, связывать псевдонимные аккаунты с реальными людьми. Исследователи построили систему на базе LLM, которая выполняет несколько этапов анализа. Сначала модель извлекает из постов и комментариев пользователя факты, интересы, карьеру, демографию, стиль речи. Затем через поиск и семантические эмбеддинги она ищет потенциальные совпадения в интернете. После этого модель сопоставляет кандидатов и проверяет гипотезу о личности. Эксперименты проводились на нескольких датасетах с известной правильной идентификацией. Например, система сопоставляла аккаунты Hacker News с реальными профилями LinkedIn. В одном из тестов модель смогла правильно идентифицировать 226 из 338 пользователей, это около 67% случаев п