18 подписчиков

Как нейросети втайне обучаются на наших фото

18 марта18 мар

3 мин

Думаете, ваши старые кадры с моря или аватарки десятилетней давности давно никому не нужны? Пока вы пьете утренний кофе, искусственный интеллект может использовать именно ваше лицо, чтобы сгенерировать виртуального персонажа для чужого бизнеса или сомнительного видео. И самое неприятное — вы об этом даже не подозреваете. Я, Антон Таранов, в практике Pantera Digital часто вижу одну и ту же картину: человек случайно находит в сети сгенерированного клона со своей внешностью или замечает, что нейросеть идеально копирует его авторский стиль рисования. Мы ежедневно помогаем людям вычищать их цифровую историю, и сегодня я дам вам четкий алгоритм, как вытащить свои личные данные из цепких лап машин. Проблема носит массовый характер. Никто не сидит и не отбирает ваши снимки вручную. По сети круглосуточно ползают программы-краулеры, которые автоматически собирают миллиарды картинок вместе с их описаниями. Все это сваливается в гигантские архивы (например, LAION-5B), на которых потом тренируют по

Оглавление

Как мы попадаем в датасеты
План экстренной эвакуации контента
Закон на вашей стороне

Я, Антон Таранов, в практике Pantera Digital часто вижу одну и ту же картину: человек случайно находит в сети сгенерированного клона со своей внешностью или замечает, что нейросеть идеально копирует его авторский стиль рисования. Мы ежедневно помогаем людям вычищать их цифровую историю, и сегодня я дам вам четкий алгоритм, как вытащить свои личные данные из цепких лап машин.

Как мы попадаем в датасеты

Проблема носит массовый характер. Никто не сидит и не отбирает ваши снимки вручную. По сети круглосуточно ползают программы-краулеры, которые автоматически собирают миллиарды картинок вместе с их описаниями. Все это сваливается в гигантские архивы (например, LAION-5B), на которых потом тренируют популярные генераторы изображений.

❌ Миф: Если я удалил фото со своей странички, оно исчезло навсегда.
✅ Правда: Если снимок успел проиндексироваться краулером, его цифровая копия уже навсегда вшита в базу данных разработчиков.

💡 Интересный факт: В эти базы попадает всё — от корпоративных портретов на сайтах компаний до любительских фото из открытых альбомов. Нейросети абсолютно все равно, кто изображен на снимке. Ей нужны пиксели для обучения.

План экстренной эвакуации контента

Если вы фотограф, художник или просто человек, который ценит свою приватность, действовать нужно по алгоритму. Спойлер: ругаться с самими нейросетями в чате бесполезно. Нужно бить по тем, кто хранит архивы.

📌 Чек-лист по спасению:
▢ Найти следы. Зайдите на сайт haveibeentrained.com. Загрузите туда свое фото. Этот сервис покажет, есть ли ваше лицо в крупнейших открытых базах для обучения.
▢ Зафиксировать. Нашли себя? Сразу делайте скриншоты с датой и временем. Обязательно сохраните ссылки на страницы, где лежат эти архивы.
▢ Найти адресата. Обращаться нужно не к создателям генераторов картинок, а к владельцам датасетов (например, организация LAION в Германии).
▢ Отправить требование. Пишем официальное письмо с требованием удалить информацию. В Европе это делается по правилам GDPR, в США — через DMCA.

Закон на вашей стороне

Не думайте, что вы бесправны перед лицом корпораций. Юридические рычаги работают отлично, если знать, на какие кнопки нажимать.

Если вы находитесь в России, опирайтесь на два фундаментальных документа. Использование вашего лица без спроса — это прямое нарушение статьи 152.1 Гражданского кодекса РФ, которая охраняет изображение гражданина. Кроме того, лицо — это биометрия. А значит, несанкционированный сбор таких снимков нарушает базовый закон о персональных данных.

⚠️ Компании очень не любят штрафы. Угроза обращения в Роскомнадзор (или в европейские органы надзора, если база зарубежная) заставляет их удалять спорный контент довольно резво.

Грамотная претензия работает лучше долгих уговоров

Даже если сейчас ваших снимков в базах нет, это не значит, что завтра туда не утечет ваша свежая аватарка. Что можно сделать прямо сегодня?

Снижайте качество. Нейросети обожают высокое разрешение. Публикуйте в сети урезанные версии фото (менее 512x512 пикселей) — они для обучения практически бесполезны.
Используйте "яды" для ИИ. Существуют бесплатные программы вроде Glaze или Nightshade. Вы прогоняете через них свою картинку перед публикацией. Визуально она не меняется, но если робот попытается на ней обучиться, его алгоритмы сломаются, и он запомнит мусор вместо вашего лица или стиля.
Закрывайте профили. Банально, но эффективно. Роботы не умеют стучаться в закрытые аккаунты.

Цифровая гигиена в наши дни — это не роскошь, а суровая необходимость. Защищайте свое лицо так же тщательно, как пин-код от банковской карты.

А теперь небольшой эксперимент! Прямо сейчас вбейте свои имя и фамилию в поиск по картинкам Яндекса или Гугла. Напишите в комментариях свои эмоции от того, что вы там увидели (только без личных подробностей!). Нашли старые фото, о которых давно забыли?

Если тема цифровой безопасности и управления репутацией вам близка, подписывайтесь на канал Pantera Digital — здесь мы разбираем реальные механизмы выживания в современном интернете.

Гаджеты и электроника

5,73 млн интересуются