Компания OpenAI уже давно обсуждается в контексте вопросов авторского права и использования контента без прямого согласия авторов. Ещё весной 2024-го года она громко заявляла о разработке инструмента Менеджер медиафайлов (Media Manager) — сервиса, который якобы сможет автоматически «распознавать» и исключать из обучающих наборов любые изображения и другие материалы, защищённые авторскими правами. Однако к обозначенному сроку проект так и не появился на свет. В чём проблема и почему фотографам по-прежнему трудно оградить свои работы от всё более прожорливых нейросетей?
📷 «Не сдержанное обещание» или приём в стиле «камень в огород»?
Ещё в мае 2024-го OpenAI представила идею Менеджера медиафайлов — предполагаемого «волшебного инструмента», который:
🔎 Умел бы автоматически определять изображения, тексты, аудио и видео, находящиеся под защитой авторского права;
🏆 Даёт фотографам и другим креативным авторам способ «нажать на стоп», то есть исключить своё творчество из обучающего датасета.
Однако, по последним новостям, приводимым в статье PetaPixel, OpenAI не выполнила собственный дедлайн. Более того, внутри компании мало кто вообще помнит о Менеджере медиафайлов, а упоминания этого инструмента практически исчезли из публичной повестки.
🔎 Почему фотографам приходится идти в «ручную атаку»
Фотографам ранее предложили метод отказа (opt-out) для DALL-E 3, но лишь при условии, что они:
📝 Вручную перечислят каждую фотографию
💬 Снабдят детальным описанием
⚙️ Отправят заявку на исключение своей работы из обучающего пула.
Очевидно, что такой подход не масштабируется. Тот же пейзажный фотограф, у которого тысячи снимков, вряд ли станет тратить дни (а то и недели), пытаясь «вычеркнуть» своё авторство строчка за строчкой.
С точки зрения справедливости — выглядит странно:
❌ Несправедливое бремя ответственности (бремя доказательства) перекладывается на самих авторов, многие из которых даже не подозревают о существовании подобных процедур.
🏗️ Менеджер медиафайлов: что пошло не так?
Грядущий Менеджер медиафайлов обещал стать более дружелюбным инструментом — единой точкой, где автор может посмотреть, какие его фотографии (или другие материалы) есть в базе OpenAI, и отказаться от их использования.
Однако по словам бывшего сотрудника OpenAI, цитируемого в новостях:
💼 «Я не помню, чтобы кто-то у нас этим занимался»
Это прямой намёк на то, что проект, возможно, так и не получил приоритета.
При этом юристы отмечают, что создание подобной системы — это не только вопрос технологии:
⚖️ Нужно учесть разные юрисдикции (где-то строже относятся к авторскому праву, где-то лояльнее),
💰 Вопрос возможных компенсаций для авторов может всплыть, если какая-то часть работы будет использоваться в коммерческих нейросетях.
Как отмечает IP-юрист Андриан Сайхан: большие платформы (YouTube, TikTok и т.д.) тоже сталкиваются с челленджами при внедрении систем идентификации контента, и то, что задумала OpenAI, ещё более сложно в реализации.
🤔 Личное мнение: кто должен контролировать авторские права в эпоху ИИ?
Я вижу ситуацию так:
💡 Создать всёобъемлющую систему отказа действительно сложно. Зачастую программы машинного обучения работают на огромных наборах изображений, собранных из открытых интернет-источников. Но всё больше растёт понимание, что «открытое» не значит «не имеющее авторства».
🔑 Авторское право должно поддерживаться технологиями «по умолчанию», а не становиться «игрой в прятки». Если искусственный интеллект (ИИ) настолько интеллектуален, то, возможно, он мог бы лучше «читать» лицензионные данные и автоматически исключать материалы.
🙏 Требовать от фотографов «вручную выпиливать» контент из базы — путь, ведущий к хаосу. Большинство творцов даже не в курсе, что их работы уже в какой-то базе.
🧩 Технические детали: что вообще надо для такого Менеджера медиафайлов?
🗂️ Глобальный реестр контента
OpenAI (или любая подобная компания) должна как-то «видеть» и индексировать все изображения, чтобы сопоставить их с чьими-то правами.
🤖 Алгоритмы распознавания копирайта
Потребуется мощная «сигнатурная» система, которая находит совпадения не только по пиксельному подобию, но и по метаданным (EXIF, IPTC).
🔌 Интеграция с фотобанками
Серьёзные фотостоки (например, Getty Images) уже имеют базы лицензированного контента; логичным было бы подписать соглашения об использовании их API, чтобы понимать, что точно «под правами».
☝️ Простота для автора
В идеале, автор загружает только что-то вроде «своего портфолио», а система сама определяет, что из него уже «засосали» нейросети.
Но всё это — колоссальная работа. Поэтому пока Менеджер медиафайлов и остаётся «обещанием без конкретики».
🚀 Итог: что ждёт нас дальше?
Остаётся ощущение, что OpenAI стремится во всю ширь покорять рынок, оставляя за бортом «излишние» с их точки зрения вопросы — вроде авторской защиты. При этом всё больше стран задумывается о законодательном регулировании AI-инструментов.
Возможно, именно давление законодателей (и судебные процессы от фотографов и других творцов) заставят OpenAI или конкурентов запустить полноценную систему вроде Менеджера медиафайлов, где процесс отказа будет простым и доступным.
Но пока фотографы вынуждены «играть» по правилам, которые навязывают крупные технологические компании. Если компания не предоставляет удобный инструмент отказа, это автоматически означает, что большая часть работ «волей-неволей» участвует в обучении моделей. И именно это вызывает сильное раздражение у авторов.
🔗 Ссылки на материалы
Интеллектуальные системы становятся всё мощнее, но пока не видно, чтобы забота об авторских правах была включена в их код на уровне «по умолчанию». Как пользователь и фотограф, я считаю, что прозрачность и удобство должны стать основными принципами таких инструментов. Без этого нейросети рискуют окончательно подорвать доверие к себе со стороны креативных профессионалов.