Найти в Дзене
DigEd

AI-компания выиграла дело в Высоком суде после иска фотоагентства о нарушении авторских прав

Автор Доктор Барри Сканнелл Решение Высокого суда Англии по делу Getty Images против Stability AI наконец-то появилось, и оно насчитывает целых 205 страниц. Я ВСЕ ЕЩЕ его читаю. Но по моим первым впечатлениям, оно может изменить понимание искусственного интеллекта правовыми системами. Это ОЧЕНЬ важно — судья Джоанна Смит пришла к выводу, что модели Stable Diffusion «не хранят и не воспроизводят никакие произведения, защищенные авторским правом [Getty], и никогда этого не делали». Это может показаться незначительным моментом, но, на мой взгляд, он затрагивает самую суть того, как регулирующие органы по всей Европе, включая Европейский совет по защите данных, анализируют системы искусственного интеллекта. В решении отклоняется иск Getty Images о вторичном нарушении на том основании, что модель не содержит и не воспроизводит произведения, на которых она была обучена. В пункте 758(viii) судья Смит четко указала, что хотя копия, нарушающая авторские права, может быть предметом Закона об авт
Тиффани Хаглер-Гирд/Bloomberg через Getty Images
Тиффани Хаглер-Гирд/Bloomberg через Getty Images

Автор Доктор Барри Сканнелл

Решение Высокого суда Англии по делу Getty Images против Stability AI наконец-то появилось, и оно насчитывает целых 205 страниц. Я ВСЕ ЕЩЕ его читаю. Но по моим первым впечатлениям, оно может изменить понимание искусственного интеллекта правовыми системами. Это ОЧЕНЬ важно — судья Джоанна Смит пришла к выводу, что модели Stable Diffusion «не хранят и не воспроизводят никакие произведения, защищенные авторским правом [Getty], и никогда этого не делали». Это может показаться незначительным моментом, но, на мой взгляд, он затрагивает самую суть того, как регулирующие органы по всей Европе, включая Европейский совет по защите данных, анализируют системы искусственного интеллекта.

В решении отклоняется иск Getty Images о вторичном нарушении на том основании, что модель не содержит и не воспроизводит произведения, на которых она была обучена. В пункте 758(viii) судья Смит четко указала, что хотя копия, нарушающая авторские права, может быть предметом Закона об авторском праве, промышленных образцах и патентах, обученная модель ИИ таковой не является. Это не библиотека изображений или текстов. Это сеть статистических весов и параметров, которые описывают отношения, а не сами данные.

Это техническое заключение имеет последствия, выходящие далеко за рамки авторского права. Оно потенциально противоречит недавнему заключению EDPB о персональных данных в моделях ИИ, в котором говорится, что модель может считаться анонимной только в том случае, если «вероятность, прямая или вероятностная, извлечения персональных данных» незначительна.

Решение судьи Смита предполагает, что восстановить нечего, поскольку данных нет. В заключении EDPB говорится, что «... информация из набора обучающих данных, включая персональные данные, может по-прежнему оставаться «поглощенной» параметрами модели, а именно представленной через математические объекты ... [они] могут по-прежнему сохранять исходную информацию этих данных...».

Это отражает два противоположных мировоззрения о том, что на самом деле представляют собой модели ИИ. Некоторые могут считать, что EDPB рассматривает ИИ как абстрактную математическую базу данных, хранящую и потенциально раскрывающую персональные данные. Английский Высокий суд признал, что они не работают таким образом. Модель ИИ — это просто набор цифр. Без системы ИИ — может ли она что-либо произвести?

Мне кажется поразительным, что большая часть дискуссий о регулировании ИИ в Европе исходит из того, что данные каким-то образом находятся в модели в неактивном состоянии, ожидая извлечения. Это предположение лежит в основе недавних рекомендаций по конфиденциальности, обязательств по прозрачности и даже предлагаемых механизмов аудита. Обучение включает в себя изучение моделей, а не хранение контента. Это различие имеет значение как с юридической, так и с научной точки зрения.

Наши правовые системы с трудом поспевают за техническими реалиями машинного обучения. Как авторское право, так и рамки защиты данных основываются на старых представлениях о копировании и хранении. Когда эти представления сталкиваются с системами, которые учатся, а не хранят, правовая согласованность нарушается.

Это решение будет иметь резонанс в дискуссиях о регулировании в течение многих лет. Оно ставит перед законодателями, регулирующими органами и технологиями задачу наконец-то говорить на одном языке.

Источник