Добавить в корзинуПозвонить
Найти в Дзене
Кот редактора

Издатели против

Пока у нас решается вопрос о разрешении использования авторского контента нейросетями без согласия правообладателей, в Америке группа из пяти крупнейших мировых издательств (Hachette Book Group, Macmillan Publishers, McGraw Hill, Elsevier, Cengage) и известный автор Скотт Туроу подали коллективный иск против корпорации Meta* (экстремистская организация, деятельность которой запрещена на территории РФ) и лично ее главы Марка Цукерберга. Иск подан в Федеральный окружной суд Южного округа Нью-Йорка. В центре иска лежит утверждение, что корпорация сознательно использовала пиратские библиотеки для сбора данных, на которых обучались ее языковые модели Llama. Но особый интерес вызывает не сам факт использования данных, а то, как принималось решение об их использовании. В распоряжении истцов оказались внутренние документы компании. Согласно жалобе, компания рассматривала возможность заключения лицензионных соглашений с издателями и даже планировала увеличить бюджет на эти цели (с 17 млн. до $

Издатели против

Пока у нас решается вопрос о разрешении использования авторского контента нейросетями без согласия правообладателей, в Америке группа из пяти крупнейших мировых издательств (Hachette Book Group, Macmillan Publishers, McGraw Hill, Elsevier, Cengage) и известный автор Скотт Туроу подали коллективный иск против корпорации Meta* (экстремистская организация, деятельность которой запрещена на территории РФ) и лично ее главы Марка Цукерберга. Иск подан в Федеральный окружной суд Южного округа Нью-Йорка.

В центре иска лежит утверждение, что корпорация сознательно использовала пиратские библиотеки для сбора данных, на которых обучались ее языковые модели Llama.

Но особый интерес вызывает не сам факт использования данных, а то, как принималось решение об их использовании. В распоряжении истцов оказались внутренние документы компании. Согласно жалобе, компания рассматривала возможность заключения лицензионных соглашений с издателями и даже планировала увеличить бюджет на эти цели (с 17 млн. до $200 млн.). Однако инициатива была остановлена после эскалации вопроса руководству.

Помимо вопроса незаконного копирования, издатели поднимают более широкую проблему: влияние генеративного ИИ на рынок контента.

В иске приводятся примеры того, как пользователи с помощью Llama 3.1 генерируют целые романы из 100 глав по одному запросу.

Издатели и авторы жалуются, что индустрию захлестнула волна «AI-мусора»: на Amazon уже находят книги, в тексте которых авторы-халтурщики случайно оставили промпты вроде «перепиши этот фрагмент в стиле [известного писателя]». Технология, обученная на трудах Скотта Туроу и тысяч других авторов, теперь используется для того, чтобы вытеснить их с рынка.

Руководители издательств подчеркивают, что они не выступают против технологий как таковых.

Требования истцов выходят далеко за рамки обычных штрафов. Помимо многомиллиардных компенсаций, издатели требуют судебного запрета на использование их материалов, финансового возмещения ущерба, уничтожения всех копий данных и моделей, которые были созданы с нарушением закона.

Если суд удовлетворит эти требования, это может создать серьезные ограничения для разработки ИИ-моделей.

И если суд встанет на сторону издателей, эпоха «свободного» обучения ИИ на любых доступных данных в Америке может подойти к концу.

Надеюсь, вся эта история будет учтена при разработке российского закона об ИИ.

#закон #ИИ #скандал