Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

Иск к Adobe: использование пиратских книг для обучения ИИ

Элизабет Лайон и другие авторы подали иск против Adobe, утверждая, что компания использовала пиратские копии их книг для обучения системы искусственного интеллекта SlimLM. Adobe, как и многие технологические компании, активно внедряет ИИ. С 2023 года компания представила инструменты на базе ИИ, включая пакет Firefly. SlimLM описывается как набор небольших языковых моделей, предназначенных для оптимизации работы с документами на мобильных устройствах. Компания сообщает, что обучение SlimLM проходило на SlimPajama-627B — открытом наборе данных, выпущенном Cerebras в июне 2023 года. Элизабет Лайон утверждает, что ее произведения были включены в этот датасет. Согласно коллективному иску, SlimPajama основан на копировании и модификации датасета RedPajama (включая Books3), что привело к включению в него произведений, защищенных авторским правом, в том числе и работ истца. Books3, состоящий из 191 тысячи книг, является источником юридических проблем для индустрии ИИ. RedPajama также был предм

Элизабет Лайон и другие авторы подали иск против Adobe, утверждая, что компания использовала пиратские копии их книг для обучения системы искусственного интеллекта SlimLM.

Adobe, как и многие технологические компании, активно внедряет ИИ. С 2023 года компания представила инструменты на базе ИИ, включая пакет Firefly.

SlimLM описывается как набор небольших языковых моделей, предназначенных для оптимизации работы с документами на мобильных устройствах. Компания сообщает, что обучение SlimLM проходило на SlimPajama-627B — открытом наборе данных, выпущенном Cerebras в июне 2023 года.

Элизабет Лайон утверждает, что ее произведения были включены в этот датасет.

Согласно коллективному иску, SlimPajama основан на копировании и модификации датасета RedPajama (включая Books3), что привело к включению в него произведений, защищенных авторским правом, в том числе и работ истца.

Books3, состоящий из 191 тысячи книг, является источником юридических проблем для индустрии ИИ. RedPajama также был предметом судебных разбирательств. Apple и Salesforce ранее обвинялись в использовании этого датасета для обучения своих ИИ-систем без должного учета авторских прав.

Anthropic ранее согласилась на выплату авторам 1,5 миллиарда долларов в связи с использованием пиратских книг для обучения Claude. Летом этого года стало известно, что Anthropic закупала и сканировала миллионы книг, а затем уничтожала их для обучения своих ИИ-моделей. Что, безусловно, очень экологично и полезно для литературы.