Добавить в корзинуПозвонить
Найти в Дзене

Как ИИ-компании скупали и пиратили миллионы книг

Как вы знаете идет множество судов в США над компаниями, которые создали ИИ. Что выяснилось. В начале 2024 года Anthropic запустила внутри компании проект с кодовым названием «Panama». Схема простая: купить книги оптом, срезать корешки, отсканировать страницы, бумагу — в переработку. Бюджет — десятки миллионов долларов. Подробности всплыли из четырёх тысяч страниц судебных документов по иску писателей против компании стоимостью $183 млрд. Но ещё до Panama сооснователь Anthropic Бен Манн лично скачивал книги с пиратской библиотеки LibGen. Потом рассылал коллегам ссылку на новый пиратский сайт с пометкой «как нельзя кстати!!!». Anthropic настаивает: коммерческие модели на пиратских данных не обучались. Meta шла тем же путём. Внутренняя переписка фиксирует, как сотрудники качали миллионы книг через торренты — и сами понимали, что делают что-то не то. Один инженер написал прямо: «Скачивать торренты со служебного ноутбука как-то неправильно». Следы заметали через арендованные серверы Ama

Как ИИ-компании скупали и пиратили миллионы книг

Как вы знаете идет множество судов в США над компаниями, которые создали ИИ. Что выяснилось.

В начале 2024 года Anthropic запустила внутри компании проект с кодовым названием «Panama». Схема простая: купить книги оптом, срезать корешки, отсканировать страницы, бумагу — в переработку. Бюджет — десятки миллионов долларов. Подробности всплыли из четырёх тысяч страниц судебных документов по иску писателей против компании стоимостью $183 млрд.

Но ещё до Panama сооснователь Anthropic Бен Манн лично скачивал книги с пиратской библиотеки LibGen. Потом рассылал коллегам ссылку на новый пиратский сайт с пометкой «как нельзя кстати!!!». Anthropic настаивает: коммерческие модели на пиратских данных не обучались.

Meta шла тем же путём. Внутренняя переписка фиксирует, как сотрудники качали миллионы книг через торренты — и сами понимали, что делают что-то не то. Один инженер написал прямо: «Скачивать торренты со служебного ноутбука как-то неправильно». Следы заметали через арендованные серверы Amazon. По документам, операцию лично санкционировал Цукерберг.

OpenAI факт скачивания LibGen признала. Говорит, что удалила файлы до релиза ChatGPT.

В августе Anthropic согласилась выплатить $1,5 млрд по мировому соглашению — без признания вины. Авторам, чьи книги попали в пиратские базы, положено около $3 000 за произведение. Суд при этом постановил: обучение ИИ на книгах само по себе законно — это «трансформативное использование».

Промышленное пиратство теперь называется цифровой трансформацией.

Как думаете, в России также обучают модели?

#ИИ #Кибербезопасность