The Atlantic рассказывает, как Кремниевая долина наступает на СМИ:
"Сразу после выпуска продуктов генеративного ИИ технологическими компаниями некоторые критики высказались о скором коллапсе СМИ. Каждый кусочек текста, изображения или видео стал подозрительным. Но для издателей новостей и журналистов на горизонте замаячила еще большая катастрофа.
Чат-боты доказали свою способность поддерживать разговор с пользователем. Они способны ответить на любой вопрос, часто при этом резюмируя новостные издательские статьи. Внезапно все меньше людей стали выходить за пределы сайтов генеративного ИИ — прогресс, который представляет экзистенциальную угрозу для СМИ и для средств к существованию журналистов во всем мире.
Согласно одному всеобъемлющему исследованию обзоры ИИ от Google — функция, которая суммирует веб-страницы по обычным результатам поиска сайта — уже сократили трафик на внешние сайты более чем на 34%. Генеральный директор издательства "DotDash Meredith", которое издает "People", "Better Homes & Gardens" и "Food & Wine", недавно заявил, что компания готовится к возможному сценарию «Google Zero». Некоторые предполагают, что падение трафика из-за чат-ботов стало одной из причин недавних увольнений в таких изданиях, как "Business Insider" и "Daily Dot". «Business Insider был создан для Интернета, которого больше нет», — недавно сказал один бывший его сотрудник репортеру Оливеру Дарси.
Не все издатели подвержены одинаковому риску: те, кто в первую очередь полагается на читателей с общими интересами, которые приходят из поисковых систем и социальных сетей, могут оказаться в худшем положении по сравнению со специализированными издателями с преданными подписчиками. Тем не менее, никто полностью не застрахован. Согласно исследованию вышедший в мае 2024 г. AI Overviews присоединяется к ChatGPT, Claude, Grok, Perplexity и другим продуктам на базе ИИ, которые в совокупности заменили поиск для более чем 25% американцев. Как показал мой предыдущий отчет, компании обучают чат-ботов на огромных объемахукраденных книг и статей и собирают новостные статьи для генерации ответов с актуальной информацией. Большие языковые модели обучаются на обширных материалах в открытом доступе, но многое из того, что нужно таким моделям, особенно для пользователей, которые ищут информацию в реальном времени, — это новости, которые доступны за плату. Издатели создают ценность, но компании ИИ перехватывают их аудиторию, абонентскую плату и доходы от рекламы.
Я задал вопрос по этому поводу компаниям Anthropic, xAI, Perplexity, Google и OpenAI. Anthropic и xAI не ответили. В Perplexity напрямую не прокомментировали проблему. Google утверждает, что отправляет «более качественный» трафик на веб-сайты издателей, в результате чего пользователи якобы проводят больше времени на сайтах после перехода по ссылке, но он отказался предоставить какие-либо данные в поддержку этого заявления. OpenAI направил меня к статье, показывающей, что ChatGPT отправляет больше трафика на веб-сайты в целом, чем раньше, но необработанные цифры довольно скромны. Например, BBC, как сообщается, получила 118 000 посещений с ChatGPT в апреле, но это практически ничто по сравнению с сотнями миллионов посетителей, которых она получает каждый месяц. Статья также показывает, что трафик с ChatGPT на самом деле снизился для некоторых издателей.
За последнее время я пообщался с несколькими издателями новостей, и все они видят в ИИ угрозу своему бизнесу. Rich Caccappolo, заместитель председателя по медиа в компании, издающей Daily Mail — газету с крупнейшим тиражом в Великобритании, — сказал, что все издатели «видят, что Overviews собираются разрушить трафик, который они получают из поиска, подрывая ключевой фундаментальный столп модели цифровых доходов». Компании ИИ заявляли, что чат-боты продолжат отправлять читателей к издателям новостей, но не привели доказательств в поддержку этого заявления. Я спросил Каккапполо, считает ли он, что ответы, сгенерированные ИИ, могут вывести его компанию из бизнеса. «Это именно тот самый страх, — сказал он мне. — И я обеспокоен тем, что это произойдет не через 3 или 5 лет — я шучу, что это произойдет в следующий вторник».
Издатели книг, в особенности научно-популярных и учебников, также сообщили мне, что ожидают значительное снижение продаж, поскольку чат-боты могут как резюмировать их книги, так и давать подробные комментарии по их содержанию. Издатели пытались сопротивляться, но исходя из результатов моего общения, все складывается против них. Мир быстро меняется и, возможно, необратимо. Институты, составляющие свободную прессу нашей страны, борются за свое выживание.
***
Издатели реагируют двумя способами. Во-первых: судебные иски. По меньшей мере 12 исков с участием более 20 издателей были поданы против компаний, занимающихся ИИ. Их исход далеко не определен, и дела могут быть рассмотрены только после того, как будет нанесен непоправимый ущерб.
Второй способ — заключать сделки с компаниями ИИ, позволяя их продуктам обобщать статьи или обучаться на редакционном контенте. Некоторые издатели, такие как The Atlantic, придерживаются обеих стратегий (компания имеет корпоративное партнерство с OpenAI и подает в суд на Cohere). За последние 2 года между издателями и компаниями ИИ было заключено не менее 72 лицензионных соглашений. Но понять, как подойти к таким сделкам, — непростая задача. Каккапполо сказал мне, что он «почувствовал огромный дисбаланс за столом переговоров» — мнение, разделяемое и другими, с кем я общался. Одна из проблем заключается в том, что не существует стандартной цены за обучение LLM по книге или статье. Компании ИИ знают, какой контент им нужен, и, уже продемонстрировав способность и готовность брать его бесплатно, они обладают исключительным рычагом, когда дело доходит до переговоров. Я узнал, что книги иногда лицензировались всего за пару сотен долларов за штуку, и что издателю, который просит слишком много, могут отказать, только для того, чтобы технологические компании все равно взяли этот материал.
Другая проблема заключается в том, что разный контент, по-видимому, имеет разную ценность для разных LLM. Цифровая медиакомпания Ziff Davis изучила наборы данных для обучения ИИ на основе веб-технологий и обнаружила, что контент из «авторитетных» источников, таких как крупные газеты и журналы, кажется компаниям ИИ более желанным, чем блоги и публикации в социальных сетях. (Ziff Davis подает в суд на OpenAI за обучение по ее статьям без уплаты лицензионного сбора). Исследователи из Microsoft также публично писали о «важности высококачественных данных» и предположили, что контент в стиле учебника может быть особенно желанным.
Но, за исключением нескольких конкретных исследований, подобных этим, мало что известно о том, какой контент больше всего обогащает LLM, что оставляет много вопросов без ответов. Биографии более или менее важны по сравнению с историями? Имеет ли значение высококачественная художественная литература? Стоят ли чего-нибудь старые книги? Amy Brand, директор и издатель MIT Press, сказала мне, что «решение, которое поможет определить справедливую стоимость конкретного контента, созданного человеком, на активном рынке данных обучения LLM, было бы чрезвычайно полезным».
Телеграм-канал "Интриги книги"
The Atlantic рассказывает, как Кремниевая долина наступает на СМИ:
"Сразу после выпуска продуктов генеративного ИИ технологическими компаниями некоторые критики высказались о скором коллапсе СМИ. Каждый кусочек текста, изображения или видео стал подозрительным. Но для издателей новостей и журналистов на горизонте замаячила еще большая катастрофа.
Чат-боты доказали свою способность поддерживать разговор с пользователем. Они способны ответить на любой вопрос, часто при этом резюмируя новостные издательские статьи. Внезапно все меньше людей стали выходить за пределы сайтов генеративного ИИ — прогресс, который представляет экзистенциальную угрозу для СМИ и для средств к существованию журналистов во всем мире.
Согласно одному всеобъемлющему исследованию обзоры ИИ от Google — функция, которая суммирует веб-страницы по обычным результатам поиска сайта — уже сократили трафик на внешние сайты более чем на 34%. Генеральный директор издательства "DotDash Meredith", которое издает "People", "Bet