Новейшая модель GPT-5.2 от OpenAI начала использовать в качестве источника спорную «Грокипедию» Илона Маска, что вызывает опасения о «мёртвом интернете». Анализ показывает, что контент, созданный ИИ без контроля человека, проникает в ответы чат-ботов, даже по малоизвестным темам, рискуя вызвать коллапс качества моделей.
Спорная «Грокипедия» Илона Маска начала просачиваться в ответы ChatGPT и других чат-ботов в качестве цитируемого источника, давая нам представление о «мёртвом интернете», который маячит на горизонте.
Как сообщает The Guardian, последняя флагманская модель OpenAI, GPT-5.2, девять раз цитировала «Грокипедию» в ответ на более чем дюжину вопросов. Эти вопросы охватывали темы от политического устройства Ирана до британского историка сэра Ричарда Эванса. Gizmodo также удалось получить ответы от ChatGPT, которые ссылались на «Грокипедию» при аналогичных запросах.
Маск запустил «Грокипедию» в прошлом октябре как альтернативу Википедии, в которой люди исключены из цикла редактирования. В сентябрьском посте Маск заявил, что «Грокипедия» станет «масштабным улучшением по сравнению с Википедией». Он также неоднократно высмеивал Википедию как «Wokipedia» и жаловался на отсутствие крупной альтернативы, соответствующей правым взглядам.
Его решением стало создание новой платформы со статьями, сгенерированными ИИ. Большая часть контента «Грокипедии» выглядит адаптированной из Википедии, но с подачей, которая часто благоприятствует политическим взглядам Маска.
Например, «Грокипедия» описывает события 6 января 2021 года как «беспорядки» в Капитолии США, где «сторонники уходящего президента Дональда Трампа протестовали против сертификации результатов президентских выборов 2020 года». Википедия, напротив, называет это «нападением», совершённым толпой сторонников Трампа в том, что она описывает как попытку само-госпереворота.
Кроме того, «Грокипедия» характеризует Britain First как «британскую ультраправую политическую партию, выступающую за национальный суверенитет», в то время как Википедия описывает её как неофашистскую политическую партию и группу ненависти.
«Грокипедия» также смягчает формулировки в отношении так называемой теории «Великого замещения», которая утверждает, что белые люди систематически замещаются в результате согласованных усилий по размножению, поддерживаемых другими расами. Википедия прямо маркирует эту идею как теорию заговора. Маск является открытым сторонником этой теории заговора и регулярно комментирует «белый геноцид».
В целом, «Грокипедия» разработана для промышленного тиражирования непроверенной информации без участия людей, обсуждающих качество предоставляемых данных.
Теперь «Грокипедия», по-видимому, коварно просачивается в другие чат-боты. The Guardian отметил, что ChatGPT не цитировал «Грокипедию», когда его спрашивали о темах, по которым сайт был известен распространением вводящей в заблуждение информации. Вместо этого «Грокипедия» появлялась только в ответах на более малоизвестные темы.
Проблема, по-видимому, не ограничивается ChatGPT. Некоторые пользователи в социальных сетях сообщили, что Claude от Anthropic также ссылался на «Грокипедию» в своих ответах.
OpenAI и Anthropic, компания, стоящая за Claude, не сразу ответили на запросы Gizmodo о комментариях. Однако OpenAI заявила The Guardian, что их модель «стремится опираться на широкий спектр общедоступных источников и точек зрения».
«Мы применяем фильтры безопасности для снижения риска появления ссылок, связанных с серьёзным вредом, и ChatGPT чётко показывает, какие источники повлияли на ответ, с помощью цитат», — сообщил представитель OpenAI изданию The Guardian.
Ранее исследователи предупреждали о злонамеренных действиях, которые приводят к наводнению интернета контентом, сгенерированным ИИ, с целью влияния на большие языковые модели в процессе, который иногда называют «грумингом» LLM (обучением моделей). Но риски выходят за рамки преднамеренных кампаний по дезинформации.
Не совсем ясно, активно ли пользователи намеренно посещают «Грокипедию». Через несколько недель после запуска сайта в прошлом году агрегатор данных Similarweb сообщил, что трафик «Грокипедии» упал с пикового значения в 460 000 посещений веб-сайта в США 28 октября до примерно 30 000 ежедневных посетителей. Википедия регулярно набирает сотни миллионов просмотров страниц в день. Многие предполагают, что «Грокипедия» на самом деле и не предназначена для людей; она существует, чтобы «отравить колодец» для будущих LLM.
Чрезмерная зависимость от контента, сгенерированного ИИ, также может привести к тому, что исследователи называют «коллапсом модели». В исследовании 2024 года было установлено, что когда большие языковые модели всё чаще обучаются на данных, произведённых другими системами ИИ, их общее качество со временем деградирует.
«На ранней стадии коллапса модели сначала теряют вариативность, теряя производительность на миноритарных данных», — сказал в то время исследователь Илья Шумайлов Gizmodo. «На поздней стадии коллапса модели полностью разрушаются». По мере того как модели продолжают обучение на менее точных и менее релевантных текстах, сгенерированных ими самими, эта петля вызывает деградацию результатов и, в конечном итоге, полную потерю смысла.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Bruce Gil