1839 подписчиков

ChatGPT начал индексировать ИИ-мусор из Grok

26 января26 янв

3 мин

Всё больше интернета заполняется контентом, сгенерированным LLM, что создаёт проблему «самопоедания» ИИ. Выяснилось, что ChatGPT от OpenAI начал индексировать Grokipedia, спорную энциклопедию от xAI, что привело к распространению дезинформации и конспирологических теорий в ответах популярной модели. Всё больше веб-пространства заполняется текстом, изображениями и даже видео и музыкой, сгенерированными большими языковыми моделями (LLM). Это более серьёзная проблема, чем кажется, поскольку системы «ИИ», которые сканировали интернет для обучения своих LLM, теперь повторно индексируют весь этот контент. Это настоящий укус собственного хвоста из «ИИ-мусора»… и вот теперь ChatGPT — который по большинству показателей является самой популярной LLM — индексирует Grokipedia. Grokipedia — это энциклопедия, созданная ИИ, которую в прошлом году разработала xAI, аффилированная компания социальной сети Илона Маска. Она почти полностью генерируется автоматически с помощью LLM Grok, которая также интег

Всё больше веб-пространства заполняется текстом, изображениями и даже видео и музыкой, сгенерированными большими языковыми моделями (LLM). Это более серьёзная проблема, чем кажется, поскольку системы «ИИ», которые сканировали интернет для обучения своих LLM, теперь повторно индексируют весь этот контент. Это настоящий укус собственного хвоста из «ИИ-мусора»… и вот теперь ChatGPT — который по большинству показателей является самой популярной LLM — индексирует Grokipedia.

Grokipedia — это энциклопедия, созданная ИИ, которую в прошлом году разработала xAI, аффилированная компания социальной сети Илона Маска. Она почти полностью генерируется автоматически с помощью LLM Grok, которая также интегрирована в социальную сеть. Grokipedia позиционируется как консервативная альтернатива Википедии, которую Маск считает «прогрессивной» и «пропагандистской».

Grokipedia изобилует фактическими неточностями и «галлюцинациями» ИИ — причём, по-видимому, в большей степени, чем даже обычные системы LLM, — поскольку сам Grok был намеренно настроен соответствовать диктату Маска. Было замечено, что система продвигает теории заговора и другой контент, который варьируется от откровенно бредового до откровенно вредоносного.

Теперь выясняется, что ChatGPT от OpenAI индексирует Grokipedia для ответа как минимум на часть запросов пользователей. Согласно расследованию The Guardian, ChatGPT 5.2 выборочно определяет, когда предоставлять информацию, полученную из Grokipedia — он не выдаст немедленных ответов, сгенерированных Grok, по наиболее известным и задокументированным ложным утверждениям этой страницы, таким как дезинформация о ВИЧ и СПИДе. Однако, когда пользователи побуждали ChatGPT углубиться в детали споров вокруг иранского правительства или отрицателя Холокоста Дэвида Ирвинга, система действительно выдавала информацию, почерпнутую из страниц, сгенерированных Grok.

Массивный объём текста, выдаваемого LLM — по оценкам, более половины всех новых опубликованных статей по состоянию на конец 2025 года — становится проблемой. Ошибки («галлюцинации») ИИ могут распространяться, реплицироваться и повторяться, по сути, замещая устоявшиеся знания «ошибкой копирования». Фундаментально итеративный характер больших языковых моделей также может быть использован как оружие. Было замечено, что Gemini AI от Google повторяет официальную позицию Коммунистической партии Китая относительно нарушений прав человека в стране (или, по версии Gemini, их отсутствия), а некоторые исследователи безопасности полагают, что Россия целенаправленно распространяет пропагандистский текст, сгенерированный LLM, с целью его интеграции в другие большие языковые модели.

Сам Grok был замечен в повторении откровенно враждебного контента, при этом чат-бот называл себя «МехаГитлером». Кроме того, он сгенерировал в виде ИИ миллионы сексуализированных изображений несовершеннолетних с помощью инструментов, доступных в X начиная с декабря 2025 года. Инструмент был отключён для бесплатных пользователей в начале января и ограничен в X, чтобы запретить его применение к реальным людям в откровенной одежде. Страны по всему миру начали расследования в отношении Grok/X после этого инцидента, ссылаясь на возможные нарушения различных законов. Индонезия и Малайзия полностью заблокировали доступ к Grok.

Точная причина, по которой OpenAI решила интегрировать контент Grok в ChatGPT — не только искать автоматически сгенерированный текст, но и обучать собственные системы на продукте конкурента — неясна. Возможно, это просто связано с постоянно ненасытной природой больших языковых моделей, которые зависят от новых входных данных для итеративной адаптации и изменений, что означает, что OpenAI не может быть избирательной в своём обучении.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Michael Crider

Оригинал статьи