Найти в Дзене
Мир в Йоттабайтах

Парадокс ИИ— Почему нейросети скоро перестанут быть умными

Сегодня мы живем в эйфории. ChatGPT пишет дипломы, Midjourney рисует шедевры за секунды. Кажется, что искусственный интеллект будет умнеть бесконечно, пока не станет гениальнее Эйнштейна. ​Но ученые из Оксфорда и Кембриджа бьют тревогу. Они предсказывают обратный процесс: ИИ стоит на пороге деградации. Причина кроется в старом принципе программистов: «Garbage In, Garbage Out» (Мусор на входе — мусор на выходе). И этот мусор нейросети начинают создавать сами для себя. ​1. Как учился «Гений» (Эпоха чистого интернета) ​Чтобы понять проблему, нужно вспомнить, как создавали GPT-4. Его «кормили» данными всего Интернета, созданного людьми за последние 30 лет. Это были книги Достоевского, статьи из Википедии, живые споры на Reddit, научные диссертации. ​Человеческие данные полны нюансов, эмоций, сленга, логических скачков и неожиданных метафор. ​Именно на этом человеческом разнообразии ИИ научился быть таким «умным» и похожим на нас. ​2. Замкнутый круг: Уроборос кусает хвост ​Но что происходи
Оглавление

Сегодня мы живем в эйфории. ChatGPT пишет дипломы, Midjourney рисует шедевры за секунды. Кажется, что искусственный интеллект будет умнеть бесконечно, пока не станет гениальнее Эйнштейна.

​Но ученые из Оксфорда и Кембриджа бьют тревогу. Они предсказывают обратный процесс: ИИ стоит на пороге деградации.

Причина кроется в старом принципе программистов: «Garbage In, Garbage Out» (Мусор на входе — мусор на выходе). И этот мусор нейросети начинают создавать сами для себя.

​1. Как учился «Гений» (Эпоха чистого интернета)

​Чтобы понять проблему, нужно вспомнить, как создавали GPT-4.

Его «кормили» данными всего Интернета, созданного людьми за последние 30 лет. Это были книги Достоевского, статьи из Википедии, живые споры на Reddit, научные диссертации.

  • ​Человеческие данные полны нюансов, эмоций, сленга, логических скачков и неожиданных метафор.
  • ​Именно на этом человеческом разнообразии ИИ научился быть таким «умным» и похожим на нас.

​2. Замкнутый круг: Уроборос кусает хвост

​Но что происходит сейчас? По прогнозам Europol, к 2026 году до 90% контента в интернете будет создано искусственным интеллектом.

Интернет наводняется статьями, написанными ChatGPT, и картинками от Midjourney.

​И вот тут начинается катастрофа.

Следующее поколение нейросетей (GPT-5, GPT-6) будет обучаться уже не на текстах людей, а на текстах, написанных GPT-4. ИИ начинает учиться у ИИ.

​Это похоже на цифровое кровосмешение (инбридинг). Когда нейросеть учится на синтетических данных, она теряет связь с реальностью.

​3. Эффект «Ксерокопии ксерокопии»

​Исследователи называют этот феномен Model Collapse (Коллапс модели).

Представьте, что вы взяли фотографию и сделали с неё ксерокопию. Потом сделали ксерокопию с этой ксерокопии. И так 100 раз.

Что будет на 100-м листе? Мутное черное пятно. Детали исчезнут, контраст пропадет.

​То же самое происходит с «мозгами» нейросети:

  1. ​Усреднение. ИИ стремится к «среднему» ответу. Обучаясь на своих же текстах, он отбрасывает редкие, уникальные, гениальные идеи, оставляя только серую массу штампов.
  2. ​Галлюцинации в квадрате. Если первая модель допустила маленькую ошибку (выдумала факт), вторая модель, обучаясь на этом, воспримет ошибку как истину и усилит её. Третья модель возведет это в абсолют. Реальность исказится до неузнаваемости.

​4. «Коровье бешенство» для ИИ

​Ученые используют еще одну мрачную метафору. В свое время эпидемия «коровьего бешенства» началась, когда фермеры стали кормить коров переработанными останками других коров.

С ИИ происходит то же самое. Скармливание ИИ контента, созданного ИИ, отравляет модель. Она начинает «сходить с ума», терять логику и выдавать бред.

​5. Что ждет нас в будущем?

​Мы можем столкнуться с парадоксом:

  • ​Интернета станет больше, но он станет «пластиковым» и бесполезным.
  • ​Цена на «Органические данные» взлетит. Тексты, написанные реальными людьми, книги и «живые» фото станут самым дорогим ресурсом для обучения. Компании будут платить миллионы, чтобы получить доступ к архивам, куда не ступала нога нейросети.

Вывод: Если человечество перестанет творить само и полностью доверится генераторам, мы не получим Сверхразум. Мы получим цифрового попугая, который бесконечно повторяет сам себя, пока не забудет смысл слов.