6698 подписчиков

Как нейросети и искуственный интеллект уничтожают наш язык

31 августа 202431 авг 2024

3 мин

Оглавление

Как работает нейросеть
Почему учеба нейросетей на других нейросетях приводит к деградированию?
Но мы же люди, можем распознавать ошибки.

Нейросети потихоньку все плотнее и плотнее входят в нашу жизнь. С их помощью можно генерировать текст, музыку, картинки, видео. И чем больше нейросети развиваются, тем сложнее отличить их работу от работы людей. Я уверен, что на нашем любимом дзене уже огромное количество статей, которые были полностью или частично написаны искусственным интеллектом.

Однако, повсеместно использование нейросетей может привести к печальным последствиям, а конкретно, к обеднению и ухудшению качества языка во всех аспектах: в лексике, в грамматике, в правописании и так далее. Таким образом, можно сказать, что искусственный интеллект является угрозой для нашего языка. Да и не только для нашего, а для всех, которыми пользуются нейросети. Каким образом? Давайте разберемся.

Как работает нейросеть

Чтобы понять, как нейросеть угрожает языку, я постараюсь вкратце объяснить, как работает искусственный интеллект.

Естественно, нейросеть сама ничего не придумывает. Она лишь переваривает огромное количество информации, которую ей скормили и выдает похожий результат. Чем больше ты даешь нейросети информации, тем более разнообразный получается результат на выходе.

Но чем "кормят" всевозможные ChatGPT и прочие нейросети? Самой простой и доступной информацией - контентом из интернета. И изначально в этом не было проблемы. Но в современном мире все больше и больше текстового контента в интернете - это контент сгенерированный нейросетями. И в какой-то момент в интернете почти не останется контента, написанного людьми. Да и фильтровать нейросетевой контент от людского крайне сложно. И в этом и кроится главная проблема: если текстовые нейросети начнут учиться на результатах других текстовых нейросетей, то язык начнет потихоньку деградировать.

Почему учеба нейросетей на других нейросетях приводит к деградированию?

Это очень хорошо показывает статья в The New York Times. Авторы статьи обучили нейросеть рукописному вводу цифр. Но каждый результат генерации они загружали обратно в нейросеть для дальнейшего обучения. Что из этого получилось, можно посмотреть в карусели ниже

С каждой последующей генерацией результат становится все хуже и хуже, пока в конечном итоге не становится рандомным мессивом.

Почему так происходит? На то есть две причины:

Нейросеть не понимает, что она пишет/рисует, она лишь использует распознанные паттерны. И чем чаще паттерн встречается, тем чаще она его повторяет
Нейросеть совершает ошибки. И она не способна сама понять, что она совершила ошибку, распознать и устранить ее.

Вот и получается, что ошибки накапливаются, а частые паттерны становятся все чаще. Но это все про картинки, а что будет происходить с текстами?

А с текстом будет происходить все то же самое. А конкретно:

Будет уменьшаться словарный запас и грамматическое разнообразие. Нейросети используют самые частые паттерны в языке: часто используемые слова и выражения, простые грамматические конструкции. А значит со временем сложные слова и выражения из сгенерированных нейросетями текстов будут исчезать.

Ошибки будут накапливаться. Нейросети могут совершать ошибки в языке. И обучаясь на ошибках других нейросетей, эти ошибки будут накапливаться и накапливаться, пока не станут "нейросетевой нормой". Причем ошибки в первую очередь не грамматические, а смысловые.

Но мы же люди, можем распознавать ошибки.

Проблема в том, что человек - это тоже своего рода нейросеть. И учится он так же на контенте, который он потребляет. Но чем дальше мы идем, тем больше мы читаем контент в интернете, и тем больше в интернете контента, сгенерированного нейросетями. А значит деградация "нейросетевого" языка рано или поздно приведет и к деградации "человеческого".

Именно поэтому важно продолжать писать контент в интернет своими руками и своим мозгом, так как это сохраняет разнообразие нашего языка со всеми нашими сложными конструкциями и огромным лексиконом. Даже, если мы пишем сами с ошибками, человеческие ошибки разнообразны и не создадут паттерн ни для нейросетей, ни для других людей.

А что вы думаете по поводу сгенерированного искусственным интеллектом контента? Напишите свое мнение в комментариях.

Если вам было интересно и познавательно - поставьте лайк. Для вас это один клик, а мне очень приятно. И не забывайте подписываться на канал.

Спасибо за прочтение!

С уважением,
SonoRusso