Найти в Дзене
DigEd

«Генеративный инбридинг» и его риск для человеческой культуры

Автор Луи Розенберг Инбридинг относится к геномному повреждению, когда члены популяции размножаются с другими членами, которые слишком генетически схожи. Это часто приводит к появлению у потомства серьезных проблем со здоровьем и других уродств, поскольку усиливается экспрессия рецессивных генов. Когда инбридинг широко распространен – как это может быть в современном животноводстве – весь генофонд может со временем деградировать, усиливая деформации, поскольку популяция становится все менее и менее разнообразной. В мире генеративного ИИ существует аналогичная проблема, потенциально угрожающая долгосрочной эффективности систем ИИ и разнообразию человеческой культуры. С точки зрения эволюции, Большие языковые модели (LLM) первого поколения и другие системы искусственного интеллекта первого поколения были обучены на относительно чистом «генофонде» человеческих артефактов с использованием огромного количества текстового, визуального и аудиоконтента, чтобы представить суть наших культурных
Оглавление
Изображение создано Луи Розенбергом через Midjourney
Изображение создано Луи Розенбергом через Midjourney

Автор Луи Розенберг

Инбридинг относится к геномному повреждению, когда члены популяции размножаются с другими членами, которые слишком генетически схожи. Это часто приводит к появлению у потомства серьезных проблем со здоровьем и других уродств, поскольку усиливается экспрессия рецессивных генов. Когда инбридинг широко распространен – как это может быть в современном животноводстве – весь генофонд может со временем деградировать, усиливая деформации, поскольку популяция становится все менее и менее разнообразной.

В мире генеративного ИИ существует аналогичная проблема, потенциально угрожающая долгосрочной эффективности систем ИИ и разнообразию человеческой культуры. С точки зрения эволюции, Большие языковые модели (LLM) первого поколения и другие системы искусственного интеллекта первого поколения были обучены на относительно чистом «генофонде» человеческих артефактов с использованием огромного количества текстового, визуального и аудиоконтента, чтобы представить суть наших культурных чувств.

Но поскольку Интернет наводнен артефактами, созданными ИИ, существует значительный риск того, что новые системы ИИ будут обучаться на наборах данных, которые включают большое количество контента, созданного ИИ. Этот контент не является прямой человеческой культурой, а имитирует человеческую культуру с различными уровнями искажений, тем самым развращая «генофонд» посредством инбридинга. И по мере увеличения использования систем искусственного интеллекта поколения эта проблема только усугубится. В конце концов, новые системы ИИ, обученные на копиях человеческой культуры, наполнят мир всё более искажёнными артефактами, в результате чего системы ИИ следующего поколения будут обучаться на копиях копий человеческой культуры и так далее.

Деградация систем искусственного интеллекта, искажение человеческой культуры

Я называю эту возникающую проблему «генеративным инбридингом» и беспокоюсь о двух тревожных последствиях. Во-первых, существует потенциальная деградация систем искусственного интеллекта, поскольку инбридинг снижает их способность точно представлять человеческий язык, культуру и артефакты. Во-вторых, существует искажение человеческой культуры врожденными системами искусственного интеллекта, которые все чаще вносят «уродства» в наш культурный генофонд, которые на самом деле не отражают наши коллективные чувства.

Что касается первого вопроса, недавние исследования показывают, что генеративный инбридинг может сломать системы искусственного интеллекта, заставляя их с течением времени производить все худшие и худшие артефакты, например, фотокопию фотокопии фотокопии. Иногда это называют «коллапсом модели» из-за «отравления данных», и недавние исследования показывают, что базовые модели гораздо более подвержены этой рекурсивной опасности, чем считалось ранее. Другое недавнее исследование показало, что по мере увеличения объема данных, генерируемых ИИ, в обучающем наборе, генеративные модели становятся все более «обреченными» на постепенное снижение их качества.

Что касается второй проблемы — искажения человеческой культуры — генеративный инбридинг может привести к все большим «уродствам» в наших коллективных артефактах до тех пор, пока наша культура не будет подвергаться большему влиянию систем искусственного интеллекта, чем людей-творцов. А поскольку недавнее решение федерального суда США установило, что контент, созданный ИИ, не может быть защищен авторским правом, оно открывает путь к более широкому использованию, копированию и распространению артефактов ИИ, чем человеческий контент с юридическими ограничениями.

Это может означать, что художники, писатели, композиторы, фотографы и видеооператоры, поскольку их работы защищены авторским правом, вскоре смогут оказывать меньшее влияние на направление нашей коллективной культуры, чем контент, создаваемый ИИ.

Отличие ИИ-контента от человеческого контента

Одним из потенциальных решений инбридинга является использование систем искусственного интеллекта, предназначенных для того, чтобы отличать генеративный контент от человеческого контента. Многие исследователи думали, что это будет простое решение, но оно оказалось гораздо сложнее, чем казалось.

Например, в начале этого года OpenAI анонсировала «классификатор ИИ», который был разработан для того, чтобы отличать текст, созданный ИИ, от человеческого текста. Это должно было помочь отличить поддельные документы или, в случае с учебными заведениями, выявить обман учащихся. Ту же технологию можно использовать для фильтрации контента, созданного ИИ, из наборов обучающих данных, предотвращая инбридинг.

Однако к июлю 2023 года OpenAI объявила, что их классификатор ИИ больше не доступен из-за его низкой точности, заявив, что в настоящее время «невозможно надежно обнаружить весь текст, написанный ИИ».

-2

Генеративные артефакты с водяными знаками

Еще одним потенциальным решением для компаний, занимающихся искусственным интеллектом, является встраивание данных «водяных знаков» во все генеративные артефакты, которые они производят. Это было бы полезно для многих целей: от помощи в выявлении поддельных документов и дезинформации до предотвращения мошенничества со стороны студентов.

К сожалению, водяные знаки, скорее всего, будут в лучшем случае умеренно эффективными, особенно в текстовых документах, которые можно легко редактировать, устраняя водяные знаки, но сохраняя проблемы инбридинга.

-3

Тем не менее, Белый дом настаивает на решениях по созданию водяных знаков, объявив в прошлом месяце, что семь крупнейших компаний в области ИИ, производящих базовые модели, согласились «разработать надежные технические механизмы, гарантирующие, что пользователи будут знать, когда контент создается ИИ, например, водяные знаки».

Еще неизвестно, смогут ли компании технически достичь этой цели и будут ли они внедрять решения таким образом, чтобы уменьшить инбридинг.

Нам нужно смотреть вперед, а не назад

Даже если мы решим проблему инбридинга, я боюсь, что широкое распространение искусственного интеллекта может удушить человеческую культуру. Это связано с тем, что системы искусственного интеллекта поколения специально обучены подражать стилю и содержанию прошлого, что вносит сильный уклон в прошлое.

-4

Я знаю, что есть те, кто утверждает, что люди-художники также находятся под влиянием предыдущих работ, но люди-творцы привносят в этот процесс свои чувства и опыт, вдумчиво создавая новые культурные направления. Современные системы искусственного интеллекта не привносят личного вдохновения в то, что они производят.

И, в сочетании с искажающими эффектами генеративного инбридинга, мы можем столкнуться с будущим, в котором наша культура будет задыхаться невидимой силой, тянущей к прошлому, в сочетании с «генетическими деформациями», которые не будут верно отражать творческие мысли, чувства и идеи людей. человечество.

Если мы не решим эти проблемы с помощью как технических, так и политических мер защиты, мы вскоре можем оказаться в мире, где на нашу культуру больше влияют генеративные системы искусственного интеллекта, чем реальные люди-творцы.

Луи Розенберг — известный технолог в области VR, AR и AI. Он основал Immersion Corporation, Microscribe 3D, Outland Research и Unanimous AI. Он получил докторскую степень в Стэнфорде, был штатным профессором Университета штата Калифорнии и получил более 300 патентов.

Источник