Найти в Дзене

Творчество закончилось? Или всё только начинается?

Главные вызовы для медиа-индустрии в связи с бурным развитием «ИИ» технологий 🚀 Сейчас, наверное, только ленивый не слышал ни слова про музыкальные нейросети и вообще про нейросетевые технологии, технологии так называемого «искусственного интеллекта». Возможно, даже бабушки в глубинке уже прекрасно об этом знают, потому что об этом говорят повсюду. Но что это такое? 🤷🏻‍♂️ С точки зрения техники и технологии — очень интересно и модно называть эти алгоритмы «искусственным интеллектом». Ребята, но как интеллект может быть искусственным? Это же априори некорректно и не совсем логично. Давайте называть нейросети и в целом то, что принято называть ИИ, «умными алгоритмами», так ближе к сути 😉 Изначально эту статью я писал специально для журнала «Евразимут», публикация вышла в предновогоднем выпуске: Если говорить про музыкальную индустрию, то все эти музыкальные нейросети обучаются на миллионах музыкальных треков, созданных и изданных за долгие годы развития человечества. В этот набор дан

Главные вызовы для медиа-индустрии в связи с бурным развитием «ИИ» технологий 🚀

Сейчас, наверное, только ленивый не слышал ни слова про музыкальные нейросети и вообще про нейросетевые технологии, технологии так называемого «искусственного интеллекта». Возможно, даже бабушки в глубинке уже прекрасно об этом знают, потому что об этом говорят повсюду. Но что это такое? 🤷🏻‍♂️

С точки зрения техники и технологии — очень интересно и модно называть эти алгоритмы «искусственным интеллектом». Ребята, но как интеллект может быть искусственным? Это же априори некорректно и не совсем логично. Давайте называть нейросети и в целом то, что принято называть ИИ, «умными алгоритмами», так ближе к сути 😉

Изначально эту статью я писал специально для журнала «Евразимут», публикация вышла в предновогоднем выпуске:

Если говорить про музыкальную индустрию, то все эти музыкальные нейросети обучаются на миллионах музыкальных треков, созданных и изданных за долгие годы развития человечества. В этот набор данных входят и классическая музыка, и коммерческий саунд прошлого и настоящего — всё, что создавалось вручную. То есть всё, что было издано, так или иначе попадает в «датасет».

В процессе обучения нейросеть анализирует огромное количество материала. В итоге она получает взаимосвязь множества маленьких кирпичиков, деталей, из которых складывались хиты, узнаваемость и крутость топовых музыкальных произведений человечества. Однако есть нюанс.

Когда человек создаёт что-то новое, некоторые моменты он делает исходя из профессионализма, из опыта, из собственной базы знаний, но при этом есть и элемент случайности, элемент творчества. Как у поэтов происходит «озарение»? Человек подрывается, берёт лист бумаги и быстро-быстро начинает что-то писать — буквально с листа. И текст практически готов, требует лишь профессиональной доработки.

То же самое с музыкой: у композитора в голове крутится некий мелодический фрагмент, сырые обрывки, но в какой-то момент всё складывается в цельную картину. Он бежит к диктофону, напевает или садится за рояль или гитару и фиксирует идею. Это элемент озарения — бац, и что-то новое. И даже если в этом новом есть случайные заимствования, не преднамеренные, а именно случайные — автор анализирует, перерабатывает.

Это, кстати, отдельная боль опытных композиторов – порой непросто определить, придумал он что-то сам или случайно перекомпилировал чужие идеи, не сплагиатил ли он. Но это человек. Человек анализирует свои действия и адаптируется. Знает – если он действительно что-то украл, к нему придут, зададут вопросы и устроят разбирательство.

Вопрос об авторстве строго регламентирован ⚖

Что происходит с точки зрения ИИ?

Программа генерирует вам песню на основании анализа огромного количества уже готовых треков. Априори вам генерируется нечто правильное и структурированное, но заведомо чужое. Помним, что все нейросети — это генерация из кирпичиков, ничего принципиально нового здесь нет.

Если говорить о музыке и анализировать материал, который генерируют нейросети, там встречается много музыкальной неграмотности и различных нестыковок. Музыка — это не только банальные трезвучия и типовые четыре аккорда по кругу, музыка гораздо хитрее. Музыкальная теория — это математика, сложная, мудрёная, но хорошо просчитанная и продуманная система.

Когда умные алгоритмы на ходу собирают кубики, часто получается музыкально неграмотно — это легко заметить. Иногда явно слышны кусочки, склеенные из разных источников, порой замечаешь очевидные музыкальные ошибки. Конечно, алгоритмы стараются это скрыть, завуалировать, пользователю даётся сразу готовый вариант.

Поймать ИИ за руку сложно, но всё это так или иначе является плагиатом, поскольку нейросети фактически паразитируют на истинных творческих достижениях человечества. Первые иски от правообладателей тому наглядное подтверждение, индустрия не дремлет и терпеть ИИ-плагиат не намерена.

Это стоит считать одной из самых важных проблем и вызовов, которые нейросети несут медиа-индустрии: кто автор? 😎

Когда вы что-то сгенерировали, кто является автором произведения — вы или нейросеть? По факту умный алгоритм собирает всё из того, что создано другими до вас. Но программа не может быть автором!

С точки зрения законодательства об авторском и смежных правах, автором может быть только конкретный человек, который что-то написал и придумал. Здесь же автора нет. Есть программа, генеративный алгоритм, при этом заранее известно, что результат — по сути плагиат 🎯

Сейчас идёт серьёзное обсуждение по поводу лицензирования такого контента и возможности маркировки. Крупные интернет-площадки и стриминговые сервисы активно борются с потоком сгенерированной музыки и очищают свои каталоги, чтобы защищать честных музыкантов и само творчество.

Ведь получается, что человек, не разбирающийся ни в музыке, ни в стихосложении, может просто подобрать ключевые слова, написать запрос и получить готовую песню‼

Даже вокал можно сгенерировать — достаточно напеть или подгрузить несколько фраз, а алгоритм сымитирует звучание вашего или чужого голоса. Это дополнительный элемент судебных разбирательств, когда создают музыку голосом известного исполнителя.

К сожалению, на сегодняшний день не только у нас, но и в мире нет чёткого законодательства, защищающего голос и облик человека. Вот почему с дипфейками возникает множество проблем: имитация голоса, образа, изменение фонов и пр.

Видео-нейросети развиваются очень быстро, появляется огромное количество обмана. В итоге сложно понять, что настоящее, а что нет. Раньше нейросети делали много ошибок, но технологии развиваются, с каждым днём получается всё точнее и точнее. Алгоритмы усложняются, и все эти имитации становятся всё более достоверными.

Вопрос в том, как отделить истинное — действительно созданную людьми музыку, сыгранную актёрами сцену — от того, что «нарисовано» на компьютере. Как разграничить вопросы авторства, права и защиты голоса, изображения и личности. Одно дело — когда люди создают забавные коллажи, например, переставляя лицо соседа. Другое дело — когда начинаются подделки знаменитостей, должностных лиц или мошеннические схемы.

Это очень серьёзная проблема и для индустрии, и для людей. Вопросы права и защиты сейчас стоят особенно остро. Как определить автора, как оградить людей от подделок? На мировом уровне предпринимаются разные усилия, но всё пока спорно и непросто.

Ещё одна связанная проблема — обесценивание творчества.

Любой человек с базовыми техническими знаниями может изучить руководство и научиться генерировать песни.

Сейчас появилось огромное количество таких «авторов», многие из которых не знают ни одной ноты, но генерируют сотни песен в день, выпускают альбомы. Люди, которые много лет учились, которые действительно чувствуют музыку и создают что-то ценное, оказываются в сложном положении. На фоне столь массово сгенерированного контента выделиться очень трудно, поскольку генерация основана на хитовых, известных материалах.

Настоящие музыканты и творческие люди изначально оказываются в проигрыше, потому что алгоритмы обладают огромными вычислительными мощностями и могут легко их обыграть, как в шахматах, где компьютер уже не оставляет шансов человеку.

Противостоять этим алгоритмам по скорости и универсальности практически невозможно 🤦‍♂️

При этом появляются восторженные отклики от тех, кто не имеет особых навыков: программы не только пишут песни, но делают аранжировки, сведение, обработку — кажется, всё круто.

Конечно, в некоторых аспектах это действительно полезно, их можно рассматривать как удобные инструменты, как кисти в графическом редакторе. Например, чистка голоса от шумов и звукового мусора сейчас развивается очень хорошо, это действительно крутая тема. Есть ещё потенциал для развития, но в целом эти инструменты помогают сэкономить время.

Если же подходить к ним как к самостоятельной замене творческой деятельности, возникает вопрос права, авторства и будущего творческих профессий. Музыканты и другие творческие люди начинают бояться за свой хлеб, за своё будущее, так как многие шли к этому десятилетиями, а теперь программы отнимают их поле деятельности.

Понятно, что программы — это хорошо, как инструмент они будут развиваться очень круто и здорово. Однако в конечном счёте всегда решает человек — тот, кто нажимает на кнопку и принимает решение. Даже если вы что-то сгенерировали на основании запроса, это всё равно связано с вашим внутренним миром, с вашим творческим началом. Поэтому, конечно, в каком-то виде все эти генерации — это отчасти творчество, но всё же псевдо-творчество.

Если вы понимаете, что делаете, тогда ИИ-инструменты — это помощь, дополнительные руки, которые экономят время и упрощают рутинные операции.

Например, распознавание текста — перевод звукового ряда в текст с последующей автоматической корректировкой, удалением лишних уточнений, второстепенных фраз и междометий. Убирается словесный мусор, чтобы получить чёткий, лаконичный и понятный текст. Эти технологии развиваются прекрасно.

Мне тоже удобно формулировать мысли вслух, затрагивая разные темы, а затем перевести аудио в текст и откорректировать полученное. Поэтому лично для меня технологии распознавания речи очень кстати. Но это совсем не то же самое, что сгенерировать статью по запросу.

Например, эту самую статью про ИИ в музыке я сначала рассказал и записал голосом, а лишь потом переработал в текст:

Добро или Зло?

У большого количества людей, связанных с музыкой и творчеством, есть потенциальный риск потери доходов, развития и смысла всем этим заниматься.

За счёт того, что музыка может генерироваться буквально за секунды, любой человек в любой день может создать огромное количество песен и новой музыки. Если не фильтровать, не вводить ограничения или маркеры, а просто загружать на площадки, постепенно везде будет ИИ-контент и на его фоне настоящая музыка, созданная людьми для людей, просто потеряется.

Что мы и наблюдаем! 💥

Стриминговые площадки и сеть в целом заполняются шаблонным, копированным, клонированным материалом, и со временем всё становится безликим. Если учесть, что генеративные алгоритмы и нейросети обучаются на данных, которые содержат всё больше сгенерированного материала, получается, что они сами обучаются на продуктах нейросетей. Замкнутый круг, который в итоге ведёт к деградации и усиливает шаблонность, из-за чего музыка становится неживой.

Не секрет, что хитовые мелодические и гармонические конструкции давно уже исчерпаны, многое уже было использовано тысячекратно. Однако, если музыкант придумывает что-то самостоятельно, он может играть по-другому, ошибаться или находить новые ходы. Нейросети же задуманы делать всё «правильно». Их обучают создавать качественный, но повторяющийся материал. Поэтому получается безликий продукт, который постепенно растворяется среди множества подобных.

Музыкантам это создаёт серьёзные проблемы, а слушатели начинают подсознательно чувствовать, что что-то не так – сгенерированная музыка кажется ненастоящей. Ты слышишь, что она похожа на что-то очень знакомое, но не полностью, а лишь отдельными элементами. Постепенно это элементарно начинает надоедать.

Давайте отделять случаи, когда речь идёт о настоящем креативе и творчестве, от случаев ремесла и шаблонности 👀

Музыкант в студии может просто играть мелодию по нотам, а может привнести креатив — изменять что-то, добавлять, импровизировать. Это разные подходы. То же касается вокалистов и других творческих специалистов. Там, где важны эмоции, боль, радость, восторг — яркость и выразительность, человеческий фактор остаётся решающим.

Однако, существует множество задач, где яркость и уникальность не нужны, а требуется простая и узнаваемая шаблонность 👌

Вот здесь генеративные нейросети становятся отличным инструментом. Например, для фоновой музыки, звукового оформления документальных фильмов, подкастов, кафе, ресторанов и баров, где музыка скорее дополняет, а не является центральным элементом. Для таких целей сгенерированная музыка очень подходит: её можно использовать без дополнительных договоров и платежей.

В моментах, где ИИ-музыка может прекрасно работать фоном и быть абсолютно оправданной, в том числе экономически, это просто великолепно. Не важно, с вокалом она или без, это действительно очень круто. Если подходить к такой музыке взвешенно и использовать технологии как инструментарий, это замечательно, я обеими руками «за», аплодирую стоя.

Если же музыку генерируют люди, которые ничего в этом не понимают, просто чтобы быстро что-то наклепать, это убивает творчество, убивает весь творческий посыл и смысл творческих профессий, да и творческих идей вообще. Если ваша задача — просто создать что-то фоновое, тогда это прекрасно.

Большой свежий стрим по теме:

Выбор очень простой: речь идёт либо о творчестве, либо о ремесленничестве. Каждый решает сам за себя.

Вот такие мысли на полях. Что вы об этом скажете? С удовольствием почитаю ваши комментарии. С вами Андрей Аспидов. До встречи!

ТЕЛЕГРАМ 👉 https://t.me/artmusiccenter
ВКОНТАКТЕ 👉 https://vk.com/artmusiccenter
YOUTUBE 👉 https://youtube.com/artmusiccenter
RUTUBE 👉 https://rutube.ru/u/artmusiccenter
ДЗЕН 👉 https://dzen.ru/artmusiccenter