2098 подписчиков

Нейросети добрались до музыки. От Beatles до Linkin Park. Чем это грозит индустрии в будущем.

16 мая 202316 мая 2023

148

11 мин

ИИ в этом году стремительно штурмует мир. Искусственный интеллект (англ. AI - Artificial Intelligence; он же нейросеть, он же самообучающаяся программа, имитирует мышление человека).

Не так давно AI существенным образом изменил реальность тех, кто связан с написанием текстов созданием чата GPT, оный пишет статьи на уровне начинающего копирайтера, а иногда и лучше, в будущем чат должен заменить поисковики; так же AI всколыхнул тихую гавань дизайнеров, AI-программы за секунды создают цифровой арт, у иллюстратора на похожее уходит пару часов, в некоторых случаях и дней, причем бурной фантазии AI могут позавидовать многие художники.

(Джим Моррисон поет Born to Die песню Ланы Дель Рей)

И вот дождались, AI заглянул на территорию музыки. Дело в том, что нейросеть приспособили имитировать голос человека, причем уже пару лет назад. Правда качество оставляло желать лучшего, много цифровых шумов и искажений, невозможно слушать. Но за последнее время нейросеть прилично самообучилась. Имитация вокала (или копирование) стало гораздо точнее. Причем генерировать вокал теперь может любой пользователь AI-сервисов и программ.

(Freddie Mercury поет Rocketman песня Elton John)

Некоторые любители музыки, логично раскинули - Если нейросеть может имитировать голос любого человека, то почему бы не сымитировать вокал знаменитости, например, Пола Маккартни.. или Хэтфилда.. или Кобейна.. или Дрейка (популярный в США рэпер).

Попробовали. Получилось. Ок, а что ещё может сделать AI с голосом сэра Пола? Давайте попробуем вставить вокал молодого Маккартни или Леннона в новую песню и посмотрим, что получится.

Примерно похожие манипуляции и проделал один из пользователей; взял песню Маккартни New с альбома 2013 года и добавил вокал молодого Пола, чтобы продемонстрировать разницу. Те кто с вокалом Маккартни знаком плохо, разницу не заметят, но другие услышат.

Под обновление AI так же попала песня Леннона Grow Old With Me, оригинал был записан в 1980 году и посмертно выпущен на альбоме 1984 года Milk and Honey. AI обновил звучание и мелодию (по утверждению некоторых - добавив глубины), с более широкими вокальными гармониями и более полной аранжировкой, как у Beatles.

Другие энтузиасты AI пошли дальше и попросили нейросеть перепеть песню Queen Bohemian Rhapsody голосами Beatles.

Вот ещё примеры обновленных версий Beatles.

А вот Джон Леннон поет Yesterday. Как вам такое?

А вот сам Фредди Меркьюри поет хит Beatles Let It Be.

А вот культовый персонаж альтернативной сцены 90-х Курт Кобейн из Nirvana исполнил хит Black Hole Sun. Суть в том, что песня принадлежит его коллегам по гранж-сцене группе Soundgarden. Надо сказать, что тут AI в паре мест недоработал, но ведь это только проба пера, а что будет через год, когда он обучится ещё больше?

Ну и что с того, подумаешь поигрались детишки в AI - устанут, забудут, переключатся на новые забавы.

Возможно так и произойдёт, но есть нюансы. Дело в том, что внезапно оказалось, что массовому слушателю в принципе глубоко фиолетово, настоящий вокал или искусственный.

Неделю назад в США пользователь Тик-тока с ником ghostwriter977, используя нейросеть выпустил песню с вокалом рэпера Дрейка, который очень популярен в Штатах.

Песня набрала 630 000 прослушиваний на Spotify и 230 000 на Youtube примерно за 24 часа, и была так же стремительно удалена с обоих ресурсов. Естественно пользователи наделали копий и перезалили её обратно.

Что показал этот нейро-эксперимент с Дрейком?

Первое, эмоции от музыки являются главным двигающим фактором любого слушателя, если песня нравится, то массовому слушателю без разницы чей вокал, даже если он знает, что вокал не принадлежит настоящему Дрейку, и сделан AI.

Второе, если песня, созданная с помощью AI всего за сутки без раскрутки (если не считать, что тема AI в принципе популярна) и вложений набирает полмиллиона просмотров - значит потенциально на этом можно заработать миллионы долларов.

(Наши тоже не отстают, Винни Пух поет Toxicity группы System of a Down)

Третье, менее важное (по крайне мере пока и не относящееся к Дрейку), если AI уже может с легкость генерировать и синтезировать разных исполнителей, вокал и аранжировки, значит можно создавать миксы разных эпох.

К пример, Леннон поет хит эпохи 90-х группы Oasis песню Don't Look Back In Anger (которая кстати, частично написана под влиянием самого Леннона, каламбур истории, AI-вокал Леннона спел песню Оазис написанную под влиянием самого Леннона). Таким образом молодые фанаты слушают звезд прошлого в привычной себе среде, а фанаты Леннона слушают, что там спел Леннон в 90-е. И всё это ограничивается полетом фантазии того, кто будет работать с AI.

А причем тут индустрия музыки? Здесь есть свои интересные моменты.

После загрузки вышеупомянутой песни псевдо-Дрейка, как всегда внезапно встала проблема с авторскими правами. Кому принадлежит право на продукт? Вопрос кажется тривиальным только простым слушателям, какая разница откуда скачивать или где слушать.

(Freddie Mercury поет Yesterday группы Beatles)

Самим же лейблам, исполнителям, потоковым стриминговым сервисам (как напр. Spotify) и собственникам AI не до шуток. Ответ на вопрос - Кому принадлежит право на голос исполнителя? - это ответ на вопрос - Кто получит потенциальные миллионы долларов дохода от возможных продаж AI-каверов, которыми судя по всему скоро завалят интернет, и уже завалили стриминг Spotify, он был вынужден массово удалять загруженные треки.

Например, кому принадлежат права на сгенерированный AI вокал Дрейка (или Леннона, или Маккартни и пр.):

самому Дрейку
лейблу звукозаписи, у которого контракт с Дрейком на продажу песен с с его вокалом (подпадает имитация вокала под вокал?)
автору кавера (человеку создавшему запрос на генерацию песни через нейросеть)
владельцу программы AI (которая сгенерировала песню с имитацией вокала Дрейка по запросу пользователя)

Понятно, что Youtube удалил песню от греха подальше, чтобы ему вдруг не выкатили иск. Платформа выдала стандартную плашку - Права принадлежат лейблу UMG; что сразу поставили под сомнение многие, т.к. если за имитацию вокала брать деньги, можно удалять (засудить) контент всех пародистов и вообще любого, кто решит имитировать вокал звезды. В США люди обожают судиться, так что история только начинается.

(Новая песня Amy Winehouse от проекта AI Lost Tapes Of The 27 Club называется Man I Know)

Чтобы было понятнее, на данный момент в Штатах идет серьёзный пересмотр правоприменения в области авторских прав из-за появления AI, так недавно суд признал право на сгенерированную иллюстрацию за собственником нейросети, а не за пользователем, хотя предполагалось обратное. В свою очередь тексты сгенерированные с использованием нейросети GPT, принадлежат тому, кто сделал запрос на написание статьи, а не владельцам GPT (компании OpenAI).

А что с музыкой?

С музыкой пока непонятно, но уже начались публичные дискуссии, попытки застолбить место с призывами подумать о морали, со стороны крупных лейблов. Какие тут видятся перспективы и проблемы?

(Freddie Mercury поет песню NUMB группы Linkin Park)

Если посмотреть на историю прихода технологий в нашу жизнь, то всё это уже было. Эксперты сразу вспомнили появление сети Нэпстер (1999 год), тогдашние американские студенты начали массово копировать музыку в mp3 формате и передавать друг другу.

В итоге доступность скачивания любимой музыки обвалила индустрию продаж на физических носителях, уже к 2010 году больше половины всей музыки в Америке скачивалось из интернета и прослушивалась в онлайн на стриминг-платформах. Доля CD уменьшилась до 30%, винила до 5%. Ну а на сегодня доля стримингов занимает 80% рынка; остатки делит между собой винил, CD, кассеты и прямая загрузка с сайтов, торрентов и пр.

К чему этот экскурс в историю, ведь AI не придумал новый формат и не сделал доступ к музыке проще, а всего лишь имитировал вокал звёзд. Возможно к тому, что Непстер серьёзным образом изменил индустрию продаж, лейблы отказались от новшества, засудив создателей сети. Но уже через 10 лет потеряли половину рынка, по сути собственноручно создав себе конкурентов в лице стриминговых платформам типа Spotify (наш аналог - Яндкес.Музыка), а позже стриминги и вовсе подмяли под себя весь рынок.

(Michael Jackson поет The Show Must Go On группы Quenn)

Ещё одна аналогия которая напрашивается сходу - история с эмуляторами музыкальных инструментов и аппаратуры по микшированию. Программы типа AmpliTube или ProTools, поначалу встреченные скептически, в итоге перенесли в цифровой формат почти всё оборудование, начиная с усилителей для гитар, педалей искажений, комбиков до микрофонов и пультов, большую часть того, что связано со звукоизвлечением и инструментами.

Как образом это изменило индустрию? Цифровизация всей этой музыкальной аппаратуры сделала звукозапись не просто комфортнее, а максимально дешевой = доступной; теперь вместо фуры с оборудованием нужен был компьютер и программа.

(Billie Eilish поет People Are Strange группы The Doors.)

Сегодня в цифровизацию звукозаписи заглянул AI. Уже сейчас можно записывать вокал, прогонять его через AI, он сгенерирует его под доступную ему песню (то есть любую в цифровом формате) и запишет поверх. Таким образом в обозримом будущем любой человек может например записать любую песню Beatles со своим вокалом, даже если не умеет петь. Уже сейчас есть сервисы, как например американский ElevenLabs, которые с помощью нейросети создает цифровую копию человеческого голоса любого пользователя, достаточно зачитать небольшой текст с интонацией, загрузить на аудио файл на сайт, ввести любой текст, и вы услышите, как ваш голос будет его зачитывать. С вокалом в скором времени можно будет проделывать похожие манипуляции.

(Chester Bennington (Linkin Park) поет Let it be группы The Beatles)

И это не говоря про потенциальную возможность AI работать с уже имеющимся программным обеспечением эмуляторов типа AmpliTube, его обязательно попытаются приспособить и под эти задачи.

Представьте, что вы можете взять голос популярного певца, записать под него мелодию, выдать на рынок. Кстати, в киноиндустрии компания Netflix уже дополняет контракты актёров озвучки пунктом, что актер передает согласие на пожизненную и бесплатную передачу голоса в пользование компании и разрешает обрабатывать его голос с помощью технологий, как существующих, так и будущих. Сейчас в Голливуде идут массовые забастовки сценаристов, которые просят поднять зарплаты и запретить использовать чат GPT и в целом AI в написании сценариев. К ним собираются присоединиться актеры, и теперь видимо сценаристы. И уже ведутся разговоры, что в будущих контрактах будут прописывать согласие на передачу всего образа актера, для оцифровки.

Какие вопросы могут возникают у лейблов. А зачем нам тратить лишние деньги на певца, если есть его голос и мы можем его продавать, всё равно музыку часто сочиняют приглашенные композиторы. Учитывая, что AI может работать без перерывов на обед, при этом в перспективе генерировать популярные мелодии под запросы слушателей. Нет, реальный певец конечно тоже нужен, но его вовлеченность в процесс может быть значительно снижена; вместе с зарплатой и расходами на оного. Хотя уже звучат разговоры, что в будущем можно создать своего цифрового AI-исполнителя, и продавать его, как самостоятельного персонажа.

(Lana Del Rey поет песню Something In The Way группы Nirvana)

Или уже сам певец может поразмыслить, а зачем отдавать полные права на вокал лейблу, если я могу брать 50% с продаж треков с моим вокалом, которые будут создавать пользователи AI, как в случае с песней псевдо-Дрейка. Кстати, прецедент уже есть, певица Grimes заявила, что любой может использовать её вокал для генерации песен в нейросети, но с 50% выплатами ей.

Стриминги в свою очередь, имеют своих музыкантов на подписке, отчисляя им процент с продаж за прослушивание. В данном случае стриминг-сервис, так же как и лейбл будет вынужден защищать свои права на получение дохода от музыки.

(Freddie Mercury поет Welcome To The Black Parade группы My Chemical Romance)

Как итог начавшегося скандала, первым выступила компания UMG (Universal Music Group). Вот что заявил официальный представитель лейбла про удаленный кавер псевдо-Дрйка:

«Достижения компании UMG были в том числе обусловлены внедрением новых технологий и использованием их для наших артистов — как мы уже некоторое время делаем с нашими собственными инновациями в области искусственного интеллекта»

Студия признает, что сама использует технологии AI, и это нормально. Но дальше юристы UMG объясняют, что использование AI простыми смертными, в том числе стриминговыми сервисами (Soptify) - это плохая и аморальная идея; и далее взывают к ценности существующей музыкальной экосистемы (та самая индустрия музыки).

«Однако с учетом сказанного обучение генеративного AI с использованием музыки наших исполнителей (что представляет собой нарушение соглашений, нарушение закона об авторских правах), а также доступность контента, нарушающего авторские права, созданного с помощью AI, поднимает вопрос о том, на какой стороне истории хотят быть все заинтересованные стороны в музыкальной экосистеме: на стороне артистов, фанатов и человеческого творческого самовыражения или на стороне дипфейков, мошенничества и отказа выплачивать артистам должную компенсацию.

Таким образом, юристы компании ясно дают понять, что генерация вокала - с их точки зрения есть незаконное копирование, дипфейки (обман), мошенничество и отказ выплачивать артистам компенсацию.

(Леннон поет песню Wonderwall группы Oasis)

Как бы то ни было, одно можно сказать определенно - искусственный интеллект сделал шаг в сторону музыкального сообщества. Запретить фанатам музыки генерировать с помощью нейросетей вокал своих кумиров, синтезировать эпохи, создавать новые аранжировки - не получится; но возможно она сама сойдёт на нет, увидим уже совсем скоро.

В ближайшем будущем нас, как минимум ждут, новые AI-ремасты и в целом обновление классики. На Youtube уже есть каналы с чартами новых сгенерированных песен. Что из этого всего получится, сказать сложно, может и ничего, а может появится новый жанр музыки.

(Freddie Mercury поет The Long And Winding Road группы The Beatles)

Как известно, любые изменения, связанные с технологическим укладом, призваны улучшать жизнь человека. Если искусственный интеллект поможет музыкантам, слушателям, лейблам и стримингам создавать новую музыку, способную приносить эстетическое и моральное удовлетворение, то почему нет.