Музыка – это искусство, которое всегда было связано с творчеством и вдохновением. Однако нейросети и искусственный интеллект (ИИ) не обошли стороной и ее.
Если еще пару лет назад ИИ мог создавать довольно сомнительные и хаотичные мелодии, то сегодня качество сгенерированных работ вызывает опасение у авторов по всему миру.
И вот уже на «Грэмми» выдвинули песню, в которой голоса Дрейка и The Weeknd созданы нейросетью. Хотя ни один из исполнителей не имеет к ней отношения, она может попасть в номинации на лучшую песню и рэп-песню года.
Рассмотрим, как нейросети помогают в создании музыки и какие возможности открывают для молодых музыкантов и композиторов.
ИИ в генерации музыки
Одной из ключевых областей, где нейросети привнесли значительные изменения, является генерация готовых музыкальных произведений. С помощью алгоритмов машинного обучения, ИИ может создавать оригинальные музыкальные композиции, основываясь на анализе огромного количества существующих мелодий и гармоний. Это позволяет музыкантам и композиторам получить новые идеи и вдохновение, а также экспериментировать с различными стилями и жанрами.
Кроме того, нейросети научились создавать дипфейки голосов и могут записывать песни вместо исполнителей. Да, пока получается несовершенно, но с таким темпом развития скоро будет невозможно на слух различить сгенерированные работы.
Возьмем, к примеру, песню «Тейбл Тайм» для одноименного шоу. Поклонники сразу поняли, что что-то не так с голосами любимых импровизаторов, но и подумать не могли, что песня полностью исполнена нейросетью. Тут стоит отметить честность авторов, которые сразу об этом сообщили взволнованным фанатам.
ИИ в поддержке творческого процесса
В первую очередь нейросети являются помощниками авторами и созданы для упрощения их деятельности.
Например, с помощью ИИ можно анализировать и классифицировать музыкальные жанры, чтобы определить свой уникальный стиль и звучание.
Незаменимы нейросети и для обработки звуковых дорожек. Стало значительно проще удалять ненужные шумы и искажения из записей, улучшать звучание инструментов и добавлять необычные звуковые эффекты.
Также нейросети могут предложить сопровождение или аранжировку к произведению, что ускорит процесс создания конечного продукта и позволит музыканту сосредоточиться на самом творчестве.
Руководитель проектов Центра цифровых технологий управления ГУУ Андрей Стариковский привел примеры конкретных нейросетей и рассказал о спорах вокруг авторских прав на контент, сгенерированный искусственным интеллектом.
Примеры нейросетей
Нейронные сети музыкальной индустрии развиваются в нескольких направлениях, что выражается в методах написания музыки.
Первый метод позволяет беспрерывно генерировать музыкальные композиции, используя семплы из библиотеки звуков. Его используют такие проекты как Mubert и Soundraw. Для начала генерации в первом требуется ввод любых слов на английском языке, а во втором просто выбрать жанр, стиль или настроение. В результате запроса пользователь получит список готовых примеров, на основании которых может создать новые звуки.
Другие нейросети могут создать трек с нуля с нужной эмоциональной окраской, а также помочь скорректировать уже готовую мелодию. Для этого подойдут программа AIVA, а также облачный сервис Amper Music.
Куда более интересен пример приложения Humtap, которое генерирует звуки, опираясь на напетую мелодию. Звучит невероятно, но нейросеть анализирует напетый мотив и создает полноценную мелодию, которую так же можно изменять, создавая уникальные композиции. Кроме того, приложение можно использовать бесплатно, но только на IOS устройствах.
«Озвучьте картину», -такие задания дают детям в школе. Нейросети справятся и с этим. Напрмиер, Imaginary Soundscape берет за основу загруженную пользователем картинку и окружает ее звуком. При этом изображение может быть абсолютно любым, включая фон и подложку. Искусственный интеллект сам выберет конкретные ландшафты и наложит на них звуки, предлагая пользователям трехмерную экскурсию под созданную мелодию.
Второй проект, позволяющий работать с изображениями, называется Image to Music и позволяет загружать картинку и выставлять параметры будущей мелодии, среди которых скорость воспроизведения, длительность и тип композиции.
Эксперт о вопросах авторского права
Надо понимать, что любую музыкальную нейросеть обучают на большом объеме аудиофайлов, которые собирают в базу и передают искусственному интеллекту на изучение. По мере обучения звучание становится все лучше, а изучив шаблоны композиций нейросеть и сама может писать похожие мелодии. Очевидно, что многое зависит от базы данных: если обучать нейросеть на музыке одного исполнителя, то и результаты генераций будут похожи именно на его песни.
Это приводит к такой проблеме искусственных произведений, как авторское право. Ведь искусственный интеллект обучается на музыке, принадлежащей реальным исполнителям.
Некоторые нейросети уже столкнулись с такой проблемой: против Midjourney и Stable Diffusion подали иски художники, на чьих работах обучили эти сервисы.
По этой же причине компания Google не планирует открывать публичный доступ к своему сервису для генерации MusicLM.
Нейросети везде поспели: и конкурсы картин выигрывают, и книги создают, и музыку за людей пишут. Но стоит помнить, что у ИИ нет собственной фантазии, он не может создать что-то кардинально новое, все его работы основаны на объединении уже имеющихся данных. Да и для старта генерации нужна правильно написанная задача от человека.
Поэтому продолжаем развиваться и совершенствоваться, оставив для нейросетей функции помощника в своих начинаниях.