Найти в Дзене

Музыка от Open AI. Разбираем особенности нейросети MuseNet

MuseNet, разработанная OpenAI, представляет собой нейросеть, способную генерировать музыкальные композиции продолжительностью до четырех минут. Она умеет работать с десятью инструментами одновременно и создавать треки в различных стилях. Это не просто еще одна игрушка для музыкальных экспериментов, а вполне интересный инструмент для обогащения своего музыкального творчества. Хотя и с некоторыми оговорками. Итак, что же представляет собой данный проект от мирового лидера в области искусственного интеллекта? MuseNet была обучена на огромном массиве MIDI-файлов, в процессе чего нейросеть по крупицам собрала закономерности гармонии и стиля. Вместо того чтобы программировать в нее правила музыки, разработчики позволили MuseNet самой разобраться, как звучат аккорды и мелодии. В основе лежит трансформер — та же технология, что используется в языковых моделях вроде GPT-2. Результат? Нейросеть, которая может выдать мелодию в стиле Шопена с элементами рока или превратить начало классической пьес
Оглавление

MuseNet, разработанная OpenAI, представляет собой нейросеть, способную генерировать музыкальные композиции продолжительностью до четырех минут. Она умеет работать с десятью инструментами одновременно и создавать треки в различных стилях. Это не просто еще одна игрушка для музыкальных экспериментов, а вполне интересный инструмент для обогащения своего музыкального творчества. Хотя и с некоторыми оговорками.

Нейросеть от OpenAI, которая сочиняет музыку

Итак, что же представляет собой данный проект от мирового лидера в области искусственного интеллекта? MuseNet была обучена на огромном массиве MIDI-файлов, в процессе чего нейросеть по крупицам собрала закономерности гармонии и стиля. Вместо того чтобы программировать в нее правила музыки, разработчики позволили MuseNet самой разобраться, как звучат аккорды и мелодии. В основе лежит трансформер — та же технология, что используется в языковых моделях вроде GPT-2. Результат? Нейросеть, которая может выдать мелодию в стиле Шопена с элементами рока или превратить начало классической пьесы в джазовую импровизацию.

MuseNet предлагает два режима взаимодействия: простой и продвинутый. В простом режиме пользователь слышит заранее сгенерированные треки; он может выбрать стиль, композитора или даже начало известной мелодии. Продвинутый режим позволяет глубже погрузиться в процесс: здесь пользователь задает инструменты, стиль и начальные ноты, а нейросеть создает композицию с нуля. Правда, придется подождать — генерация занимает время.

Инструменты и стили в MuseNet нельзя назвать строгими командами; скорее, это подсказки для пользователя. Нейросеть рассчитывает вероятности для каждой ноты и может неожиданно добавить скрипку (даже в том случае, если просили только фортепиано). Иногда это приводит к интересным находкам, но порой результат звучит как случайный джем-сейшн. Особенно сложно ей даются необычные сочетания наподобие Шопена с бас-гитарой и барабанами — тут мелодия может утратить свою стройность.

-2

Зачем нужна MuseNet

MuseNet открывает двери для экспериментов. Музыканты могут использовать ее в качестве источника вдохновения, пробуя новые сочетания стилей. Например, нейросеть способна взять первые ноты ноктюрна Шопена и превратить их в поп-композицию с гитарой и ударными. Такие эксперименты показывают, каким образом можно сделать классику более современной. Новичкам, далеких от нотной грамоты, нейронная сеть дает шанс почувствовать себя композитором без необходимости учиться годами.

Но есть нюанс: музыка от MuseNet часто звучит технически правильно, но эмоционально пустовато. Человеческие композиторы вкладывают в свои работы переживания, а нейросеть пока просто комбинирует паттерны. Это не всегда плохо — для фоновой музыки в играх или видео такой подход вполне годится. Однако ждать от нее саундтрека, который тронет до глубины души, пока не стоит.

-3

Техническая начинка

MuseNet использует продвинутую архитектуру Sparse Transformer, которая позволяет ей удерживать в памяти структуру композиции на тысячи нот вперед. Благодаря этому мелодия не разваливается на куски, а сохраняет свою связность. Обучение проводилось на данных из разных источников — из классических архивов, поп- и джазовых MIDI-файлов. Нейросеть кодирует ноты и инструменты в единые токены, добавляя специальные метки для времени и структуры произведения.

Такой подход помогает MuseNet не просто выдавать случайные ноты, а создавать нечто, похожее на законченную пьесу. Например, она может запомнить ритм и гармонию на протяжении всего трека, что особенно заметно в классических стилях. Однако в сложных жанрах, в которых много импровизации (например, джаз), нейросеть иногда теряется, выдавая что-то слишком предсказуемое.

Послушать пример трека, созданного нейросетью, можно при помощи видеоролика ниже:

Плюсы и минусы

MuseNet впечатляет своей универсальностью, а способность сочетать стили и инструменты делает ее любопытным инструментом для творчества. Она доступна и понятна даже тем, кто никогда не держал гитару в руках. Но ограничения тоже есть. Композиции иногда получаются механическими, а управление процессом не всегда дает желаемый результат. Вопрос оригинальности тоже остается открытым: можно ли назвать музыку, сгенерированную на основе чужих данных, по-настоящему новой?

Таким образом, нейронная сеть MuseNet станет хорошей помощницей для композиторов, которая позволит и усовершенствовать уже имеющееся произведение, и сгенерировать новые идеи. Она показывает, как далеко зашел искусственный интеллект в музыке, но до уровня человеческой интуиции ей еще расти. Для тех, кто хочет попробовать что-то новое или просто поразвлечься, MuseNet предлагает увлекательное путешествие во Вселенную звуков. Главное — не ждать от нее шедевров на уровне Бетховена.