Найти в Дзене
Алиса на сцене

Как изменилась жизнь звукорежиссеров и аранжировщиков после появления Sora и искуственного интеллекта?

Недавно я была на студии и записывала вокалы к двум песням на стихи замечательного поэта. Аранжировки для этих песен делал живой человек - специалист из Екатеринбурга, а запись и сведение - опытный звукорежиссер из Москвы. Таким образом, в одной комнате собрались три живых человека, которых сегодня собирается заменить искусственный интеллект: поэт, певица и звукорежиссер. Между нами завязался диалог: а что нас ждет дальше? Ведь Sora делает отличную работу за 30 секунд. Только одна у нее есть "пробоина": исходник плохого качества, он не подходит для радио, телевидения, кино, выпуска на площадки. Я вообще олдскул, и до последнего не слежу за трендами. Ни разу я не открывала Sora, делаю все вручную. Но вот на студии коллега мне показал, как это работает: напел грув на диктофон и загрузил в приложение. То есть нейросетка буквально получила голосовую запись "па- па-ра-па-па - бум-бум-пу-пу-би-ду". Дальше нейросетке был задан стиль, в котором она должна сотворить шедевр. Выбор пал на Nu Me
Оглавление

Сегодня мы поговорим о том, как появление Sora и других нейросеток, создающих песни, аранжировки, вокальные и инструментальные партии буквально за 30 секунд, изменило жизнь представителей музыкальной индустрии: сонграйтеров, вокалистов, аранжировщиков, авторов текстов, звукорежиссеров, звукоинженером и всех тех, кто зарабатывает музыкой.

История о том, как Алиса услышала Sora и расстроилась

Недавно я была на студии и записывала вокалы к двум песням на стихи замечательного поэта. Аранжировки для этих песен делал живой человек - специалист из Екатеринбурга, а запись и сведение - опытный звукорежиссер из Москвы. Таким образом, в одной комнате собрались три живых человека, которых сегодня собирается заменить искусственный интеллект: поэт, певица и звукорежиссер.

Между нами завязался диалог: а что нас ждет дальше? Ведь Sora делает отличную работу за 30 секунд. Только одна у нее есть "пробоина": исходник плохого качества, он не подходит для радио, телевидения, кино, выпуска на площадки.

Я вообще олдскул, и до последнего не слежу за трендами. Ни разу я не открывала Sora, делаю все вручную. Но вот на студии коллега мне показал, как это работает: напел грув на диктофон и загрузил в приложение. То есть нейросетка буквально получила голосовую запись "па- па-ра-па-па - бум-бум-пу-пу-би-ду". Дальше нейросетке был задан стиль, в котором она должна сотворить шедевр. Выбор пал на Nu Metal. Прошло 30 секунд, и приложение сгенерировало готовый трек с отличной мощной гитарной партией и партией барабанов, ровно в том ритимическом рисунке, который был задан, со всеми перебивками, которые были "напеты" ртом.

Дальше он показал мне три версии песни, которую загрузили в приложение: в стилях Rnb, Rock, Country. Нейросеть мастерски сделала готовые песни с обилием мелодических и ритмических "ништяков", а уж про качество вокалов и говорить нечего: они "вылизаны", звучат просто идеально.

Знатно просветившись, я в очередной раз очень расстроилась. По своему качеству это работа порой превосходит "ручной труд", потому что машинное обучение работает таким образом, что изучило всё самое лучшее, вкусное, "сырное-масляное", и использовало это на благо нового произведения. Более того, я бы не сказала, что всё это лишено души и эмоциональности - а именно этим многие себя успокаивают. Мол, нейросесть не может воспроизвести человеческие эмоции. Мы же искусство, йошкин кот.

И что теперь? капут?

Мы послушали эти творения. Я спросила:

- Ну и что теперь делать? Это звучит круто. Но зачем теперь сонграйтеры и аранжировки?

- Пока что это всё таки звучит плохо, - отрапортовал мне коллега, - Этот звук совершенно нигде нельзя использовать. Нейросетку пока можно использовать для идей, но всё это нужно переигрывать вживую.

- А что, разве Sora не выгружает отдельно по дорожкам, чтобы это можно было свести?, - спросила я

- Выгружает, стэмами. Они по-прежнему плохого качества. Можно использовать из этого что-то: например, он может выгрузить MIDI-файл басовой партии. Вот это я использовал. А все остальное просто непригодно.

В комнате повисло молчание. По факту, индустрия под угрозой. Люди, которые создают искусство, и их хлеб, тоже под угрозой. Нейросетка делает крутые демки, и пыжиться, изобретая велосипед вручную, становится нерациональным.

- Ну, подождите, - в диалог вступил поэт, - ведь нейросеть не заменит человеческое общение. Мы здесь собрались не просто записать песни, но и пообщаться. В этом то и весь смысл. Останутся люди, которым важно творческое взаимодействие, которые хотят генерить идеи вместе, тусоваться на студии и так далее.

- Да, но нужно это далеко не всем, - ответили мы.

Вот такие вот пироги. Слабые звенья нейросетки - это отстойные тексты, плохое качество источников, и, если придираться, не до конца продуманная драматургия (динамика инструментов и голоса, выразительность вокальных фраз, правильная расстановка акцентов). Но всё это, как вы можете догадаться, дело времени. Machine Learning проанализирует еще больший объем информации, и улучшит все вышеперечисленное.

А нам остается просто ждать и делать свою работу.

А что думаете вы по этому поводу? Может ли ИИ заменить человека и делать красивую, эмоциональную, значимую для слушателей музыку? Давайте обсуждать в комментариях