Как скоро микширование, ап-микширование и восстановление звука с помощью искусственного интеллекта (ИИ) достигнут уровня, при котором потенциально может отпасть необходимость в привлечении человека
Я не люблю работать над рецензиями в тишине. Мне нужна какая-нибудь музыка для сопровождения в фоновом режиме. Несколько месяцев назад для этих целей я нашёл подходящие аудиовизуальные ролики на YouTube, по большей части сгенерированные ИИ.
До сих пор, просматривая их на разных каналах, я удивляюсь диковинности визуальных форм и их фантастическими трансформациями (как-то так):
ૐ Chillout News Mix ૐ Vol.96 / 06-2024 (Chillgressive Psychill Psybient Downtempo Mix)
Восхищённый увиденным и услышанным, я задумался по поводу того, какую помощь ИИ мог бы оказывать музыкальной индустрии и простым потребителям окружающей музыки, как для её производства, так и ап-микса огромного количества стерео-миксов, накопившихся за десятилетия.
Возможно, такая помощь от ИИ однажды придёт.
Почитав немного истории о современном искусственном интеллекте, я пришёл к выводу, что ИИ проходит несколько стадий обучения, подобно маленькому человеческому существу, который родился с «пустыми ячейками памяти» в голове, и по мере взросления, заполняет их полезной информацией, помогающей ему адаптивно жить в этом мире.
И опыт, сын ошибок трудных…
Конечно, по ходу обучения, детям нужно выполнять творческие задачи, а любая творческая деятельность, требует изучения и практики. Это неотъемлемая часть интеллектуального развития, способствующая расширению словарного запаса, логическому мышлению и аргументации. Эти и другие навыки окажут влияние на будущее ребёнка.
Действия по обучению ИИ в чём-то схожи. Инженеры, подобно родителям, способны помогать их детищу через использование Big Data и выполнение заданий, «заточить» тот или иной навык на выполнение определённого рода задач.
Что касается звука, я действительно думаю, что искусственный интеллект как инструмент имеет своё применение. В музыке, безусловно, можно использовать обучающие наборы, чтобы помочь в распознавании образов, необходимых для узконаправленных задач, скажем, выделения инструмента.
ИИ-технологии уже сейчас демонстрируют специфические, но полезные возможности.
5.1 Atmos Surround Sound Test - Dolby Orchestra Music 4K HDR
Перед такой операцией полезно изложить ИИ свои требования, подсунув ему, даже, какой-нибудь музыкальный отрывок, сэмпл с понравившимся звуковым эффектом или приёмом в локализации инструментов. После создания определённого звукового коллажа, не будет большим грехом повторить его ещё раз-другой в подходящих треках альбома.
По сути, 30 лет подряд инженеры сведения занимаются тем же самым, выполняя свои шаблонные ремиксы, в которых немало клише и разницы между ними не так уж и много.
Не верите? Как увидите у меня в рецензиях на МК миксы оценки 3, 4, 5, знайте: оно и есть.
Разработчикам программного обеспечения надо поддержать деятельность звукорежиссёров по части выполнения ими рутинных операций: дать звукарям за микшерным пультом инструменты с поддержкой искусственного интеллекта, которые могли бы определять задачи, которые выполняет инженер, и особенно повторяющиеся вещи. Затем ИИ предлагал бы решения / варианты по ходу работы, без необходимости спрашивать или нажимать кнопки.
Моё видение таких полезных ИИ-продуктов для студийщиков — это программы, через которые прогоняется музыкальное произведение, после чего человек получает сгенерированные тестовые данные. Потом выбирается наилучший вариант, в который также можно внести любые творческие корректировки.
Простой пример: инженер начинает замес, заглушая партию малых барабанов. 30 секунд в режиме ожидания...
ИИ спешит с подсказкой: "Похоже, что вы стробируете партию ударных. Вот готовая версия. Это правильно?"
Конечно, благодаря штатным инструментам это займёт 3 минуты даже при необходимости небольшого ручного вмешательства. Но было бы здорово, если бы это произошло за 30 секунд и в каждом из требуемых сэмплов!
То, на что у человека ушло бы 1-2 дня работы, ИИ выполнил бы за пару часов. Скорость ИИ позволяет человеку, который сделал бы это вручную, иметь время на другие дела. Для меня это и есть использование ИИ в будущем: как инструмента.
Я думаю, что есть ещё несколько моментов, которые следует учитывать, когда речь заходит о возможностях ИИ и ниже я подчеркну их.
Нет смысла повторять, что эти возможности архи-полезны для ап-микса стерео-альбомов, мультитреки которых были навсегда утеряны. Да, можно сказать, что нынешние бытовые процессоры (железные и программные) тоже это делают, однако, они необучаемы.
Допустим, в оставшихся «по наследству» лентах мало дорожек, но много записанных на них инструментов (таких как, записи 50-х, 60-х годов, моно и концерты). Обучите искусственный интеллект тщательно отбирать отдельные инструменты / партии, чтобы получить отдельный трек под каждый инструмент для дальнейшей работы.
Тем не менее, помимо разделения каналов, пришла ещё одна идея: широкополосное шумоподавление, когда требуется полная точность результатов, без потерь и артефактов.
Да, уже есть несколько мощных инструментов, которые позволяют добиться потрясающих результатов при правильном подходе инженера! Например, iZotope RX для удаления артефактов с винила: песка и щелчков, по-прежнему являющиеся проблемой, требующей решения.
Однако, когда реставрирование старых записей поставлено на поток, а искажения настолько нелинейны, что в процессе теряется много данных, можно часто интерполировать данные, взяв «потери» из библиотеки данных, которую ИИ-бот сможет просмотреть.
С помощью примера кода он получит достаточно результатов, чтобы выявить концепции и структуры, которые люди использовали в прошлом и которые всё ещё могут быть очень полезны!
Если стоит выбор между «мы это потеряли» и попытаться хоть как-то восстановить «потерю», то я за попытку сделать это! Музыка по своей природе полна сюрпризов!
Сейчас ещё слишком мало людей готовы платить за это приличные деньги, поэтому, вероятно, потребуется слишком много усилий, чтобы должным образом оцифровать и обработать все записи 19, начала 20 веков и издать их в больших масштабах.
Michael Brückner - THREEQUENCES [Full Album]
Остаётся место и для курьёзов. А что, если..?
Давайте научим ИИ изменять голос одного исполнителя на голос другого. Допустим, голос великого Фредди встроим в музыкальные произведения других артистов или музыку, генерируемую искусственным интеллектом. Она уже стала настолько хороша, что её невозможно отличить от настоящей музыки для нетренированного уха.
Маленькое отступление в подтверждение этого!
Намедни мне попалась на глаза вот эта песня (и клип), созданные ИИ.
Illusions of Reality. Darkwave, future pop.
Мне настолько понравилась эта музыкальная вещица, что я кинулся гуглить, кто это. Поисковик подсказал вот этот альбом:
J.I.S - Illusions Of Reality (2013)
Проделав ещё несколько манипуляций, я прослушал одноимённую демо-запись и был шокирован:
во-первых, это не оно;
во-вторых, это ни в какое сравнение не идёт с творением ИИ, даже без оглядки на разницу в жанрах. «Электронный мозг» уделал творцов из J.I.S по всем параметрам.
Рукописи не горят…
Есть ещё одна категория музыкальных произведений, которые я бы назвал: «рукописи не горят», то есть неоконченные в связи со смертью автора.
Не знаю, кому как, но я бы хотел услышать недописанную музыку Рика Райта (Richard Wright – Pink Floyd), над которой он работал несколько лет для своего так и не записанного альбома. С ИИ и банком райтовских клавишных сэмплов и наработанных авторских приёмов, эту работу можно было бы закончить и воспроизвести в готовом виде, да ещё и с многоканальным миксом.
Как вам эта идея? – Не благодарите…
И снова: если мы не хотим ничего терять из наследия великих музыкантов.
Nautis & Deley - Aurora Reality [Chill Space Mix Series 152]
Итак, мои выводы:
1) Я вижу ИИ в качестве ассистента: "ИИ, пожалуйста, сделай акцент на акустической гитаре чуть больше. И, ради всего святого, перестань стонать от этого вокалиста".
Осторожное и продуманное использование этих инструментов в отдельных примерах всё же может дать результаты!
2) ИИ носит ярко выраженный прикладной характер и обладает потенциально бесконечным потенциалом для ведения рутинной работы, такой, как де-клиппинг, ап-семплинг, ап-микс и многое другое.
3) Результаты ИИ по своей природе непредсказуемы и невоспроизводимы. Кто-то должен контролировать результат, и этот человек должен быть осведомлён о том, как создать нужный результат.
- Похоже, что ещё нет способа точно настроить результат на микроуровне, который может потребоваться для настройки звука;
- ИИ, возможно, отлично справится с тем, чему он научился где-то ещё, но не может быть творческим. Таким образом, в конечном итоге он сможет создать микширование в стиле Стивена В. Тэйлера, которому до Стивена Уилсона ещё далеко. То есть первый рангом пониже второго, что по силам ИИ.
Stephen W Tayler Talks About OWOV
- Я за то, чтобы в некоторых случаях ИИ разбирал микс до отдельных инструментов и создавал новое сочетание этих инструментов. Сейчас это делают уже существующие программы демикширования DeMix Pro и LALAL, когда они используются для демикширования стереофонического трека и его ремикширования до версии 5.1.
Однако и тут требуются человеческие уши, суждения, опыт и слуховая хитрость, чтобы:
1 - Определить, когда разделение определённых инструментов просто недостаточно хорошо. Например, чем раньше была сделана запись, тем хуже было сведение.
2 - Иногда требуется слуховая хитрость, чтобы обмануть человеческое ухо и сгладить артефакты. Примем её, как человеческий "мастер объёмного звучания".
4) Поэтому я думаю, что ИИ может быть отличным инструментом, помогающим людям выполнять работу, которую они не хотят (повторяющуюся) или с которой им нелегко справиться (слишком много информации, чтобы разобраться).
5) По своей сути ИИ неразумен и никогда не сможет проявить творческий подход и не сделает ничего, кроме повторения части своего обучающего набора. Однако все надеются, что ИИ раздвинет свои границы и создаст что-то, на что он раньше не опирался.
6) Честно говоря, не хотелось бы, чтобы такие люди, как Стивен Уилсон, меняли свои рабочие места (я знаю, у него есть группа, но вы понимаете, что я имею в виду). Кроме того, ремиксы оригинальных мультитреков могут уйти в прошлое, поскольку крупные звукозаписывающие лейблы ухватятся за возможность избежать дорогостоящего поиска, реставрации и трансфера их в цифру.
7) С другой стороны, есть люди, которые хотят «поиграть в продюсера», не потому что умеют это делать хорошо, а просто могут, не вкладывая в это сил, в эти привлекательные инструменты, получать некий результат.
Это будет нехорошо, покуда не схлынет первая волна халтурщиков, и лучшая часть из них не достигнет достаточно приемлемого уровня.
8) Когда вы ознакомитесь с моими рецензиями на миксы, то увидите жалобы на большинство релизов, по крайней мере, те, которым я дал от 3 до 6 баллов. Человеческий фактор никуда не денется: критическое мышление управляет эмоциями.
Если это сделано человеком? Вежливые жалобы:
- "Я бы хотел, чтобы в окружении было больше экшена".
Сделано ИИ?
- "Зачем ты это так смешал, тупой ублюдок?"
Добавляйтесь в чат, чтобы помечтать о том, что ИИ даст (и не сможет) для наших музыкальных ДК.
Сравнится ли искусственный интеллект (ИИ) с человеческими способностями в области звукозаписи? Если да, то какими и в какой мере?
Как вы проголосуете?
Полезные для понимания темы многоканальной музыки (МК) и ДК статьи:
Почему объёмный звук не становится популярным среди меломанов?
Чего хотят люди от многоканальной музыки?
Домашняя замена лазера в Pioneer BDP-LX 55
Ремонт потухшего дисплея Blu-ray Pioneer BDP-LX 55, BDP-450, BDP-440
Сам себе мастер: замена блока лазерных головок в транспорте Pioneer BDP-LX 55
Surround Master! Неужели чудо свершилось?!
2.0 против 5.1 и аналог против цифры. Чья возьмёт?
Бандероль с 10 дисками SACD 4.0 из Великобритании. Распаковка.
Калибрую звук под своё помещение – Audyssey
Квадро 1970-х: история едва не потерянного чуда
Домашний CD ап-микс из 2.0 в 5.1, 103 серия: Kim Wilde "Teases & Dares" (1984)
Очередная "Тёмная сторона Луны" или снова тёмные хитрости шоу-бизнеса
С "Долби" Atmos и в шалаше… из фетра и палок
Почему я не люблю винил и считаю его тормозом прогресса (часть 1 из 2)
Почему я не люблю винил и считаю его тормозом прогресса. Альтернатива винилу (часть 2 из 2)
Действительно ли стерео – это хорошо? Баланс – основа основ.
Uriah Heep "The Best" MLP 5.1: Или как я оптимизирую дурные ремиксы
Получил ресивер Denon AVR-X4700H из Японии. Распаковка
Подписывайтесь на мой канал, расширяйте музыкальные горизонты вширь и ввысь! Слушайте любимую музыку в лучшем из форматов!
Обязательно посетите мой сайт, посвящённый этой теме, где можно приобрести фирменные многоканальные диски. Вступайте также группу в VK Multi-channel 5.1 Audiodisc
"Like - Лайк" и комментарии приветствуются: делитесь своими впечатлениями от услышанных ремиксов. Благодарю за Ваш интерес к многоканальной музыке!