Найти тему

Законы музыки, ч.4: Может ли компьютер написать МУЗЫКУ?

Оглавление

Ранее я задался рядом вопросов, в числе которых: как музыка влияет на наше настроение? Почему определенные мелодии, структуры, ноты, сочетания, гармонии вызывают соответствующие им определенные чувства? Есть ли законы, описывающие этот процесс? Можно ли их описать математически? И если да, то как скоро искусственный интеллект начнет писать музыку, неотличимую от человеческой? Или это уже происходит? Я попробую поискать ответы, выудить правду, привести примеры и порассуждать в этой серии статей. Я уже рассмотрел влияние музыки на настроение, её связь с антропологией и связь с математикой. Всё это было необходимо для того, чтобы ответить на вопрос: способен ли компьютер написать музыку?

Что имеем

Ранее я пришел к выводу, что музыка влияет на настроение коренным образом. Я выяснил, что у человека существуют определенные музыкальные паттерны, которые формировались тысячелетиями вместе с развитием человека и цивилизации. Также мне удалось узнать, что ноты, аккорды, гармонии, тональности, миноры и мажоры и даже целые произведения, записанные на нотном стане, можно выразить математически; что есть некоторая закономерность в том, что определенные гармонии, сочетания нот и построения вызывают определенные чувства.

Однако последний пункт изучен не до конца. Человечество не знает механизма этого воздействия, почему так происходит. У исследователей имеется некоторая база знаний в этом вопросе, построенная на наблюдении, однако закономерность так и не была получена. И пока это наравне с отсутствием полноценного ИИ — главное препятствие в том, чтобы компьютер научился писать музыку, неотличимую от человеческой. Давайте в это углубимся.

Как написать хит

Еще в начале нулевых я задумался, есть ли какой-то алгоритм, формула, или хотя бы схема, которая помогла бы написать хит. И тогда я заметил, что самые часто ротируемые и самые популярные песни на тот момент имели одинаковое построение. Возьмите Gangnam Style (강남스타일) корейского исполнителя PSY, песню LMFAO — I'm Sexy And I Know It, хит Рианны и Кельвина Харриса We Found Love, бэнгер David Guetta - Titanium. Они построены по одной схеме: схематичный главный мотив —> вокальное вступление —> вокальная подводка —> танцевальная инструментальная часть. Повторить два раза и не смешивать.

Есть еще пара схем. Например, у исполнителя Flo Rida чуть менее ВСЕХ песен строятся по принципу "хук с мелодичным сэмплом + речитатив"x2/x3/x4.

В конечном итоге получится не больше пяти формул для создания хита. А учитывая, что сегодня музыка довольно простая, то выразить эти формулы через математическую модель не составит труда. Соответственно, имея эту модель, математическое обоснование благозвучности (смотри об этом здесь), вокалистов и некоторый объём данных о влиянии определенных звуковых сочетаний на человека, хороший компьютер вполне сможет генерировать тысячи треков в день. Проблема будет только в том, чтобы выбрать из них хорошие, ведь не имея всех данных о том, каким законам подчиняется связь математика—музыка—человек, компьютер будет ошибаться. Поэтому даже здесь необходим проверяющий орган в виде продюсера, композитора, профессионала.

И мне кажется, что сейчас такие технологии уже используются. Как минимум потому, что последние -дцать лет формулы успеха не меняются. Тот же bad guy Билли Айлиш построен по той же схеме, что упомянутый Gangnam Style. Сместился только приоритет — если в 2012 в первой десятке Billboard Hot 100 не было ни одного хип-хоп-исполнителя, а большинство треков, даже с речитативом, носили электронный окрас, то в 2019 первая десятка наполовину состоит из рэперов, а чарт сильно ушел в сторону рэпа и хип-хопа. Попса сегодня замедляется и раскачивается, но это уже другая тема.

Нейросети

В десятых годах свою долю хайпа словили нейросети — одно из направлений искусственного интеллекта, цель которого — смоделировать аналитические механизмы, осуществляемые человеческим мозгом. Задачи, которые решает типичная нейросеть — классификация, предсказание и распознавание. У нас есть картины, нарисованные нейросетью, приложения, которые нас состаривают прямо в смартфоне, программное обеспечение, которое способно распознавать человека по лицу и даже по походке. В конце концов, у нас есть примеры, когда нейросети записывали музыкальные альбомы.

Так, в 2017 году сотрудники Яндекса Иван Ямщиков и Алексей Тихонов обучили нейросеть сочинять стихи в стиле культового гранж-музыканта Курта Кобейна и написали к ним музыку в духе Nirvana. Исполнил песни американский певец Роб Кэррол. Послушать результат можно ниже.

Здесь стоит отметить, что нейросеть сочинила только тексты, изучив тексты настоящей Nirvana и около 200 МБ английской поэзии. Остальное — музыка, аранжировка, вокал — дело рук человека, что неудивительно. Сегодня компьютер не в состоянии понять, что такое "грязные гитары", и как это понятие применимо к гранжу. И вообще, на мой взгляд, компьютер пока слабо ориентируется в жанрах и инструментале.

По тому же принципу создавался альбом Нейронная оборона — 404, записанный в стиле Гражданской обороны.

Нейросеть не может выдать осмысленный и связный текст. Мы собирали стихи по одной строчке. Видим интересную строку — оставляем, ищем ей "пару" и так далее. Видим неинтересную — пропускаем. Но мы ничего не дописывали, все, что есть в текстах "Нейронной обороны", создано нейросетью. Потом мы сочиняли музыку и сами исполняли песни. — Иван Ямщиков.

Иван Ямщиков, один из создателей нейросети Яндекса, в интервью РИА «Новости» сообщил:

Главное помнить, что нейросеть — это не персонаж. Это просто тип алгоритма, инструмент, созданный для решения той или иной задачи. Как именно формулировать проблему, условия, ограничения, где брать данные для обучения? Со всеми этими вопросами, к примеру, сейчас работает человек.

Помимо текстов нейросеть смогла написать и нечто похожее на классическую музыку. И этот процесс доказывает, что пока рано говорить о том, чтобы компьютер сочинял "человеческую музыку". В апреле 2020 издание ТАСС рассказало о пьесе "Цифровой восход", которая вошла в альбом "Нечеловеческая музыка". В нем нейросеть выступила соавтором. Для создания пьесы она обработала 4 гигабайта классической музыки от Баха и Шнитке до Прокофьева и Шостаковича. Так появились мелодии, которые в единое произведение собрал композитор Кузьма Бодров:

Разработчики сами работали с нейросетью, а я получил от них 20–25 аудиодорожек — каждая примерно по три минуты. Большая часть из них — бессвязные. Но я вычленил три-четыре интересных мотива — этого было достаточно — и дал им развитие и форму. Эти мотивы — странные, я бы так не придумал, но в них были какие-то проблески интонаций, которые меня зацепили".
Иногда две недели можно только искать идею — с чего начать? Здесь же миллиарды вариантов. А в этом случае мне не нужно было придумывать — основа дана.

В прошлом году компания Google также удивила. В честь дня рождения Баха их "дудл" генерировал произведения на основе нот пользователя в стиле великого композитора. Люди могли придумать свою мелодию, а алгоритм делал её похожей на композиции Баха.

Интересный эксперимент на эту темы провел канал DISTRICT 23. Парень решил доверить написание песни нейросетям. Он воспользовался приложением Mubert — генератором музыки в реальном времени, сайтом These Lyrics Do Not Exist, который генерирует оригинальные неповторяющиеся тексты на заданную тему, использовал генератор случайных слов и случайных чисел, а также программу Vocaloid, которая имитирует вокал человека под заданную мелодию с заданным текстом. Финальный мастеринг он также доверил стороннему ПО — онлайн-сервису emastered. Парень проделал несколько манипуляций с тем, чтобы наложить слоги на мелодию и получил какой-никакой трек. Как видно, и здесь не обошлось без участия человека, однако оно было минимизировано.

Заключение

На самом деле, для того, чтобы компьютер написал хорошую "человеческую" музыку, он должен не просто следовать алгоритмам, но и понимать эмоциональный окрас, чтобы успешно его выражать и таким образом воздействовать на слушателя. Мозг человека состоит из 100 миллиардов нейронов. Он включает в себя более 100 триллионов нейронных связей (синапсов). Новые нейронные связи в мозгу формируются каждый раз, когда происходит процесс запоминания. Пока компьютер не построит такую же модель, он не сможет мыслить также, как человек. Современные технологии еще не обладают подобной мощностью. Решать задачи и играть в шахматы — это другое, это всё ещё алгоритмы и теории вероятностей, как и нейросети. Искусственный интеллект куда сложнее.

Но даже когда мы получим модель компьютера, способного думать, как человек, остается ряд вопросов. Сможет ли он осознать себя? Сможет ли он испытывать эмоции? И даже если ответ "да", мы не знаем, сможет ли он написать музыкальное произведение, ведь мы не знаем, с чем связана тяга к творчеству в целом. Почему человек пишет картины, создает скульптуры и музыку. Связано ли это только лишь с мозгом и его деятельностью, или процесс созидания и креатива лежит гораздо глубже простых нейронных связей, затрагивая такое понятие как "душа". Надеюсь, что я успею узнать ответ на этот вопрос на своем веку.

P. S. Не стесняйтесь ставить лайк и делиться своим мнением по поводу искусственного интеллекта и музыки в комментариях.

Сергей П.