Впечатляющая новая система искусственного интеллекта от Google может генерировать музыку в любом жанре по текстовому описанию. Но компания, опасаясь рисков, не планирует выпускать его в ближайшее время.
Названная MusicLM, Google, безусловно, не первая система генеративного искусственного интеллекта для песни. Были и другие попытки, включая Riffusion, ИИ, который сочиняет музыку, визуализируя ее, а также Dance Diffusion, собственный AudioML от Google и Jukebox от OpenAI. Но из-за технических ограничений и ограниченных данных для обучения ни один из них не смог создать песни особенно сложные по композиции или с высокой точностью воспроизведения.
MusicLM, пожалуй, первый, кто может.
Как подробно описано в академической статье, MusicLM был обучен на наборе данных из 280 000 часов музыки, чтобы научиться генерировать связные песни для описания — как выразились создатели — «значительной сложности» (например, «очаровательная джазовая песня с запоминающимся саксофонным соло и сольный певец» или «берлинское техно 90-х с низким басом и сильным ударом». Его песни, что примечательно, звучат примерно так, как может сочинять человек-артист, хотя и не обязательно столь же изобретательно или музыкально связно.
Трудно оценить, насколько хорошо звучат сэмплы, учитывая, что в цикле нет ни музыкантов, ни инструменталистов. Даже при подаче несколько длинных и извилистых описаний MusicLM удается уловить такие нюансы, как инструментальные риффы, мелодии и настроения.
Возможности MusicLM не ограничиваются созданием коротких клипов из песен. Исследователи Google показывают, что система может основываться на существующих мелодиях, будь то напевание, пение, насвистывание или игра на инструменте. Более того, MusicLM может взять несколько последовательно написанных описаний (например, «время медитировать», «время просыпаться», «бег», «время выложиться на 100%») и создать своего рода мелодическую «историю» или повествование, продолжительностью до нескольких минут — идеально подходит для саундтрека к фильму.
Тем не менее, исследователи Google отмечают множество этических проблем, связанных с такой системой, как MusicLM, в том числе тенденцию включать защищенный авторским правом материал из обучающих данных в сгенерированные песни. Во время эксперимента они обнаружили, что около 1% музыки, сгенерированной системой, было напрямую воспроизведено из песен, на которых она обучалась — порог, по-видимому, достаточно высокий, чтобы отговорить их от выпуска MusicLM в его текущем состоянии.
«Мы признаем риск потенциального незаконного присвоения творческого контента, связанного с вариантом использования» — написали соавторы статьи. «Мы настоятельно подчеркиваем необходимость дальнейшей работы по устранению этих рисков, связанных с созданием музыки».
#ии #ai #нейросеть #google #искуственный_интеллект #chat #chat_gpt #open_ai #new #it #news #новости
2 минуты
4 февраля 2023