Найти в Дзене
80 подписчиков

На днях один из подписчиков (Aamir Khan) поделился webui для генерации музыки и я вчера радостно на весь день залип.


Это тоже MusicGen, но в вариантах расшаренных до этого (1, 2, 3, 4, 5) в основном использовался Hugging Face, вкладка с которым, как выяснилось опытным путём, после нескольких генераций начинает дико нагружать проц.

Интерфейс от CoffeeVampir3 намного ловчей:

* Работает локально
* Модели всех размеров (small, medium, large) подгружаются сами при первом использовании
* Можно ставить треки в очередь
* Можно генерить на основе своей мелодии
* Справа можно послушать, что сгенерил
* Нагружается только видюха, а не проц

Чем больше модель, тем лучше качество звучания, но тем и требовательней она к железу и генерация может занять больше времени.

Установка:

1) Создаём папку на компе и в адресной строке (C:\MusicGen или где вы её сделали) пишем cmd
2) В открытой командной строке пишем git clone https://github.com/CoffeeVampir3/audiocraft-webui.git чтобы скопировать webui к нам на комп
3) Идём вглубь скопированного webui командой cd audiocraft-webui
4) Далее устанавливаем необходимые для webui вещи командой pip install -r requirements.txt

Готово — запускаем проект командой python webui.py (не обращаете внимание на ошибку про тритон, фласк и дебаг мод)
Веб интерфейс открывается по адресу http://127.0.0.1:5000/

Чтобы генерить на основе своего трека в Model выберите Melody и укажите путь к треку.

Как параметры Top-K, Top-P, и прочие влияют на звук не ясно, экспериментируйте.

Музыка сохраняется в папку statc/audio/ , либо вы можете её правым кликом в webui сохранить куда вам угодно.

Важно отметить, что лицензия софта не позволяет использовать сгенерированное в коммерческих целях. Вот только как они будут определять, что сгенерировано?

В общем, для создания полноценных треков оно пока не годится, а вот семплы пилить, вполне себе. Да тут нет гибкости и их надо мастерить, но это уже ускорение процессов для артистов и существенное снижение планки входа для тех, кто только начинает.


Больше интересностей у меня в телеге Psy Eyes.
На днях один из подписчиков (Aamir Khan) поделился webui для генерации музыки и я вчера радостно на весь день залип.
00:23
1 минута