Добавить в корзинуПозвонить
Найти в Дзене

Как защитить свою музыку от ИИ, часть 3

Теперь поговорим про технологию защиты, построенную на "отравлении датасета". Реализуется она с помощью нейросетей, так что в этом случае мы будем "вышибать клин клином". Пока что эта технология достаточно молодая, и доступных для использования сервисов не много. Я выделил для себя два: 🎛 Сервис iCloak, базирующийся на HarmonyDagger. Подписка на сервис стоит 10$ в месяц, в эту стоимость входит защита 15 треков. При желании вы можете самостоятельно установить и настроить HarmonyDagger (об этом я напишу ниже), но придётся разбираться с Python, и запускать всё это из командной строки. 🎛 Сервис ArtyShield, запустившийся буквально месяц назад и включающий в себя не только инструменты для защиты музыки и голоса, но и качественный механизм распознавания ИИ-шных треков. Я проверил его на тестовых файлах и треках, сгенерированных в SUNO. ИИ-шные треки он распознаёт безошибочно. Подписка на сервис также стоит 10$ в месяц. Количество защищаемых треков будет примерно таким же как и в iCloak.

Как защитить свою музыку от ИИ, часть 3

Теперь поговорим про технологию защиты, построенную на "отравлении датасета". Реализуется она с помощью нейросетей, так что в этом случае мы будем "вышибать клин клином". Пока что эта технология достаточно молодая, и доступных для использования сервисов не много.

Я выделил для себя два:

🎛 Сервис iCloak, базирующийся на HarmonyDagger. Подписка на сервис стоит 10$ в месяц, в эту стоимость входит защита 15 треков. При желании вы можете самостоятельно установить и настроить HarmonyDagger (об этом я напишу ниже), но придётся разбираться с Python, и запускать всё это из командной строки.

🎛 Сервис ArtyShield, запустившийся буквально месяц назад и включающий в себя не только инструменты для защиты музыки и голоса, но и качественный механизм распознавания ИИ-шных треков. Я проверил его на тестовых файлах и треках, сгенерированных в SUNO. ИИ-шные треки он распознаёт безошибочно. Подписка на сервис также стоит 10$ в месяц. Количество защищаемых треков будет примерно таким же как и в iCloak.

Для технического тестирования я использовал те же аудиофайлы: синусоиды с частотой 100, 1000, 10000 Гц, и треугольный сигнал с частотой 220 Гц, пятым файлом был полностью сведённый и отмастеренный трек. "Защищённые" сервисами файлы я сравнил с оригиналами на слух и по спектроанализатору.

Результаты работы сервисов оказались для меня достаточно противоречивыми. В обоих случаях в файл добавляется специфический шум, который по заявлению разработчиков не слышит человек, но "слышит" нейросеть. Так вот, с тем, что человек его не слышит, я не соглашусь. Вносимые искажения хорошо слышно и на единичных сигналах, и даже на полностью сведённом и отмастеренном треке, особенно в моменты резких динамических перепадов.

На среднем уровне защиты (установлен по умолчанию), результаты работы ArtyShield оказались вообще не особо применимы, так как алгоритм внёс значительные искажения в звук, и справиться с этим получилось лишь установив минимальную силу защиты. У iCloak результат оказался значительно лучше. Поэтому после базовых тестов я сосредоточился на более глубоком исследовании HarmonyDagger, на котором базируется iCloak. В отличие от сервиса, при работе с HarmonyDagger из командной строки, у вас будет больше вариантов тонкой настройки алгоритма для минимизации слышимых артефактов. Кроме того, это ещё и бесплатно.

У HarmonyDagger также есть несколько дополнительных фишек — фазовая девиация, мешающая разделять трек на стемы, и временное маскирование, уменьшающее количество артефактов для материала с большим динамическим диапазоном. Я попробовал различные варианты настроек и в итоге нашёл вполне устраивающий меня вариант, при котором артефакты практически не слышны, особенно если не знаешь, что надо слушать.

Обработанные файлы я протестировал в сервисе MusicFlamingo, который позволяет, в том числе, генерировать промты для SUNO и подобных сервисов, путём анализа уже готовых треков. При попытке анализа защищённых файлов, MusicFlamingo выдавал явно искажённые результаты, что говорит об успешном нарушении работы нейросетевого алгоритма анализа. Причём, для треков, защищённых HarmonyDagger, он ошибался даже с определением стиля, темпа и тональности.

Вывод: "Отравление датасета" является перспективной, но пока ещё молодой и неотработанной технологией. С точки зрения защиты от обучения ИИ она эффективней звуковых ватермарок, однако приводит к деградации качества звука, особенно на материале с широким динамическим диапазоном. В этом случае вам однозначно придётся делать несколько копий мастера — один для выгрузки в интернет, второй для записи на физические носители. С практической точки зрения, именно эта технология даёт хоть какую-то гарантию того, что куски ваших треков не всплывут в чьих-то нейрогенерациях. И доказывать в суде тут тоже никому ничего не придётся.

⚠️ Делитесь постом с друзьями и коллегами, чтобы все знали, как можно защитить свою музыку и противодействовать творящемуся вокруг ии-безумию.

🔊 Создание звука с Андреем Девятых

#нейросети #нейросетевое #ии #музыка #защитамузыки #авторскоеправо