Генерация речи и клонирование голоса — две области, на которые негативно повлиял ИИ. Это привело к рискам мошенничества и распространения дезинформации. Для решения этой проблемы исследователи из Meta разработали AudioSeal — технологию аудиоводяных знаков, предназначенную для локализованного обнаружения речи, сгенерированной ИИ.
Алгоритм вставляет в сгенерированный звук сигнал, который не слышен человеческим ухом, но может быть обнаружен специальными алгоритмами. Однако существующие методы водяных знаков не адаптированы для обнаружения и не локализованы, то есть они анализируют весь звук, что затрудняет идентификацию фрагментов речи, сгенерированной ИИ, в целом клипе.
AudioSeal тренирует две модели — генератор и детектор. Генератор создаёт сигнал водяного знака, а детектор сообщает вероятность наличия водяного знака. Модель детектора была обучена путём маскировки водяного знака в случайных участках звука, что помогает ей точно обнаруживать синтезированную речь в более длинных аудиоклипах.
Модель AudioSeal также расширили до многобитового водяного знака, что позволяет приписывать аудио конкретной модели или версии без влияния на сигнал обнаружения.
Результаты оценки показывают, что AudioSeal значительно превосходит модель WavMark по скорости вычислений и достигает в два раза более быстрого обнаружения. Он также продемонстрировал лучшую устойчивость к широкому спектру аудиоманипуляций с точным обнаружением незначительных изменений в аудио. Исследователи изучили влияние преднамеренных атак, когда злоумышленник имеет доступ к детектору и поняли, что ошибка обнаружения может быть увеличена на 80%. Они пришли к выводу, что для ограничения воздействия таких атак веса модели детектора должны оставаться конфиденциальными.
Очередная якобы человеколюбивая фича, которую как обычно продадут множеству других компаний для обнаружения и блокировки бесплатного ИИ контента, дабы конечный пользователь платил больше.
Meta — запрещена на территории РФ
👉🏽 Дориан ВКонтакте
👉🏽 Дориан Telegram
Meta* представила первый метод аудиоводяных знаков, разработанный специально для обнаружения речи, сгенерированной ИИ
26 февраля 202426 фев 2024
7
1 мин