Группа ученых из Китая и Сингапура продемонстрировала новый тип атаки на голосовые ИИ-системы. В обычный аудиоконтент (подкасты, музыку или фоновые видео) можно встроить неслышимые для человека звуковые сигналы, которые голосовой ассистент воспринимает как команды. Подтвержденные уязвимости исследователи нашли в продуктах Microsoft и Mistral AI. Метод основан на так называемом adversarial audio, то есть акустическом сигнале, который ИИ-модель распознает как команду, хотя человек его не слышит. Такой сигнал можно встроить в звуковой файл, который воспроизводится в фоновом режиме. Непосредственно взаимодействовать с жертвой при этом не нужно. По словам ведущего автора исследования Мэн Чэня, на подготовку такого сигнала уходит около получаса. После этого атака становится независимой от контекста и может сработать независимо от того, что говорит пользователь в момент воспроизведения. Главное техническое ограничение метода — для подготовки атаки нужен доступ к полным весам атакуемой модели.
Подкасты и видео смогли передать ИИ-ассистентам команды, которые не слышит человек
СегодняСегодня
1
2 мин