Найти в Дзене

Создан барьер для защиты от прослушивания речи умными колонками

Звук является важным источником информации, который позволяет алгоритмам распознавать поведение человека. Анализируя уникальные акустические сигналы, такие системы способны определять деятельность человека, будь то приготовление пищи, уборка квартиры или мытьё посуды. Эта технология полезна в ряде случаев, однако также создаёт серьёзные проблемы с точки зрения конфиденциальности, ведь чувствительные микрофоны собирают голосовую информацию, которую впоследствии можно анализировать. Команда исследователей Университета Карнеги-Меллон разработала новую технологию под названием Kirigami, предназначенную для устранения фрагментов человеческой речи ещё до начала процесса анализа поведения. Этот инструмент обеспечивает защиту личных данных пользователей путём блокировки голосовых сигналов непосредственно на устройстве перед отправкой собранных сведений. По словам аспиранта факультета компьютерных наук CMU Судашрана Буварагавана, данные, полученные из звука, играют важную роль в приложениях дл

Звук является важным источником информации, который позволяет алгоритмам распознавать поведение человека. Анализируя уникальные акустические сигналы, такие системы способны определять деятельность человека, будь то приготовление пищи, уборка квартиры или мытьё посуды.

Эта технология полезна в ряде случаев, однако также создаёт серьёзные проблемы с точки зрения конфиденциальности, ведь чувствительные микрофоны собирают голосовую информацию, которую впоследствии можно анализировать.

Команда исследователей Университета Карнеги-Меллон разработала новую технологию под названием Kirigami, предназначенную для устранения фрагментов человеческой речи ещё до начала процесса анализа поведения. Этот инструмент обеспечивает защиту личных данных пользователей путём блокировки голосовых сигналов непосредственно на устройстве перед отправкой собранных сведений.

По словам аспиранта факультета компьютерных наук CMU Судашрана Буварагавана, данные, полученные из звука, играют важную роль в приложениях для мониторинга активности, отслеживания состояния здоровья и даже изучения экологии. Но одновременно они представляют угрозу для личной жизни людей. Именно поэтому важно иметь возможность установки фильтра Kirigami на разнообразные устройства с микрофонами, обеспечивая дополнительную степень безопасности и конфиденциальности.

Большинство существующих методов защиты аудиоинформации полагаются на модификацию или преобразование исходных данных. Например, удаление определённых диапазонов частот из сигнала делает разговор практически неразборчивым человеком. Тем не менее, современные технологии искусственного интеллекта значительно усложнили ситуацию. Современные генеративные модели машинного обучения теперь способны реконструировать части разговора даже из частично обработанных аудиозаписей.

Доцент кафедры информатики Юврадж Агарвал подчёркивает, что объём данных, используемых современными моделями, настолько велик, что даже небольшие оставшиеся фрагменты информации могут позволить восстановить содержание разговора. Фильтр Kirigami решает эту проблему, исключая доступ моделей к этим данным, устраняя любые возможности восстановления речи.

Современные устройства, такие как смарт-колонки, зачастую жертвуют приватностью ради функциональности, фактически собирая всю возможную звуковую информацию. Хотя отключение микрофона кажется простым решением, оно существенно ограничивает полезность устройств. Исследователи предложили компромисс, представленный на Международной конференции по мобильным вычислениям и сетям ACM MobiCom’24.

Решение заключается в создании лёгкого фильтра, работающего даже на недорогих микроконтроллерах. Основная задача фильтра — идентификация и удаление элементов речи, чтобы предотвратить выход конфиденциальных данных за пределы устройства. Такая практика получила название обработка на периферии («edge processing»).

Система функционирует как простейший двоичный классификатор, определяющий наличие устной речи в сигнале. Она была разработана на основе анализа слабых мест современных систем автоматического распознавания речи на основе глубоких нейронных сетей.

Степень очистки звука регулируется вручную. Повышение уровня чувствительности увеличивает количество очищенной речи, но при этом возможно случайное устранение полезных окружающих шумов. Низкий уровень фильтрации, напротив, сохраняет больше фонового шума, улучшая работу приложения, но потенциально увеличивая вероятность утечки речевой информации.

Хаочжэ Чжоу, один из разработчиков проекта, подчеркнул, что фильтр эффективно устраняет значительную часть голоса, сохраняя при этом значимые шумы окружения, необходимые для точного определения деятельности. Таким образом, Kirigami способен интегрироваться с существующими системами для повышения уровня защиты.

Маянк Гоэль, доцент университета, утверждает, что потенциал Kirigami выходит далеко за рамки простого решения проблем параноиков относительно умных колонок. Система может применяться для поддержки людей с когнитивными нарушениями, отслеживать изменения в поведении детей с синдромом дефицита внимания и гиперактивности (СДВГ), выявлять ранние признаки депрессии среди молодёжи и многое другое.

По мере роста популярности Интернета вещей и умных домов необходимость в защите персональных данных становится всё острее. Разработчики утверждают, что Kirigami легко адаптируется под индивидуальные требования пользователей, предоставляя дополнительные меры контроля над конфиденциальностью и защитой собственных данных.