Найти тему
Цифровой чай

Если бы фотографии могли говорить

Оглавление

Исцелю по фотографии. Так говорят ясновидящие и прочие экстрасексы.
Воспроизведу разговор по фотографии. Так говорят учёные.
Фантастика? "Ну, мы уже это сделали", —
говорит профессор Северо-Восточного университета в США Кевин Фу.

О чём речь?

Профессор Фу и его команда нашли способ восстановить из фотографий или видео речь, звучавшую в момент съёмки. Суть метода в следующем. Когда вы снимаете на телефон, вибрации голоса рядом с камерой провоцируют крошечные искривления света, которые фиксируются на снимке или видео. Дело в том, что камеры почти всех современных смартфонов имеют функцию стабилизации: объектив "подвешен" на пружинках, которые компенсируют дрожание рук при съёмке и позволяют делать более чёткие снимки. И именно на эти чувствительные пружинки (и как следствие — объектив) оказывают влияние вибрации голоса рядом с камерой. Это создаёт искажения на снимке, исчезающе малые — но не для того, кто знает, что именно он на картинке ищет и имеет при этом инструмент для обработки такой "мелочи". А для обработки этой информации исследователи разработали и обучили специальную нейросеть, которую назвали Side Eye ("Боковое зрение"). Side Eye определяет слова человека, говорящего в комнате, где была сделана фотография, и его пол (по тембру голоса). Нейронка может даже идентифицировать конкретного человека, если ранее она была обучена его голосу, хотя эта функция пока работает не очень хорошо.

Что нам здесь важно?

С точки зрения кибербезопасности Side Eye открывает совершенно новый класс угроз, который должны иметь в виду и эксперты по инфобезу, и обычные пользователи. Для специалистов это важно тем, что при должном уровне развития таких технологий визуальные каналы утечки информации смешиваются с акустическими, что потребует переработки ряда действующих моделей угроз. А обывателю теперь стоит иметь в виду, что выложенный в соцсеть видеоролик с музыкой, наложенной вместо звукового ряда, всё равно может поведать, о чём говорили во время его съёмки. Равно как и фотки со вчерашней вечеринки.

Кроме того, по мере своего развития данная технология может породить новый вид цифровых доказательств для судебной системы, если будет создана соответствующая экспертная и правовая база. Ведь если по фотографии или видео, сделанным в известное время и в известном месте, можно будет достоверно определить наличие рядом с камерой конкретного человека или его слова, то это создаёт новые возможности для адвокатов и прокуроров (про оперов и говорить не стоит)ю.

Можно ли защититься?

С технической точки зрения обращают на себя внимание следующие моменты.

Во-первых, не вполне ясен вопрос, какой продолжительности речь "сохраняется" на фотографии. Если с видео всё понятно, то с фото предел, очевидно, есть. И даже если продолжительность больше, чем время открытия затвора фотокамеры, это время всё равно ограничено, что должно учитываться в методах противодействия.

Во-вторых, текущая технология работает благодаря наличию в камерах системы стабилизации. Логично предположить, что снимки, сделанные на камеры без стабилизатора, будут не подвержены этому методу съёма звука. Сюда же — стабилизаторы иного принципа действия, без пружин (как в сменных объективах фотокамер). Впрочем, вибрации голоса оказывают влияние и на сам корпус фотоаппарата, т.ч. возможно, речь идёт лишь о том, насколько микроскопическое воздействие это оказывает на снимок, и каков должен быть уровень технологии, чтобы это воздействие распознать.
Ящик Пандоры открыт.

В-третьих, логично предположить, что со временем появится и контр-технология. Специальное зашумление. Ведь если мы понимаем, какие именно изменения наша камера вносит в снимок под воздействием голоса, то можно добавить в этот снимок аналогичные компенсирующие или искажающие изменения. Впрочем, будет ли такая технология достаточно дешёвой для массового использования — вопрос открытый.
А миллионам снимков, уже сделанных и выложенных в соцсети это и вовсе не поможет. То-то будет любителей поковыряться в "говорящих" фотографиях на чужих стенах.

Не так давно мы
обсуждали, как можно подслушать набираемый вами на клавиатуре текст. И вот подвезли ещё один неочевидный метод снятия информации. Мир прозрачно намекает, как важно держать руку на пульсе в современных условиях стремительного развития технологий.
На связи!

================
Подписывайтесь на
Telegram-канал "Цифровой чай". Про IT доступно.