Найти тему
Международная панорама

Как технология распознавания лиц пробилась на поле боя на Украине

Американский интернет-журнал Slate опубликовал вчера интереснейшее интервью ведущей журнальной программы «Что дальше: подлежит уточнению» о технологиях, силе и будущем Лиззи О’Лири, которое, я думаю, заинтересует и моих читателей.

Результаты поиска в Findclone.
Результаты поиска в Findclone.

Когда российский военный корабль «Москва» затонул в Черном море к югу от Украины, на борту находилось около 500 членов экипажа. Российское государство устроило большую церемонию в память оставшихся в живых матросов и офицеров, находившихся на корабле. Но, учитывая, что история России не совсем правдива, когда дело доходит до подобных событий, многие люди задавались вопросом, были ли это настоящие моряки с «Москвы». И тут в дело вступает Арик Толер.

Толер является директором по исследованиям и обучению в Bellingcat, группе, которая специализируется на расследованиях с открытым исходным кодом и в социальных сетях. Он использовал программное обеспечение для распознавания лиц, чтобы идентифицировать мужчин на видео по изображениям в российских социальных сетях, и установил, что большинство мужчин действительно были моряками из Севастополя, города, где базировался корабль. Арик сознаёт, что сам по себе этот обрывок информации не изменит ход войны, но это крошечное мгновенное прояснение в тумане часто затемняемой картины.

В воскресном выпуске «Что дальше: подлежит уточнению» я поговорила с Толером о том, как технология распознавания лиц используется на Украине неожиданным, а иногда и тревожным образом.

Лиззи О’Лири: Один из основных инструментов распознавания лиц, который вы используете в своей работе — тот самый, который вы использовали для исследования видео с русскими моряками, — это программа под названием Findclone. Она дшёвая, около 5 долларов в месяц, и на неё легко подписаться. Как работает Findclone?

Арик Толер: В какой-то момент, где-то в 2018 году, один или несколько парней, которые им управляют, обчистили практически всю сеть ВКонтакте — российский Facebook. У неё сотни и сотни миллионов пользователей. Она чрезвычайно популярна. Они удалили каждую фотографию с сайта. Затем они взяли эти миллиарды фотографий и запустили алгоритм машинного обучения, чтобы действительно хорошо распознавать лица. Они смогли связать каждую фотографию с ее исходным постом и профилем. Так что каждое отдельное фото в ВК было пропущено через рингер машинного обучения по распознаванию лиц и выложено на сайт, так что можно поставить туда лицо и поискать по нему. Преимущество этого заключается не только в том, что вы ищете лицо и видите профиль человека, что происходит примерно в 50% случаев. Чаще бывает так, что мы много работаем с русскими шпионами и сотрудниками спецслужб — людьми, у которых обычно нет аккаунтов. Но они есть у их жён. И у их старых университетских приятелей, и у их братьев, и у их мам, и у их детей. Они мелькают на заднем плане фотографий на вечеринке по случаю дня рождения, их лица можно увидеть за тортом. Затем вы смотрите на имя и личность человека, загружающего фотографию, и можете понять, что это они, потому что у них одинаковая фамилия или они живут в одном городе.

Каково это, использовать такие инструменты? Это интересно? Страшно?

В первый раз, когда вы используете его, ваш мозг взрывается, потому что вы думаете, как это возможно? Неужели это так просто? Вы просто используете Findclone — и всё готово. Вот профиль. Там их семья. У нас есть какой-то шпион, которого мы искали месяцами, и у нас есть фото на паспорт, и внезапно всё открывается. Это также очень жутко, потому что вы проводите обыски и вылавливаете всех этих невинных прохожих. Вы находите их семьи, людей, которые понятия не имеют или имеют ограниченное представление о том, кто эти люди, которых мы ищем. Вы чувствуете, что видите их жизнь так, как не должны видеть. Но благодаря этой технологии это возможно.

Но дело не только в технике. Это также возможно из-за конкретной среды, в которой вы работаете. Российский Интернет, особенно когда речь идет о данных и конфиденциальности, очень далёк от американского.

Из России происходят постоянные, постоянные, постоянные утечки данных. Массовые утечки. Весь госреестр автомобилей, зарегистрированных в Москве за три года, просочился, так что если у вас есть машина в Москве, то ваш номер паспорта, ваша дата рождения, ваш адрес, ваш номер телефона общедоступны и есть в сети. Россия — это какой-то дикий, дикий Восток в отношении конфиденциальности данных и законодательства о данных, потому что их практически нет. Около года назад примерно за 50 баксов можно было купить записи чьих-то мобильных телефонов. Есть много историй о жёнах, которые думают, что их мужья им изменяют, и они покупают данные мобильного телефона своего мужа и видят, что тот звонил какой-то женщине в 2 часа ночи, и они убеждаются, что те им изменяют. Этого в США вообще нет.

В США много разговоров, особенно о технологии распознавания лиц, касались внутренней полиции и сбора данных. Как бы вы описали роль, которую та же самая технология играла в войне за последние несколько лет?

Россия здесь действукт по-своему. В России существует множество сервисов распознавания лиц, и они уже много лет используются на войне. По сути, с тех пор, как эти сервисы начали появляться примерно в 2016-2017 годах, люди использовали их для идентификации солдат. Особенно на начальном этапе войны, когда Россия вообще отрицала своё участие в войне (речь идёт о Донбассе в 2014 г. — Прим. А.Ж.), люди запускали их на бойцов и солдат, чтобы доказать, что они русские наёмники, солдаты или кто-то ещё. Это не совсем яблоко к апельсину, если сравнить, как это используется полицией США и правительственными войсками в США и, возможно, в Великобритании и Европе.

Я ненавижу использовать фразу «идеальный шторм», но в некотором смысле она кажется применимой, потому что вы говорите о месте с совершенно другой культурой данных и восходящими возможностями для использования таких вещей, как Findclone. Просто существует очень много разных его перестановок.

Да, это как четыре или пять вещей, которые бьют по ней одновременно. И еще одно, что вы можете добавить к этому, это просто мелкая коррупция. Это главная причина, по которой так много этих данных находится в открытом доступе: люди, которые слили эту информацию только потому, что их зарплаты недостаточно высоки, поэтому на стороне они обращаются к базам данных и продают данные. Многие спрашивают: «Почему бы вам не сделать это для ЦРУ? Почему бы тебе не выбрать Моссад, МИ-6 или кого-то ещё»? Ну, знаете, было бы здорово, если бы мы могли, но таких обстоятельств не существует в основном больше нигде на земле, этого идеального шторма данных.

В последнее время обстоятельства немного осложнились. Украинское правительство начало сотрудничество с Clearview AI, американской компанией, занимающейся распознаванием лиц. Clearview печально известен тем, что сотрудничает с правоохранительными органами и извлекает фотографии людей из Интернета без их согласия. Компания заявляет, что бесплатно предлагала свои услуги пяти украинским госорганам. Согласно многочисленным новостным сообщениям, это привело к тому, что украинские солдаты сканировали лица погибших россиян, чтобы установить их личности, а затем связывались с их семьями.

Они опубликовали видео об этом, показав разговоры, которые они вели с матерями погибших солдат. Это что-то вроде злорадства — это должно выглядеть так: посмотрите на их страдания, посмотрите на семью, посмотрите на мать, потрясенную и напуганную смертью сына. Это своего рода самая запутанная и худшая версия этого, но я думаю, что есть некоторые случаи, которые можно было бы назвать доброкачественными хорошими случаями.

Я думаю, в прессе есть рассказы о своего рода «хорошем варианте использования» распознавания лиц в этой войне, возможно, на стороне Украины. Как человек, работающий в «серых зонах», как вы реагируете на то, что появляется вся эта разная информация?

Распаковать действительно сложно. Гнусным и сомнительным является то, что украинские солдаты связываются с семьями погибших солдат, чтобы беспокоить их и издеваться над ними. Доброжелательным или хорошим вариантом использования является то, что украинско-российские независимые журналисты пытаются связаться с семьями, чтобы поговорить о том, получили ли они компенсацию за смерть, знают ли они вообще о ней, велело ли им правительство молчать?

Как вы думаете, смогут ли когда-нибудь обычные люди использовать распознавание лиц в США так же, как в России?

Всё, что требуется, — это одна большая куча фотографий из Instagram или Facebook, а затем эту технологию можно применять. Такого уровня, как в России и на Украине, никогда не будет, просто потому, что эти страны настолько коррумпированы и прогнили, с утечками данных, коррупцией и всем прочим. Но у нас есть своя американская версия этого, у нас много доступа к коммерческим приложениям и провайдерам, которые в какой-то момент могут просочиться.

Есть миллион примеров, когда люди покупают коммерческие данные. Это законно. Так не должно быть, но это законно. Вы можете покупать данные о геолокации людей в различных приложениях, которые их отслеживают. Наиболее известен случай, когда кто-то смог купить геолокационные данные, полученные от Grindr. И они использовали это, чтобы разоблачить католического священника. Если мы когда-нибудь доберемся до этой сингулярности данных, доступных для всех, это, вероятно, будет связано с какой-то утечкой или продажей данных через коммерческие приложения, связанные с вашим лицом. Может быть, есть большая свалка данных из Facebook или LinkedIn. Если бы это случилось с Facebook, я думаю, мир сгорел бы от того, как люди будут его использовать.

Работа Timnit Gebru, Joy Buolamwini и других показывает, что распознавание лиц хуже работает на более тёмных тонах кожи. Это то, о чем я много думаю, если мы думаем об американской заявке. Как раса вписывается в эту картину?

Это определенно проблема, потому что эти вещи чаще всего тестируются на белых людях. Это то, с чем я часто сталкиваюсь, когда запускаю Findclone на людях, которые не являются этнически русскими или белыми. Россия очень разнообразная страна с сотнями рас, национальностей и религий. Иногда я запускаю распознавание лиц для людей с Дальнего Востока, таких как буряты, этническая группа, расположенная рядом с Монголией, и результаты намного хуже, чем если бы я работал с этническим русским человеком. Если я запущу распознавание лица чернокожего человека на Findclone, это вызовет Барака Обаму и игроков НБА. Это в основном потому, что в России не так много чернокожих.

Этому обучали ИИ.

Точно. Так что данные не так хороши.

Я поражен напряжением между двумя вещами, которые вы сказали. Номер один: «Это произойдет. Эти инструменты получат более широкое распространение», но также: «Если бы это случилось с Facebook, мир сгорел бы дотла».

Он уже существует за закрытыми дверями. Google, Facebook, Amazon, Microsoft, все эти места уже имеют чрезвычайно мощное распознавание лиц, которое работает. Это что-то вроде плотины. Плотина может разрушиться, если этот материал станет коммерчески доступным. Все, что для этого нужно, — это один человек на GitHub плюс утечка данных. И как только это произойдет, пиши пропало.

© Перевод с английского Александра Жабского.

Оригинал.

Приходите на мой канал ещё — буду рад. Комментируйте, подписывайтесь, предлагайте темы обзоров!

Начал работу мой Telegram-канал международной аналитики и контрпропаганды «Сегодня в мире».

Приглашаю также на мой официальный сайт https://www.zhabskiy.ru