С помощью системы автоматического распознавания лиц в Москве уже удалось задержать более ста человек. Это только начало: в будущем к системе подключат больше камер и больше баз данных. Пока, правда, камеры ошибаются через раз, а правозащитники опять бьют тревогу.
Вперед к четырем миллионам камер
«Систему не удалось обмануть никакими ухищрениями: один из фанатов, которому по решению суда запрещено посещение спортивных мероприятий, пять раз пытался проникнуть в фанзону, маскируясь то очками, то капюшоном, то кепкой, но это не помогло!», — так описывал работу решения по распознаванию лиц NtechLab глава «Ростеха» Сергей Чемезов.
Решение NtechLab использовалось в тестовом режиме на рамках досмотра, которые находились у стадионов «Лужники», «Спартак» и площадке на Воробьевых горах во время Чемпионата мира по футболу в Москве, рассказывает Coda начальник отдела городского видеонаблюдения Департамента информационных технологий (ДИТ) Москвы Дмитрий Головин.
«На массовых мероприятиях полицейским выдали 50 смартфонов, на которых было установлено специальное приложение. Полицейские стояли в районе рамок и если система распознавания срабатывала, то им приходило соответствующее сообщение», — говорит он. Каждый полицейский был закреплен за определенным количеством рамок и был «подписан на события», происходящие возле них.
Головин продемонстрировал корреспонденту Coda как выглядели сообщения, которые получали полицейские: фото из базы розыска, фото человека «с рамки», номер камеры, номер КПП, ФИО, дата рождения человека и данные о том, за что его ищут.
Помимо баз правоохранительных органов камеры срабатывали на людей, которые находятся в международном розыске, а также на болельщиков, которым запрещено судом посещать спортивные мероприятия. В результате полицейские задержали с помощью систем распознавания 98 человек во время ЧМ. «Система очень хорошо себя зарекомендовала и обязательно будет использоваться», — пообещал Головин.
При этом количество ложных срабатываний было в два раза больше, чем число задержанных, отметил он. «Масса случаев была, когда камера срабатывала, но человек был не тот. Камера и видеоаналитика не идентифицируют людей: они определяют схожесть», объясняет представитель ДИТ Москвы. Решение о задержании или проверке документов, всегда принимает человек, добавляет он.
В базах федерального розыска фотографии «могут быть какого угодно качества», кроме того, там есть фотороботы. Чем хуже материал, тем более непредсказуемый результат, говорит собеседник Coda.
«Раньше эти базы особо негде было использовать, потому что не было человека, который мог бы запомнить все фотороботы. Сейчас базы — это материал, который будет использоваться постоянно. Поэтому к их ведению будут предъявляться повышенные требования», — добавил Головин.
NtechLab, решение которой полицейские тестировали во время ЧМ, — лишь одна из российских компаний, которые создают системы по распознаванию лиц. ДИТ Москвы протестировал более 10 систем от разных производителей. Среди них — «Центр речевых технологий», «Видеотэк», «Вокорд», ITV и другие.
Первые пилотные проекты в городе с системами распознавания лиц запустились несколько лет назад. На каких конкретно камерах тестировалось распознавание лиц, Головин не раскрывает. Всего в системе городского видеонаблюдения сейчас 167 тысяч камер, около 120 тысяч из которых расположены на подъездах. В 2019 году к системе будет подключено еще 20-30 тысяч камер, рассчитывают в ДИТ.
«В городе огромное количество самых разных камер, я не думаю что их меньше, чем в Лондоне, а там их 4 миллиона»,— говорит Головин. (Исследователи считают, что в 2017 году в Лондоне было около полумиллиона камер, а в 2020 их будет примерно 642 000 — Coda)
ДИТ постепенно интегрирует в городскую систему видеонаблюдения все новые камеры, которые принадлежат банкам, торговым центрам, сетевым ритейлерам, автозаправкам и так далее. Когда владелец камеры «делится» ею с городом, он получает взамен возможность хранить архив в центре обработке данных (ЦОД) ДИТ, доступ ко всем своим камерам с одного устройства, а также доступ ко всем технологиям ДИТ, в том числе распознаванию лиц.
«Половина срабатываний могут оказаться ложными»
В августе 2018 года активиста «Другой России» Михаила Акселя задержали полицейские на станции метро «Спортивная»: сработала камера распознавания лиц, которая опознала его «как уголовного преступника», рассказала «Медиазона» в начале октября.
В метрополитене проводился пилотный проект по внедрению системы распознавания лиц, подтвердили Coda в пресс-службе метро. «Пока решение об окончательной конфигурации и архитектуре проекта, о порядке его внедрения и работы не принято».
Сейчас в метро работает система интеллектуального видеонаблюдения, которая позволяет распознавать нестандартные ситуации на станциях: «забытый предмет или нестандартную активность — будь то бегущий пассажир, массовое скопление людей или драка». Все данные, которые получает интеллектуальная система безопасности, стекаются в специализированный центр, рассказали в пресс-службе метро.
«Это система биометрическая, она распознает черты лица. Камеры по кругу находятся; меня сфотографировала камера сбоку. Там есть камера спереди, сзади, сверху. Скрыться невозможно, если только не хочешь в маске ходить, но как бы в метро в маске — очень странно», рассказывал Аксель «Медиазоне».
Если человек наденет маску, где будут только две прорези для глаз, система вряд ли его распознает, соглашается технический директор компании-разработчика систем распознавания «Вокорд» Алексей Кадейшвили.
Но человек в таком виде, скорее всего, и так привлечет внимание, добавляет он. Система «Вокорд» тестировалась в метро, но результатов этих работ Кадейшвили не знает.
Камеры с системой распознавания лиц могут работать в двух режимах, продолжает техдиректор «Вокорд»: в режиме реального времени и поисковом. В первом случае в систему загружается база людей, которые находятся в розыске. Как только человек из этой базы попал под камеры и система его распознала, она подает сигнал тревоги. В поисковом режиме система «запоминает» лица всех людей, которые появлялись в метро за определенный период времени, например, месяц, говорит Кадейшвили. Затем в нее загружается фото человека, а программа находит все моменты его появления в метро.
Если система не связана ни с одной базой данных людей, то она и не сможет никого идентифицировать, говорит сооснователь компании «Видеотэк» Алексей Цессарский.
Чем меньше лица видно, тем хуже система будет его распознавать, добавляет Кадейшвили.
Медицинская маска, солнечные очки, шапка — ухудшают результаты. Также камеры не смогут распознать человека, стоящего к ней спиной, добавляет он.
Способность системы идентифицировать представителей других рас зависит от того, обучали ли ее для этого специально, говорит Цессарский. Если в обучающих выборках были фото чернокожих и азиатов, то она будет их корректно распознавать. Оказалось, что это важная проблема: в начале 2018 года ученые из Массачусетского технологического института (MIT) выяснили, что нейронные сети, на базе которых работают современные системы распознавания лиц, плохо распознают чернокожих людей. В тестировании участвовали системы распознавания лиц от Microsoft, IBM и китайской Megvii. Алгоритм неверно определял пол у менее, чем 1% белых мужчин и 7% белых женщин, при этом с чернокожими мужчинами и женщинами цифры вырастали до 12% и 35% ложных распознаваний соответственно, рассказали авторы исследования.
ЧИТАЙТЕ ЕЩЕ О СЛЕЖКЕ И КОНТРОЛЕ В РОССИИАзбука параноика: кто за нами следит и зачем им этоНе только TelegramТепловизор и коса: настоящая битва за урожай на Юге России
Количество ложных срабатываний в любой системе будут зависеть от того, как ее настроить, говорит специалист по компьютерному зрению Сколковского института науки и технологий Виктор Лемпицкий. Маленький процент ложных срабатываний означает, что система будет часто пропускать нужные объекты, а редкие пропуски повлекут за собой большое число ложных срабатываний, рассказывает он. Работа систем распознавания также зависит от того, какое разрешение у камеры, где она расположена, какое расстояние до объекта и какое освещение на улице. При хорошем освещении и высоком разрешении камеры эти системы работают лучше, чем человеческий мозг, говорит Лемпицкий. В реальных условиях города, когда камера находится далеко, у нее среднее разрешение, люди движутся, освещение плохое, распознавание становится сложной задачей и для человека, и для машины, считает специалист.
«В таких условиях, значительная часть срабатываний, например, половина могут оказаться ложными», — подчеркивает Лемпицкий. Точность работы систем распознавания лиц «в поле» составляет 80-90%, настаивает Цессарский.
«Полицейские на ЧМ искали определенных людей и, видимо, очень боялись пропустить их: они установили такую чувствительность, чтобы система давала сигнал при малейшем подозрении», — объясняет Цессарский большое количество ложных срабатываний. Систему можно было бы настроить иначе: понизить порог чувствительности, тогда она иногда пропускала бы кого нужно, но зато точно избежала бы ложных срабатываний, добавляет он.
Число людей, которые находятся в розыске также влияет на число ложных срабатываний: чем больше людей, которых требуется найти, тем большее количество людей может быть на них похожи, говорит Лемпицкий.
«Твое лицо — большие данные»
Весной 2016 года мировая пресса обрушилась с критикой на новый сервис — FindFace, созданный российскими разработчиками. Он позволял найти профиль человека во «ВКонтакте» по его фотографии. Фотограф Егор Цветков запечатлил незнакомых людей в метро Москвы и Санкт-Петербурга и разыскал с помощью FindFace их профили в социальной сети. Цветков создал фотопроект Your Face Is Big Data («Твое лицо — большие данные»), которым хотел показать «силу и общедоступность современных систем по распознаванию лиц, а также угрозу, которую они предоставляют для конфиденциальности», писало издание The New York Times в июле 2018 года. Цветков не ответил на вопросы Coda.
Создатель алгоритма FindFace — компания NtechLab в сентябре 2018 года закрыла сервис для обычных пользователей и решила «сфокусироваться на том, чтобы работать по своему основному профилю, создавая решения для бизнеса госорганов и госструктур», рассказал Coda гендиректор компании Михаил Иванов. Весной 2018 года акционером NtechLab стала госкорпорация «Ростех», которая выкупила 12,5% акций разработчика.
«У нас были успехи и до «Ростеха», хотя, конечно, «Ростех» повышает кредит доверия со стороны государственных организаций», признается Иванов.
Использование технологий распознавания лиц государственными органами, особенно для слежки, создает новые угрозы и вызовы правам человека, рассказал Coda эксперт по технологиям правозащитной организации Amnesty International Джо Вестби.
Распознавание лиц наряду с распознаванием походки, голоса, датчиками движения глаз позволит владельцам этих технологий создавать «невероятно личную и детальную картину внешности, поведения, и возможно даже желаний, эмоций и настроений человека», добавляет он.
В России сегодня о нарушении прав и свобод человека можно говорить только если данные с камер будут использованы кем-то помимо спецслужб, правоохранительных органов и тех, у кого есть доступ к ним «по долгу службы», говорит исполнительный директор юридической компании Heads Consulting Никита Куликов. Эта функция входит в «общественный договор» между гражданами и государством —
«они нас защищают, мы с этим согласны, но документы не подписывали», объясняет Куликов.
«До тех пор, пока эти органы используют персональные данные по назначению, говорить о нарушении прав и свобод не приходится», — говорит он.
Однако есть высокий риск того, что использование технологии распознавания лиц в общественных местах может нарушить конфиденциальность многих людей, возражает Джо Вестби. Эта технология позволяет властям создавать большие базы данных с лицами, где будет незаконно храниться информация о людях, которые не подозреваются ни в каком преступлении, подчеркивает он.
Кроме того, распознавание лиц может способствовать дискриминации в отношении меньшинств или обособленных социальных групп, поскольку его можно использовать для определения таких защищенных характеристик как раса или этническая принадлежность. «Мы знаем, что в Китае распознавание лиц используется для тщательного наблюдения и произвольного задержания уйгуров и других мусульманских этнических групп в Синьцзян-Уйгурском автономном районе», — говорит представитель Amnesty International.
В России система распознавания лиц может вызывать у жителей сковывающий эффект — явление, которое заставляет прибегать к самоцензуре и воздерживаться во многих случаях от реализации своих прав, считает Вестби. «Сковывающий эффект появляется там, где люди боятся использовать свои права из-за неопределенности и страха слежки. Европейский суд по правам (ЕСПЧ) человека хорошо описал это, когда они рассматривали случай телефонной слежки в России по делу Захарова (петербургский журналист Роман Захаров подал иск в ЕСПЧ и в 2015 году суд признал, что бесконтрольная прослушка разговоров россиян с помощью СОРМ нарушает Европейскую конвенцию по правам человека — Coda) — тем, где есть неадекватные меры безопасности и никто не может с уверенностью сказать, применяются они или нет, это влияет на права каждого человека», заключает Вестби.
Текст: Ирина Юзбекова. Иллюстрации: Александра Сердюкова, «Видеотек», «Вокорд»