Найти в Дзене
малоизвестное интересное

ИИ губочитка — это конец приватности

Китай демонстрирует: лидер — это тот, кто владеет данными

• С перлюстрацией люди научились бороться — просто пишем «об этом писать не буду — обсудим при встрече».

• С прослушкой тоже научились — «это не по телефону», говорим мы.

• И даже с дистанционной подслушкой научились — оставляем мобильники и выходим «покурить» у входа в ресторан или совместно «помыть руки» в туалет или просто фланируем по улице.

Новый подарок человечеству от глубокого обучения — ИИ губочитка — лишает нас этой возможности. Ведь всюду теперь камеры. А если их где-то еще нет, то будут.

Осталось только научить ИИ слету читать по губам в т.н. естественных условиях (с разных ракурсов, в движении, и т.д.)

И вот Китайцы показали, кто в лавке хозяин.

Только-только 1го октября Google DeepMind сообщил, что ИИ снова порвал в тряпки людей, — теперь по части точности чтения по губам. Их ИИ губочитка показала Word Error Rate равный 40.9%. Это в 2+ раза лучше показателей людей — профессионалов губочтения 86,4% — 92,9% (это не процент ошибок, а 4х частная формула, суть которой — чем меньше, тем точнее).

Но спустя всего 2 недели 16 октября китайцы сообщают, что достигли 38,19%. И хотя это очень круто, но сенсация все равно не в этом. А в том, что китайский ИИ губочтец распознает не «студийную начитку», а т.н. «речь в естественных условиях», т.е. практически с любой камеры видеонаблюдения, показывающей говорящего под любым ракурсом.

Секрет прорыва прост — ломовой набор данных для обучения ИИ губочтеца (1К+ классов фонем, 2К+ спикеров, видео натурального разрешения плюс совмещение 2D и 3D методов распознавания).

Понятное дело, пока что распознается мандарин — официальный язык на диалектах северокитайского. Но у Google DeepMind, сами понимаете, английский. А подрядить пару тысяч китайцев наговорить тысяч 5 часов видео в естественных условиях — для Китая дело техники.

Резюме печальное — приватности приходит конец. Осталась только невербальная коммуникация и разговоры самих с собой. Но не обольщайтесь. Китайцы уже начали разработки:

  • ИИ чтеца языка тела;
  • ИИ чтеца показателей индивидуальных трекеров (пульс, давление …) с геопозиционированием. И попробуй только мысленно в сердцах матюгнуться, проходя мимо портрета нацлидера: твой браслет это отследит, ИИ чтец проинтерпретирует, и получай минус 100 баллов в свою социальную репутацию.

_________________________

Хотите читать подобные публикации? Подписывайтесь на мой канал в Телеграме, Medium, Яндекс-Дзене

Считаете, что это стоит прочесть и другим? Дайте им об этом знать, кликнув на иконку “понравилось”