Добавить в корзинуПозвонить
Найти в Дзене

Китай собирает 200 000 3D-лиц, чтобы научить роботов видеть нас без масок и текстур 👤🤖

Учёные из Шэньчжэньского института передовых технологий Китайской академии наук создали крупнейшую базу данных трёхмерных лиц — около 200 000 высокоточных 3D-сканов. И на её основе обучили нейросеть CF-GAT, которая распознаёт ключевые точки лица прямо по «облаку точек» (геометрии), без привязки к 2D-фотографиям и текстурам. Это прорыв для андроидов, которые должны не просто «выглядеть» как люди, но и понимать наши эмоции по едва заметным изменениям формы лица. В чём фокус?
Большинство систем распознавания лиц сегодня завязаны на 2D-изображения. Они пытаются «натянуть» плоскую картинку на трёхмерную модель, что неизбежно ведёт к ошибкам — из-за освещения, ракурса, мимики. Китайская команда пошла другим путём: Почему это лучше, чем старые методы? Где это применимо? #УКУС_ТРЕНДА
Эта разработка — симптом трёх важных движений в робототехнике и ИИ: P.S. 200 000 лиц — это не просто база, это, по сути, «учебник» по анатомии человеческой мимики. Следующий шаг — научить робота не только распозна
Сгенерировано ИИ
Сгенерировано ИИ

Учёные из Шэньчжэньского института передовых технологий Китайской академии наук создали крупнейшую базу данных трёхмерных лиц — около 200 000 высокоточных 3D-сканов. И на её основе обучили нейросеть CF-GAT, которая распознаёт ключевые точки лица прямо по «облаку точек» (геометрии), без привязки к 2D-фотографиям и текстурам. Это прорыв для андроидов, которые должны не просто «выглядеть» как люди, но и понимать наши эмоции по едва заметным изменениям формы лица.

В чём фокус?
Большинство систем распознавания лиц сегодня завязаны на 2D-изображения. Они пытаются «натянуть» плоскую картинку на трёхмерную модель, что неизбежно ведёт к ошибкам — из-за освещения, ракурса, мимики.

Китайская команда пошла другим путём:

  1. Собрали гигантскую базу реальных 3D-лиц с помощью специальной системы захвата. В неё вошли: статические сканы, динамические выражения (4D), стандартизированные размеченные точки и сканы тел.
  2. Разработали нейросеть CF-GAT (Curvature-Fused Graph Attention Network), которая работает напрямую с «облаками точек» — трёхмерной геометрией лица без текстур.
  3. Встроили в сеть «геометрический приоритет» — кривизну поверхности как ключевой признак. Сеть учится различать тонкие локальные изменения формы, одновременно моделируя глобальные соотношения на всём лице.

Почему это лучше, чем старые методы?

  • Не нужны текстуры: Система видит только форму. Это значит, что она не обманывается тенями, макияжем или плохим освещением.
  • Точность: Тесты показали более высокую устойчивость к шумам и лучшее обобщение на разные типы лиц по сравнению с традиционными подходами.
  • Детализация: CF-GAT способна различать тончайшие изменения геометрии, необходимые для реалистичной мимики.

Где это применимо?

  • Андроиды и социальные роботы: Чтобы улыбаться, хмуриться или удивляться так же естественно, как человек.
  • Биометрия: Трёхмерное распознавание лица гораздо сложнее подделать, чем 2D-фотографию.
  • Виртуальные аватары: Для игр, кино и метавселенных — персонажи смогут передавать эмоции с анатомической точностью.

#УКУС_ТРЕНДА
Эта разработка — симптом трёх важных движений в робототехнике и ИИ:

  1. От 2D к 3D-пониманию: Мир трёхмерен, и машины всё активнее учатся его воспринимать без потери измерения. Облака точек и геометрия становятся таким же важным типом данных, как пиксели и текстуры.
  2. Геометрия как язык эмоций: Мы привыкли думать, что выражение лица — это про картинку. Но на самом деле это про форму: как меняется кривизна щёк, лба, губ при улыбке или гневе. Нейросеть учится «читать» эти изменения напрямую.
  3. Данные — новый нефть (и теперь это 3D): 200 000 высокоточных 3D-сканов — это стратегический актив. Такая база данных позволяет обучать модели, недоступные конкурентам, и задавать стандарты в целой отрасли.

P.S. 200 000 лиц — это не просто база, это, по сути, «учебник» по анатомии человеческой мимики. Следующий шаг — научить робота не только распознавать эмоции, но и синтезировать их на своём лице, подстраивая геометрию в реальном времени. Это путь к андроидам, которых перестанут отличать от людей.

#роботы #3D #ИИ #Китай #инновации