Учёные из Шэньчжэньского института передовых технологий Китайской академии наук создали крупнейшую базу данных трёхмерных лиц — около 200 000 высокоточных 3D-сканов. И на её основе обучили нейросеть CF-GAT, которая распознаёт ключевые точки лица прямо по «облаку точек» (геометрии), без привязки к 2D-фотографиям и текстурам. Это прорыв для андроидов, которые должны не просто «выглядеть» как люди, но и понимать наши эмоции по едва заметным изменениям формы лица. В чём фокус?
Большинство систем распознавания лиц сегодня завязаны на 2D-изображения. Они пытаются «натянуть» плоскую картинку на трёхмерную модель, что неизбежно ведёт к ошибкам — из-за освещения, ракурса, мимики. Китайская команда пошла другим путём: Почему это лучше, чем старые методы? Где это применимо? #УКУС_ТРЕНДА
Эта разработка — симптом трёх важных движений в робототехнике и ИИ: P.S. 200 000 лиц — это не просто база, это, по сути, «учебник» по анатомии человеческой мимики. Следующий шаг — научить робота не только распозна