Исследователи машинного обучения Apple представили нейросеть LiTo, которая восстанавливает трёхмерные объекты по одной фотографии. Модель сохраняет сложные визуальные эффекты — блики, отражения и изменения внешнего вида материала под разными углами, сообщили в ML-подразделении компании. Большинство существующих нейросетей для генерации 3D-моделей нацелены на точную передачу геометрии. Даже если модель умеет создавать текстуры, она обычно работает только с «плоскими» цветами поверхности и плохо понимает, как меняется внешний вид объекта при разном освещении. LiTo решает эту проблему: нейросеть кодирует в латентном пространстве сразу и геометрию, и то, как меняется внешний вид объекта. Сначала модель обучили генерировать 3D-объекты, а затем с помощью сжатия случайных выборок светового поля поверхности в компактный набор латентных векторов — восстанавливать визуальные эффекты. В Apple отметили, что LiTo генерирует более качественные 3D-объекты с высоким уровнем точности относительно входн
Из плоского в объёмное: Apple создала нейросеть, которая чувствует свет и тени
20 марта20 мар
32
1 мин