139,4 тыс подписчиков

NVIDIA представила модель искусственного интеллекта LATTE3D для преобразования текста в 3D

25 марта 202425 мар 2024

2 мин

В то время как модели искусственного интеллекта для создания изображений и видео уже доминируют в повестке дня, NVIDIA сделала шаг в следующем логическом направлении, выпустив LATTE3D, новую генеративную модель искусственного интеллекта, которая превращает текст в полные 3D-модели менее чем за секунду. Эта технология, анонсированная на прошлой неделе на мероприятии GTC, позиционируется как подобная виртуальному 3D-принтеру, поскольку она может мгновенно обрабатывать 3D-модели в популярном формате, используемом для стандартных приложений рендеринга, готовые к развертыванию в разработке видеоигр, рекламы, дизайн-проектов или любых приложений, требующих виртуальной среды, включая VR и AR.

Генеративный искусственный интеллект преобразования текста в 3D не является новой технологией, и сама исследовательская работа NVIDIA сравнивает LATTE3D с несколькими существующими системами, такими как MVDream, 3DTopia и LGM. Подавляющее преимущество LATTE3D — это скорость работы. В сравнительных тестах другим моделям искусственного интеллекта для создания выходных данных требуется от 20 секунд до более чем 30 минут, в то время как LATTE3D производит сопоставимый и часто более качественный рендеринг всего за 400 миллисекунд.

Следует отметить, что, как и в случае с 3D-печатью, качество результатов LATTE3D и других моделей искусственного интеллекта улучшается по мере увеличения времени. Преимущество заключается в том, что, в отличие от 3D-печати, можно сначала отдать приоритет скорости над качеством, а позже решить дождаться более точного результата, а не исправлять настройки с самого начала.

Как и любой другой генеративный искусственный интеллект, LATTE3D обладает потенциалом для преобразования многих рабочих процессов. Если раньше для создания простого объекта приходилось просматривать 3D библиотеку или тратить драгоценные человеко-часы, то с технологией NVIDIA это просто вопрос ввода краткого описания и импорта сгенерированных результатов в свое программное приложение или платформу.

Пока что исследовательская группа обучила LATTE3D только созданию простых моделей предметов и животных, но при наличии подходящих наборов данных это можно расширить и на другие категории. Модель была обучена с использованием графических процессоров NVIDIA A100, а в демо-версии компании работала только одна NVIDIA RTX A6000.

Как исследовательский проект, LATTE3D все еще находится в стадии разработки и пока не идет речь о выпуске его в качестве конечного продукта или услуги. В планах проекта входит расширение возможностей преобразования текста в 4D или создание 3D-анимации.