Новая платформа Omniverse Avatar сочетает в себе 3D-модели и речь с использованием искусственного интеллекта
Nvidia анонсировала новую платформу для создания виртуальных агентов под названием Omniverse Avatar. Платформа сочетает в себе ряд дискретных технологий, включая распознавание речи, синтетическую речь, отслеживание лиц и анимацию 3D — аватаров, которые, по словам Nvidia, могут использоваться для питания целого ряда виртуальных агентов.
В презентации на ежегодной конференции GTC компании генеральный директор Nvidia Дженсен Хуанг продемонстрировал несколько демонстраций с использованием технологии Omniverse Avatar. В одном из них симпатичный анимированный персонаж в цифровом киоске рассказывает паре о меню в ресторане быстрого питания, отвечая на вопросы, например, какие блюда вегетарианские. Персонаж использует технологию отслеживания лиц, чтобы поддерживать зрительный контакт с клиентами и реагировать на выражение их лица. “Это будет полезно для умной розничной торговли, поездок и обслуживания клиентов”,-сказал Хуан из отдела технологий.
В другой демонстрации анимированная игрушечная версия Хуана отвечала на вопросы по таким темам, как изменение климата и производство белка, а в третьей кто-то использовал реалистичный анимированный аватар в качестве дублера во время телефонной конференции. Звонивший был одет в повседневную одежду в оживленном кафе, но их виртуальный аватар был одет элегантно и говорил без какого-либо фонового шума. Этот последний пример основан на проекте Nvidia Maxine work, который направлен на устранение распространенных проблем с видеоконференциями (например, потоки низкого качества и поддержание зрительного контакта) с помощью исправлений машинного обучения.
Анонс Omniverse Avatar является частью неизбежного видения Nvidia “omniverse” — грандиозного бренда для туманной коллекции технологий. Как и “метавселенная”, “omniverse” в основном посвящен общим виртуальным мирам, которые позволяют осуществлять удаленную совместную работу. Но по сравнению с видением, выдвинутым владельцем Facebook Meta, Nvidia меньше заботится о переносе ваших офисных встреч в виртуальную реальность и больше о копировании промышленных сред с виртуальными коллегами и — в случае работы с аватарами — создании аватаров, которые взаимодействуют с людьми в физическом мире.
Как всегда в этих презентациях, демо-версии Nvidia выглядели довольно гладко, но неясно, насколько полезной эта технология будет в реальном мире. Например, с символом киоска неясно, действительно ли клиенты предпочтут такой вид интерактивного взаимодействия простому выбору нужных им элементов из меню. Хуан отметил в презентации, что время отклика аватара составляет на две секунды-медленнее, чем у человека, и неизбежно вызовет разочарование, если клиенты будут спешить. Аналогично, хотя проект компании Maxine tech выглядит блестяще, мы еще не видели, чтобы он оказал значительное влияние в реальном мире.
#искусственный интелект #технологии #будущее
Источник: https://www.theverge.com