Добавить в корзинуПозвонить
Найти в Дзене
DigiNews

Генеральный директор ElevenLabs: Голос — это следующий интерфейс для AI

Глава ElevenLabs на Web Summit Qatar заявил, что голос — это следующий интерфейс для ИИ, поскольку OpenAI, Google и Apple продвигают разговорные системы в носимые устройства, новое оборудование и повседневные взаимодействия. — techcrunch.com Соучредитель и генеральный директор ElevenLabs Мати Станишевски утверждает, что голос становится следующим основным интерфейсом для ИИ — способом, которым люди будут все чаще взаимодействовать с машинами по мере того, как модели выходят за рамки текста и экранов. Выступая на Web Summit в Дохе, Станишевски рассказал TechCrunch, что голосовые модели, подобные разработанным ElevenLabs, недавно вышли за рамки простого имитирования человеческой речи, включая эмоции и интонацию, и теперь работают в тандеме с возможностями рассуждения больших языковых моделей. По его словам, результатом является изменение способов взаимодействия людей с технологиями. В ближайшие годы, сказал он, «надеемся, все наши телефоны вернутся в карманы, и мы сможем погрузиться в ре

Глава ElevenLabs на Web Summit Qatar заявил, что голос — это следующий интерфейс для ИИ, поскольку OpenAI, Google и Apple продвигают разговорные системы в носимые устройства, новое оборудование и повседневные взаимодействия. — techcrunch.com

Соучредитель и генеральный директор ElevenLabs Мати Станишевски утверждает, что голос становится следующим основным интерфейсом для ИИ — способом, которым люди будут все чаще взаимодействовать с машинами по мере того, как модели выходят за рамки текста и экранов.

Выступая на Web Summit в Дохе, Станишевски рассказал TechCrunch, что голосовые модели, подобные разработанным ElevenLabs, недавно вышли за рамки простого имитирования человеческой речи, включая эмоции и интонацию, и теперь работают в тандеме с возможностями рассуждения больших языковых моделей. По его словам, результатом является изменение способов взаимодействия людей с технологиями.

В ближайшие годы, сказал он, «надеемся, все наши телефоны вернутся в карманы, и мы сможем погрузиться в реальный мир вокруг нас, а голос станет механизмом, управляющим технологиями».

Это видение способствовало привлечению ElevenLabs 500 миллионов долларов на этой неделе при оценке в 11 миллиардов долларов, и оно все чаще разделяется в индустрии ИИ. OpenAI и Google сделали голос центральным элементом своих моделей следующего поколения, в то время как Apple, по-видимому, тихо создает смежные с голосом, постоянно включенные технологии посредством приобретений, таких как Q.ai. По мере распространения ИИ на носимые устройства, автомобили и другое новое оборудование, управление все меньше связано с нажатием на экраны и все больше — с речью, что делает голос ключевым полем битвы для следующего этапа развития ИИ.

Генеральный партнер Iconiq Capital Сет Пьеррепон на Web Summit согласился с этой точкой зрения, заявив, что, хотя экраны будут по-прежнему важны для игр и развлечений, традиционные методы ввода, такие как клавиатуры, начинают ощущаться «устаревшими».

И поскольку системы ИИ становятся все более деятельными, сказал Пьеррепон, само взаимодействие также изменится: модели получат защитные механизмы, интеграции и контекст, необходимые для реагирования с меньшим количеством явных запросов от пользователей.

Станишевски отметил этот деятельный сдвиг как одно из самых больших изменений. Вместо того чтобы излагать каждую инструкцию, он сказал, что будущие голосовые системы будут все больше полагаться на постоянную память и контекст, накопленный со временем, что сделает взаимодействие более естественным и потребует меньше усилий от пользователей.

Эта эволюция, добавил он, повлияет на то, как будут развертываться голосовые модели. В то время как высококачественные аудиомодели в основном находились в облаке, Станишевски сказал, что ElevenLabs работает над гибридным подходом, сочетающим облачную и локальную обработку — шаг, направленный на поддержку нового оборудования, включая наушники и другие носимые устройства, где голос становится постоянным спутником, а не функцией, с которой вы решаете взаимодействовать.

ElevenLabs уже сотрудничает с Meta*, чтобы привнести свою технологию голоса в такие продукты, как Instagram* и Horizon Worlds, платформу виртуальной реальности компании. Станишевски заявил, что он также готов сотрудничать с Meta* над ее умными очками Ray-Ban, поскольку интерфейсы, управляемые голосом, расширяются на новые форм-факторы.

Но по мере того, как голос становится более постоянным и встроенным в повседневное оборудование, он открывает двери для серьезных проблем, связанных с конфиденциальностью, наблюдением и тем, сколько личных данных будут хранить голосовые системы по мере их приближения к повседневной жизни пользователей — то, в злоупотреблении чем компании, подобные Google, уже обвинялись.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Rebecca Bellan

Оригинал статьи

Пение
3339 интересуются