Найти тему
IT-news

Sensory позволяет использовать голосовой чат с генеративным искусственным интеллектом на потребительских устройствах.

Производитель голосового ИИ для потребительских товаров Sensory, объявил, что интегрировал ChatGPT и другие ИИ для управления голосовыми ответами на потребительских устройствах.

Используя смарт-часы в качестве примера устройства со сверхнизким энергопотреблением, на устройстве могут работать легкие ИИ, такие как распознавание пробуждения, проверка говорящего, простое голосовое управление и идентификация звука. Более сложные логические выводы ИИ, такие как повторная проверка идентификатора слова, говорящего и звука, а также помощники для конкретных предметных областей и механизмы понимания естественного языка, могут быть перенаправлены на более мощное подключенное устройство, такое как смартфон. А для высокопроизводительного вывода ИИ улучшенная повторная проверка, распознавание лиц и объектов и многое другое может быть направлено в облако.

Он направлен на то, чтобы сделать устройства без клавиатуры и больших экранов умнее. Ориентируясь на встроенные голосовые помощники, умные часы, смартфоны, автомобильные информационно-развлекательные системы и многое другое, эта технологическая интеграция обеспечивает быстрый и беспрепятственный разговор о потребительских товарах и открывает захватывающие возможности голосового чата для многочисленных компаний, производящих электронику, и их клиентов, говорится в сообщении компании.

«Генеративный ИИ может сделать потребительские устройства умнее, чем когда-либо. Интеграция этой мощной новой технологии с нашим стеком голосового ИИ меняет правила игры на рынке и позволяет нашим клиентам создавать новое поколение голосовых помощников, адаптированных для различных настраиваемых областей», — сказал Тодд Мозер, генеральный директор Sensory, в заявлении.

Компания заявила, что Sensory имеет репутацию высокоточных решений для голосового ИИ, и генеративный ИИ делает его еще более точным. Стек технологий компании включает в себя:

  • Распознавание слов.
  • Точное преобразование речи в текст с учетом контекста и подсказок, созданных искусственным интеллектом, для обеспечения идеальных результатов генеративного искусственного интеллекта.
  • Интеллектуальный выбор ответа помогает избежать непредсказуемых и неправильных ответов, также известных как «галлюцинации ИИ», которые могут возникать на платформах, которые полагаются исключительно на генеративный ИИ.
  • Преобразование текста в речь позволяет пользователям слышать сгенерированные ответы естественным голосом.

Разговорный стек искусственного интеллекта Sensory также позволяет пользователям задавать дополнительные вопросы и команды для фильтрации, сортировки или добавления дополнительной информации к исходному запросу, делая разговор более естественным и похожим на человека.

«Этот запуск расширяет возможности Sensory, предоставляя возможности голосового чата для устройств всех типов, что дает предприятиям возможность создавать более привлекательные и интерактивные продукты», — сказал Мозер.

С гибридной платформой «облако + периферийный ИИ» от Sensory клиенты могут реализовать ряд мощных технологий ИИ, чтобы повысить удобство работы и безопасность конечных пользователей, а также разделить обязанности вывода ИИ между периферийными устройствами и облаком.

Используя смарт-часы в качестве примера устройства со сверхнизким энергопотреблением, на устройстве могут работать легкие ИИ, такие как распознавание пробуждения, проверка говорящего, простое голосовое управление и идентификация звука. Более сложные логические выводы ИИ, такие как повторная проверка идентификатора слова, говорящего и звука, а также помощники для конкретных предметных областей и механизмы понимания естественного языка, могут быть перенаправлены на более мощное подключенное устройство, такое как смартфон. А для высокопроизводительного вывода ИИ - улучшенная повторная проверка, распознавание лиц и объектов и многое другое может быть направлено в облако.

Решение для голосового помощника SensoryCloud основано на передовом стеке технологий, включающем Go, gRPC, NVIDIA Triton и AWS Global Accelerator. Молниеносный язык программирования Go позволяет создавать масштабируемые высокопроизводительные приложения, способные справиться даже с самыми ресурсоемкими рабочими нагрузками. gRPC позволяет создавать расширенные пакеты SDK для бесперебойной связи между компонентами. SensoryCloud использует запатентованные методы для сжатия данных диалогов, чтобы снизить плату за облако и уменьшить задержки.