Производитель голосового ИИ для потребительских товаров Sensory, объявил, что интегрировал ChatGPT и другие ИИ для управления голосовыми ответами на потребительских устройствах.
Используя смарт-часы в качестве примера устройства со сверхнизким энергопотреблением, на устройстве могут работать легкие ИИ, такие как распознавание пробуждения, проверка говорящего, простое голосовое управление и идентификация звука. Более сложные логические выводы ИИ, такие как повторная проверка идентификатора слова, говорящего и звука, а также помощники для конкретных предметных областей и механизмы понимания естественного языка, могут быть перенаправлены на более мощное подключенное устройство, такое как смартфон. А для высокопроизводительного вывода ИИ улучшенная повторная проверка, распознавание лиц и объектов и многое другое может быть направлено в облако.
Он направлен на то, чтобы сделать устройства без клавиатуры и больших экранов умнее. Ориентируясь на встроенные голосовые помощники, умные часы, смартфоны, автомобильные информационно-развлекательные системы и многое другое, эта технологическая интеграция обеспечивает быстрый и беспрепятственный разговор о потребительских товарах и открывает захватывающие возможности голосового чата для многочисленных компаний, производящих электронику, и их клиентов, говорится в сообщении компании.
«Генеративный ИИ может сделать потребительские устройства умнее, чем когда-либо. Интеграция этой мощной новой технологии с нашим стеком голосового ИИ меняет правила игры на рынке и позволяет нашим клиентам создавать новое поколение голосовых помощников, адаптированных для различных настраиваемых областей», — сказал Тодд Мозер, генеральный директор Sensory, в заявлении.
Компания заявила, что Sensory имеет репутацию высокоточных решений для голосового ИИ, и генеративный ИИ делает его еще более точным. Стек технологий компании включает в себя:
- Распознавание слов.
- Точное преобразование речи в текст с учетом контекста и подсказок, созданных искусственным интеллектом, для обеспечения идеальных результатов генеративного искусственного интеллекта.
- Интеллектуальный выбор ответа помогает избежать непредсказуемых и неправильных ответов, также известных как «галлюцинации ИИ», которые могут возникать на платформах, которые полагаются исключительно на генеративный ИИ.
- Преобразование текста в речь позволяет пользователям слышать сгенерированные ответы естественным голосом.
Разговорный стек искусственного интеллекта Sensory также позволяет пользователям задавать дополнительные вопросы и команды для фильтрации, сортировки или добавления дополнительной информации к исходному запросу, делая разговор более естественным и похожим на человека.
«Этот запуск расширяет возможности Sensory, предоставляя возможности голосового чата для устройств всех типов, что дает предприятиям возможность создавать более привлекательные и интерактивные продукты», — сказал Мозер.
С гибридной платформой «облако + периферийный ИИ» от Sensory клиенты могут реализовать ряд мощных технологий ИИ, чтобы повысить удобство работы и безопасность конечных пользователей, а также разделить обязанности вывода ИИ между периферийными устройствами и облаком.
Используя смарт-часы в качестве примера устройства со сверхнизким энергопотреблением, на устройстве могут работать легкие ИИ, такие как распознавание пробуждения, проверка говорящего, простое голосовое управление и идентификация звука. Более сложные логические выводы ИИ, такие как повторная проверка идентификатора слова, говорящего и звука, а также помощники для конкретных предметных областей и механизмы понимания естественного языка, могут быть перенаправлены на более мощное подключенное устройство, такое как смартфон. А для высокопроизводительного вывода ИИ - улучшенная повторная проверка, распознавание лиц и объектов и многое другое может быть направлено в облако.
Решение для голосового помощника SensoryCloud основано на передовом стеке технологий, включающем Go, gRPC, NVIDIA Triton и AWS Global Accelerator. Молниеносный язык программирования Go позволяет создавать масштабируемые высокопроизводительные приложения, способные справиться даже с самыми ресурсоемкими рабочими нагрузками. gRPC позволяет создавать расширенные пакеты SDK для бесперебойной связи между компонентами. SensoryCloud использует запатентованные методы для сжатия данных диалогов, чтобы снизить плату за облако и уменьшить задержки.