1С:Распознавание речи — облачный сервис, расширяющий возможности платформы 1С:Предприятие 8 по автоматическому преобразованию речи в текст. Позволяет реализовать в бизнес-приложениях качественную расшифровку аудио без нагрузки на оборудование пользователя.
Преимущества использования сервиса:
- Распознавание речи позволит быстрее и проще надиктовать длинные тексты вместо их набора с клавиатуры. Электронные письма, текстовые блоки в документах, содержание задач и комментариев – удобнее «наговаривать», особенно, когда заняты руки, и при работе на мобильных устройствах.
- Можно распознавать записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Для получения лучшего результата рекомендуется записывать отдельные звуковые каналы для каждого собеседника.
- На 1С можно разработать голосовое управление интерфейсом приложений: по команде голосом открывать нужные формы, строить отчеты, выполнять поиск, заполнять реквизиты.
- Можно применять в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
- Использовать работу с дополнительной грамматикой при потоковом распознавании речи: при начале распознавания вы можете передать какие-то сложные названия (фамилии сотрудников, названия номенклатуры или компаний-контрагентов), и сервис будет их уверенно распознавать.
В рамках сервиса доступно
Потоковое распознавание
Пользователь отправляет аудиоданные в режиме реального времени, в ответ получает распознанный текст. Это удобно для того, чтобы надиктовать письма, или реализовать управление интерфейсом программы.
Длительность одного сеанса при потоковом распознавании речи с помощью сервиса имеет ограничение в 2 часа. Потоковое распознавание при локальном распознавании речи по длительности сеанса не ограничено.
Файловое распознавание
Пользователь отправляет в сервис файл с аудио, в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае, пользователь может отправить готовый аудио-файл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и загрузки сервиса.
Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться независимо. Для распознавания принимаются форматы аудио: WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио: от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1 Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания из сервиса в течение 7 суток после выполнения задания.
Стоимость
Стоимость использования облачного сервиса зависит от длительности аудио и варианта распознавания. Распознавание потокового аудио будет, как правило, обходиться дешевле 60 коп. за минуту. Распознавание аудиофайлов еще доступнее — до 15 коп. за минуту.
Действующие подписчики сервиса ИТС имеют возможность попробовать сервис бесплатно, оформив тестовую подписку на портале 1С:ИТС или из программы.