Источник: Nuances of Programming Что такое распознавание речи? Под этим понимают автоматическое распознавание речи или голоса. Данное понятие включает в себя синтез осмысленных речевых сигналов с помощью семплирования, искусственных нейронных сетей и машинного обучения. Мы хорошо знаем все эти методы. Такие приложения, как Apple Siri, Google Assistant, Amazon Alexa, доступны большинству из нас. Конечно, они опережают себе подобные, в их основе лежит серьезная инженерия. Помимо синтеза осмысленных звуковых сигналов в них также используются алгоритмы NLP (обработки естественного языка)...
Речь становится все более популярным методом взаимодействия с электронными устройствами, такими как компьютеры, телефоны, планшеты и телевизоры. Речь уникальна, и речевые движки никогда не бывают точными на 100%. Но технологические достижения означают, что механизмы распознавания речи обеспечивают лучшую точность понимания речи. Чем выше точность, тем больше вероятность того, что клиенты будут использовать этот метод контроля. И, согласно исследованию китайского поискового гиганта Baidu, говорить в смартфон в три раза быстрее, чем ввод поискового запроса в экранный интерфейс...