850 читали · 2 года назад
10 лучших бесплатных инструментов распознавания речи Linux – программное обеспечение с открытым исходным кодом
Речь становится все более популярным методом взаимодействия с электронными устройствами, такими как компьютеры, телефоны, планшеты и телевизоры. Речь уникальна, и речевые движки никогда не бывают точными на 100%. Но технологические достижения означают, что механизмы распознавания речи обеспечивают лучшую точность понимания речи. Чем выше точность, тем больше вероятность того, что клиенты будут использовать этот метод контроля. И, согласно исследованию китайского поискового гиганта Baidu, говорить в смартфон в три раза быстрее, чем ввод поискового запроса в экранный интерфейс...
304 читали · 2 года назад
ОFFLINE РАСПОЗНАВАНИЕ РЕЧИ. БИБЛИОТЕКА VOSK
#NLP #python #vosk #алгоритмы #машинное обучение Недавно мне была поставлена задача конвертировать аудиозаписи в текст для дальнейшего анализа. Обязательные условия: офлайн обработка, невысокая требовательность к системным ресурсам, и возможность автоматизации процесса. Я выбрал Python и библиотеку vosk-api. Что может Vosk Vosk – это автономный инструмент для распознавания речи с открытым исходным кодом. Он позволяет использовать модели для 17 языков и диалектов (на момент написания статьи). Модели Vosk малы (50Мб) и позволяют преобразовывать речь в текст «на лету»...