🔥#python #github
Vosk - автономный модуль для распознавания речи с открытым исходным кодом. Поддерживает модели распознавания речи для 18 языков включая русский.
- Поддерживает 20+ языков и диалектов - русский, английский, индийский английский, немецкий, французский, португальский, испанский, китайский, турецкий, вьетнамский, итальянский, голландский, валийский, арабский, греческий, персидский, филиппинский, украинский, казахский, шведский, японский, эсперанто, хинди. В скором времени будут добавлены и другие
- Работает без доступа к сети даже на мобильных устройствах - Raspberry Pi, Android, iOS
- Устанавливается с помощью простой команды pip3 install vosk без дополнительных шагов
- Модели для каждого языка занимают всего 50Мб, но есть и гораздо более точные большие модели для более точного распознавания
- Сделана для потоковой обработки звука, что позволяет реализовать мгновенную реакцию на команды
- Поддерживает несколько популярных языков программирования - Java, C#, Javascript
- Позволяет быстро настраивать словарь распознавания для улучшения точности распознавания
- Позволяет идентифицировать говорящего
Используется для распознавание речи в чат-ботах, умной бытовой техники и виртуальных помощниках. С помощью модуля также можно создавать субтитры для фильмов, транскрипцию для лекций и интервью.
#python #github