Найти тему
Машинное обучение

Vosk - автономный Python модуль для распознавания речи

🔥#python #github

Vosk - автономный модуль для распознавания речи с открытым исходным кодом. Поддерживает модели распознавания речи для 18 языков включая русский.

  1. Поддерживает 20+ языков и диалектов - русский, английский, индийский английский, немецкий, французский, португальский, испанский, китайский, турецкий, вьетнамский, итальянский, голландский, валийский, арабский, греческий, персидский, филиппинский, украинский, казахский, шведский, японский, эсперанто, хинди. В скором времени будут добавлены и другие
  2. Работает без доступа к сети даже на мобильных устройствах - Raspberry Pi, Android, iOS
  3. Устанавливается с помощью простой команды pip3 install vosk без дополнительных шагов
  4. Модели для каждого языка занимают всего 50Мб, но есть и гораздо более точные большие модели для более точного распознавания
  5. Сделана для потоковой обработки звука, что позволяет реализовать мгновенную реакцию на команды
  6. Поддерживает несколько популярных языков программирования - Java, C#, Javascript
  7. Позволяет быстро настраивать словарь распознавания для улучшения точности распознавания
  8. Позволяет идентифицировать говорящего

Используется для распознавание речи в чат-ботах, умной бытовой техники и виртуальных помощниках. С помощью модуля также можно создавать субтитры для фильмов, транскрипцию для лекций и интервью.

⚙️ GitHub

Machinelearning

#python #github