Whisper – нейросеть для распознавания речи на разных языках. Разработана компанией OpenAI, выпустившей ChatGPT. Позволяет транскрибировать речь в текст. Умеет переводить аудиозаписи с одного языка на другой. Как работает нейросеть Whisper Нейросеть Whisper AI обучена на 680 тысячах часов многоязычных и многозадачных данных. ИИ сервис работает по принципу кодер-декодер. Входной звук разбивается на 30-секундные фрагменты, преобразуемые в кепструм малой частоты, который передается кодировщику. Декодер обучен предсказывать последующие текстовые подписи. Специальные маркеры используются для выполнения нескольких задач, таких как временные метки на уровне фраз. При тестировании во многих наборах данных Whisper допустил на 50% меньше ошибок, чем аналоги. Как установить нейросеть Whisper Нейросеть Whisper представлена в виде программного обеспечения с открытым исходным кодом. Запустить сервис можно в браузере на компьютере. Для этого необходимо: !pip install git+https://github.com/openai/whisp