Проект OpenAI, занимающийся развитием общедоступных проектов в области искусственного интеллекта, опубликовал наработки, связанные с системой распознавания речи Whisper. Утверждается, что для речи на английском языке система обеспечивает уровни надёжности и точности автоматического распознавания близкие к распознаванию человеком. Открыты код эталонной реализации на базе фреймворка PyTorch и набор уже обученных моделей, готовых для использования. Код открыт под лицензией MIT. Для обучения модели использованы 680 тысяч часов речевых данных, собранных из нескольких коллекций, охватывающих разные языки и тематические области. Около 1/3 задействованных при обучении речевых данных приходятся на языки, отличные от английского. Предложенная система корректно обрабатывает такие ситуации, как произношение с акцентом, наличие фоновых шумов и применение технического жаргона. Кроме транскрипции речи в текст, система также может переводить речь с произвольного языка на английский язык и определять п
Открыт код системы распознавания и перевода речи Whisper
26 сентября 202226 сен 2022
27
1 мин