Nvidia и Suno.ai выпустили модель для перевода речи в текст
Модель с открытым исходным кодом Parakeet-TDT транскрибирует аудио и, судя по бенчмаркам, делает меньше ошибок чем Whisper от OpenAI. Работает только с английским языком.
—
@aioftheday — новости вокруг искусственного интеллекта
Около минуты
1 февраля 2024