Whisper — бесплатная система распознавания речи от OpenAI. Проблема в том, что у нее нет веб-версии как у ChatGPT. Придется устанавливать вручную, читать гайды, написанные разработчиками для разработчиков, писать какой-то код и так далее. На самом деле попробовать нейросеть можно прямо из браузера.
Кому пригодится
Редакторам, спикерам и вообще всем, кому нужно расшифровывать аудио. Причем способы применения могут быть совершенно разные:
- Провели рабочий созвон в Zoom или Google Meet — получили текст, который поможет погрузиться в контекст, сделать фоллоу-ап и не упустить детали.
- Провели интервью — сразу получили готовый текстовый драфт.
- Выступили с докладом на конференции — оформили в виде статьи минимальными усилиями.
- Записали лекцию или презентацию проекта — получили готовую текстовую версию.
- Или сделали субтитры и так далее.
Система обучена на 680 000 часах речевых данных из сети и распознает 99 языков, включая русский.