Найти тему
toolads

Расшифровываем аудио в текст на 99 языках: как использовать Whisper от создателей ChatGPT

Whisper — бесплатная система распознавания речи от OpenAI. Проблема в том, что у нее нет веб-версии как у ChatGPT. Придется устанавливать вручную, читать гайды, написанные разработчиками для разработчиков, писать какой-то код и так далее. На самом деле попробовать нейросеть можно прямо из браузера.

изображение сгенерировано Midjourney
изображение сгенерировано Midjourney

Кому пригодится

Редакторам, спикерам и вообще всем, кому нужно расшифровывать аудио. Причем способы применения могут быть совершенно разные:

  • Провели рабочий созвон в Zoom или Google Meet — получили текст, который поможет погрузиться в контекст, сделать фоллоу-ап и не упустить детали.
  • Провели интервью — сразу получили готовый текстовый драфт.
  • Выступили с докладом на конференции — оформили в виде статьи минимальными усилиями.
  • Записали лекцию или презентацию проекта — получили готовую текстовую версию.
  • Или сделали субтитры и так далее.

Система обучена на 680 000 часах речевых данных из сети и распознает 99 языков, включая русский.