Найти в Дзене
Герман Геншин

6 Способов транскрибировать аудио без установки приложения

Оглавление

Чтение — более быстрая задача, чем прослушивание. Транскрипции помогают, но установка приложения только для преобразования аудио — это трата места. Эти онлайн-инструменты позволяют выполнить транскрипцию мгновенно, без необходимости загружать что-либо.

1 Revoldiv

Revoldiv — это мой личный фаворит благодаря своей простоте использования, полностью бесплатному доступу и мгновенной транскрипции видео и аудиофайлов. Для работы с платформой не требуется создавать учетную запись, однако, наличие аккаунта позволяет сохранить ваши файлы и изменения в облаке.

-2

Как и большинство инструментов для транскрипции, Revoldiv использует технологии OpenAI, такие как Whisper, и другие модели для точного и быстрого преобразования. Он может различать нескольких speakers, а также фиксировать крики, речь и аплодисменты. Поддерживается редакция транскрипций для исправления ошибок и удаления лишних слов. Видео или аудиофайл можно редактировать одновременно с текстом. Транскрипции экспортируются в виде обычных текстовых файлов или субтитров. Встроенная функция обмена ссылками также позволяет публиковать проекты.

Revoldiv совместим с Chrome (а также другими браузерами на основе Chromium) и Mozilla Firefox, но не поддерживает пакетную загрузку и ограничен двумя часами на один медиафайл.

2 Otter.ai

-3

Otter.ai — один из самых известных инструментов для преобразования речи в текст. Он позиционируется как ИИ-помощник для встреч, который присоединяется к вам на них и делает заметки. Хотя Otter в первую очередь используется для транскрипции в реальном времени, он способен генерировать транскрипции и субтитры для записанных видео.

Otter.ai предлагает автоматизированную транскрипцию в реальном времени с определением speakers и ИИ-сгенерированными резюме. Вы можете использовать его для транскрипции аудио или видео файлов бесплатно или выбрать любой из платных тарифов.

Otter.ai использует модель «фремиум», где бесплатный план позволяет импортировать и транскрибировать до 3 аудио или видео файлов. Профессиональный план (стоимостью 8,33 $ в месяц) увеличивает лимит до 10 аудиофайлов, а бизнес-план предлагает неограниченные транскрипции загруженных файлов.

Однако Otter не всегда предлагает лучшее соотношение цены и качества — вы можете быстро достичь лимитов транскрипции. Тем не менее, это хороший вариант для сотрудников и команд, которым нужны его совместные инструменты и интеграция в рабочие процессы.

3 Загрузить на YouTube

Хотя процесс и требует больше шагов, вы также можете воспользоваться функцией автоматической генерации транскрипций на YouTube, чтобы создать транскрипции для ваших аудио и видео файлов.

Чтобы транскрибировать свои аудиофайлы на YouTube, вам сначала нужно будет преобразовать их в видео перед загрузкой. Вы можете загрузить до 15 видео одновременно, но есть ограничения по количеству видео, которые можно загрузить за 24 часа. После загрузки вы сможете создать транскрипцию, нажав кнопку Показать транскрипцию.

Вам не нужно публиковать видео для генерации транскрипции.

Хотя вы можете загружать файлы пакетно, транскрипции YouTube зачастую хуже, чем у Revoldiv. Кроме того, они по умолчанию не содержат знаков препинания, и единственным способом экспорта сгенерированных транскрипций является их копирование и вставка. Однако транскрипции YouTube также могут помочь вам сократить время, проводимое на платформе.

4 Rev

-4

Rev — это популярная платформа для субтитров и транскрипций, предлагающая как услуги, так и с применением ИИ. Вы можете выбрать между автоматизированными транскрипциями и транскрипцией от людей. Также предлагаются субтитры, переводы и титры.

Rev предлагает ИИ-генерированные транскрипции через платформу VoiceHub. Она использует модель «фремиум», аналогичную той, что применяется в Otter.ai, где бесплатный план позволяет загружать 30-минутные видео и аудиофайлы с месячным лимитом 300 минут.

Базовый план стоит около 10 $ в месяц (с ежегодной оплатой) и позволяет 90-минутные беседы, а также 1200 минут транскрипции в месяц. Транскрипции, выполненные человеком, стоят дороже и оцениваются в 1,50 $ за минуту. Естественно, такие транскрипции являются более точными, но их доставка занимает больше времени.

Rev также предлагает автоматизированные записи встреч и транскрипцию в реальном времени на Zoom и других подобных платформах.

5 TurboScribe

TurboScribe — это платформа для транскрипции аудио, которая предлагает более доступную альтернативу Otter.ai и Rev. Она работает на основе OpenAI Whisper и поддерживает до 98 языков.

Бесплатный план предлагает три транскрипции в день, каждая до 30 минут. У пользователей на бесплатном плане время ожидания ниже при загрузке, чем у платных пользователей. Платный план, Turbo Unlimited, стоит столько же, сколько Rev — 10 $ в месяц, но предлагает гораздо больше ценности с возможностью загрузки до 10 часов и неограниченными транскрипциями.

TurboScribe предлагает отличные условия, особенно если у вас много аудио или видео файлов для транскрибирования.

6 Whisper

Если вы предпочитаете обойти посредников и обратиться напрямую к источнику, OpenAI Whisper доступен для бесплатного использования и в настоящее время считается стандартом для точного преобразования речи в текст. Многие инструменты для транскрипции используют модель Whisper, добавляя более простой интерфейс и удобные функции, такие как определение speakers, одновременное редактирование аудио/видео и автоматическая разбивка на главы.

Маленькое замечание: OpenAI разработала Whisper, чтобы облегчить извлечение данных из видео на YouTube и подкастов для тренировки своих языковых моделей.

Вы можете запустить модель на своем компьютере, но для этого потребуется компьютер с выделенной видеокартой, Python 3.7 или новее, и установленный ffmpeg. Однако также существуют онлайн-реализации Whisper, которые полностью функционируют в облаке без необходимости установки приложений.

Google Colab — быстрый и удобный способ использовать Whisper онлайн. Это хостинговая служба Jupyter Notebook, которая позволяет вам писать и выполнять код прямо в вашем веб-браузере. Чтобы использовать Whisper на Google Colab, скопируйте этот блокнот и следуйте инструкциям.

В результате будет получен текстовый файл с транскрипцией, который будет расположен в разделе Файлы. Вы можете изменить "txt" на "srt", "json", "vtt" или "all" (для всех доступных форматов выпуска).

Хотя этот метод может быть не столь интуитивным, как предыдущие инструменты транскрипции, он сильно настраиваемый и зачастую более точный.

Существует несколько вариантов транскрипции аудио или видео файлов, которые работают полностью в облаке. Revoldiv — мой личный фаворит, а Whisper — близкий второй, но любой из предложенных вариантов может удовлетворить ваши нужды.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Вы также можете читать наши материалы в: