Добавить в корзинуПозвонить
Найти в Дзене

Аудио и видео в текст: как это сделать быстро и бесплатно с помощью ChatGPT

В этой статье мы не будем рассматривать саммари (как тут), а разберем полную транскрибацию видео. Иногда нам нужно получить полную расшифровку аудио или видео, и ранее транскрибация стоила денег на биржах фриланса. Для чего нужна транскрипция: - расшифровка вебинаров и подкастов - расшифровка видео (например, чтобы потом превратить ваше видео в пост или статью) - расшифровка лекции - расшифровка переговоров и звонков с клиентами - текстовый формат позволяет «слушать» и «смотреть» интересные аудио и видео людям с ограниченными возможностями слуха - ввиду ограниченного количества времени некоторые пользователи хотели бы быстро ознакомиться с текстом, нежели тратить время на полное часовое видео. Современные технологии позволяют все это сделать за несколько кликов, и не нужно обращаться к фрилансерам. К тому же фрилансер не сделает это за минуты, сколько уходит на это у ИИ. Не все сервисы позволяют бесплатно транскрибировать длинные аудио и видео. Поэтому если ваш файл длинный, приготовьт
Оглавление

В этой статье мы не будем рассматривать саммари (как тут), а разберем полную транскрибацию видео.

Иногда нам нужно получить полную расшифровку аудио или видео, и ранее транскрибация стоила денег на биржах фриланса.

Для чего нужна транскрипция:

- расшифровка вебинаров и подкастов

- расшифровка видео (например, чтобы потом превратить ваше видео в пост или статью)

- расшифровка лекции

- расшифровка переговоров и звонков с клиентами

- текстовый формат позволяет «слушать» и «смотреть» интересные аудио и видео людям с ограниченными возможностями слуха

- ввиду ограниченного количества времени некоторые пользователи хотели бы быстро ознакомиться с текстом, нежели тратить время на полное часовое видео.

Современные технологии позволяют все это сделать за несколько кликов, и не нужно обращаться к фрилансерам. К тому же фрилансер не сделает это за минуты, сколько уходит на это у ИИ.

Этап 1. Бесплатная транскрибация аудио и видео в текст

Не все сервисы позволяют бесплатно транскрибировать длинные аудио и видео. Поэтому если ваш файл длинный, приготовьтесь его делить на части.

Сервис AnyToText

AnyToText позволяет транскрибировать только 15-минутные файлы, поэтому придется использовать редактор для разделения файлов. Например, CapCut.

Если на сервисе заканчивается пробный период – используйте лайфхак - откройте браузер в режиме инкогнито и продолжайте работу с файлами.

В конце обработки файла вы получите текст.

Скриншот с главной страницы сервиса AnyToText
Скриншот с главной страницы сервиса AnyToText

Сервис Whisper AI от OpenAI

Бесплатна, но с ограничениями. Можно вставить ссылку на YouTube-видео или загрузить аудиофайл. На большие файлы скорее всего выдаст сообщение, что вы израсходовали лимит и предложит подождать от нескольких часов до суток.

SaluteSpeech – бот от Сбера.

SaluteSpeech - бесплатный Телеграм-бот от Сбера. Он с синей галочкой.

При поиске бота в Телеграм, бот от Сбера с синей галочкой.
При поиске бота в Телеграм, бот от Сбера с синей галочкой.

и есть декстопное приложение для компьютера. Скачать можно тут, на официальной странице Сбера для разработчиков.

Бот позволяет переводить голосовые сообщения в текст - поможет, если вам нужно транскрибировать аудио-файлы и голосовые. Если у вас нет платной версии Telegram это будет идеальным решением.

Скриншот из бота Сбера
Скриншот из бота Сбера

Получив результат транскрибации нужно иметь ввиду, что не всегда этот текст читаем.

Там будет огромное полотно текста, без абзацев, точек и запятых, со словами паразитами, «эээ» и обрывочные фразы, которые автор не закончил, перескочив на другую мысль.

Это совсем не читабельно. Поэтому этот текст нам нужно обработать.

Этап 2. Редактирование транскрибации с помощью ChatGPT

Вставляем полученный текст в нейросеть и пишем промпт:

Я дам тебе транскрибацию аудио. Ты, как грамотный редактор, должен сделать редактуру этого текста в читаемый формат.
Твоя задача:
- разбить этот текст на логические абзацы по 2-3 предложения в каждом.
- исправить все грамматические ошибки
- убрать из текста слова-паразиты
- выделить жирным главные мысли текста.
Сам текст НЕ меняй, ничего не добавляй от себя. На выходе должен быть предоставленный текст, но очищенный от слов-паразитов и в читаемом виде.

Автоматическая транскрибация через сервис make.com

А хотите, чтобы все, что написано выше, происходило автоматически, без вашего участия?

Это возможно сделать с помощью сервиса автоматизации make.com.

Вы создаете сценарий, в котором:

  • Первый модуль будет забирать по ссылке аудио или видео
  • Далее по цепочке специальный сервис будет транскрибировать наше видео
  • По вашему усмотрению вы можете поставить модуль любой нейросети, которая вам нравится, в которую можно прописать промпт, который дан выше, чтобы получить читаемый текст.
  • А сам текст, например, послать себе на почту или в Google Docs.

Вам только останется кидать ссылки в ваш файлик для сбора ссылок. Остальное все за вас сделает автоматизация.

Сервисы транскрибации: Apify и Assembly – у обоих есть бесплатные токены.

Скриншот одного из моих сценариев для трансрибации
Скриншот одного из моих сценариев для трансрибации

Если вы хотите узнать больше об автоматизации и нейросетях, подписывайтесь на наш Телеграм-канал ixai (http://t.me/ixaiv). Здесь вы найдете еще больше авторских наблюдений и практических рекомендаций для эффективной работы.