Программное обеспечение для преобразования голоса в текст постоянно совершенствуется. Разумеется, лучшей задачей для них пока остаются простые тексты, да и в этом случае их приходится вычитывать. Но, в скорости обработки ПО бесспорно оставляет специалистов ручного конвертирования голоса в текст далеко позади.
Есть у автоматизированных сервисов еще один большой плюс: имея под рукой интернет-приложение, партнеры могут спокойно вести беседы, не предназначенные для ушей стенографисток.
Автоматизированных транскрибаторов сейчас создано много, и не все они отличаются хорошим качеством. Выбрать безупречного помощника – задача непростая. Мы решили ее облегчить и проанализировали для вас 13 сервисов-транскрибаторов.
1. Писец
Этот сервис с весьма противоречивым именем готов предоставить текстовую версию видео-и аудиофайлов. У пользователя есть возможность задать некоторые параметры готового продукта – в частности, он может отказаться от деления текста на спикеров либо выбрать их количество от 2 до 5 лиц.
Пример расшифровки:
Ресурс работает с физическими и юридическими лицами, причем последним доступны специальные условия и дополнительные услуги.
Безопасность сервиса заключается в применении собственных технологий, благодаря которым данные клиента не покидают пространства сервера компании. Кроме того, у сайта нет функции хранения медиафайлов заказчика: сразу после сдачи работы все исходники удаляются.
Тарифы
Физлицам доступны 4 тарифа, один из которых – бесплатный. Но время расшифровки у него составляет 24 часа (все зависит от длины очереди).
Для ускорения процесса можно подключиться к платному тарифу:
- 5 часов – 990 р.;
- 10 часов – 1620 р.;
- 15 часов – 1980 р.
Юридическим лицам доступны три тарифа:
- 25 часов – 6000 р.;
- 50 часов – 12000 р.;
Персональный – все условия определяются индивидуально совместно с индивидуальным менеджером.
Для открытия личного кабинета клиенту надо зарегистрироваться через E-mail.
2. Any to text
Сервис оказывает услуги по преобразованию в текст аудио-и видеозаписей. Один из лучших бесплатных транскрибаторов. Здесь не надо регистрироваться, отсутствует ограничение по объему файла. Просто имейте в виду, что от длины исходного видео или аудио зависит время выдачи готового продукта.
Порядок действий:
Загрузите файл с персонального компьютера либо вставьте ссылку на Ютуб, Рутуб, Яндекс-диск.
Кликните по надписи «Преобразовать в текст». Если вы использовали лимит по минутам, сервис предложит оплатить дополнительные.
Дождитесь завершения транскрибации и скачайте текст в удобном для вас формате – TXT, docx, srt или xlsx.
На этом сервисе есть удобная функция – распознавание языка в автоматическом режиме.
3. Product Radar
Чат-бот обрабатывает и превращает звуковые файлы в текст, удобный для чтения, с помощью нейросети. Но это еще не все: по заданию пользователя он создает по полученной статье вопросы и ответы, конспект и чек-лист. К тому же в чат-боте предусмотрены инструменты, с помощью которых можно задать кастомизацию готового текста.
Сервис Product Radar пользуется популярностью у копирайтеров, авторов курсов и журналистов.
Бот работает в двух режимах:
- «Оригинал» – на выходе пользователь получает текст, ни на йоту не отступающий от исходного материала.
- «Креативней»
Во втором режиме нейросеть выполняет обработку финального файла, меняя некоторые выражения, добавляя усилители и т.д.
4. Converter App
Этот сервис предоставляет услуги по конвертации видео в текстовый файл. Converter App дает свободный (бесплатный) доступ ко всем своим конвертерам. Но данный ресурс ничем не отличается от других подобных конвертеров в плане ограничения количества обрабатываемых файлов в сутки.
Чтобы начать процесс конвертации видео в текст, надо отправить исходный файл в загрузчик конвертера.
Сразу после его загрузки автоматически запустится конвертирование. Как только система завершит работу, кликните по кнопке «Загрузка» и скачайте финальный текст.
Пользователь может загружать неограниченное количество файлов, но только платно. Стоимость услуги можно узнать только после загрузки исходного файла. Чтобы пополнить счет, кликните по вкладке «Donate».
Операцию можно осуществить через PayPal дебетовую или кредитную банковскую карту .
Converter App не входит в список известных сайтов, но в интернете уже есть много положительных отзывов. Последняя проверка ресурсом WEB Paranoid (она проводилась в апреле 2023 года) подтверждает законность сайта, следовательно нет оснований сомневаться в его честности.
5. Голосовой блокнот
С помощью голосового блокнота можно перевести в текст видео и аудио. В отличие от большинства сервисов, конвертирующих звуки в текст, этот ресурс работает через микрофон. Текст можно ввести голосом либо путем воспроизведения звукового файла. В первом случае пользователь говорит в микрофон, во втором – располагает его напротив колонок.
Чтобы увидеть инструкцию, достаточно кликнуть по треугольному значку, расположенному слева от названия сервиса.
Перед началом работы надо выбрать нужный режим. Если пользователь планирует диктовать текст самостоятельно, он должен сначала нажать на кнопку “Включить запись”.
Чтобы транскрибировать видео или аудиозапись, систему переключают в режим “Транскрибация” (соответствующий инструмент находится под результирующим полем.
После этого на экране откроется панель транскрибации, в которую загружают исходный файл.
Микрофон располагают как можно ближе к колонкам и включают запись. Есть более удобный вариант - с использованием стерео-микшера.
Пример транскрибации видеофайла:
Сервисом можно пользоваться и без регистрации, но обладатель личного кабинета получает доступ к большему количеству инструментов, ускоряющих работу.
По завершении регистрации клиент получает доступ в личный кабинет, где может выбрать режим расширенных возможностей по цене:
150 р. — на 1 мес.
350 р. — на 3 мес.
900 р. — на год.
Для людей, часто пользующихся ресурсом, целесообразно приобрести премиум-функции блокнота за 400 р./мес.
Несмотря на некоторые недоработки (например, прерывание записи при блокировке экрана смартфона) голосовой блокнот имеет много положительных качеств. Особенно тепло о нем отзываются люди, не овладевшие печатью “вслепую”:
6. RealSpeaker
Новая платформа, находится на стадии тестирования, но уже готова к оказанию услуг по преобразованию звуковых файлов в текст. Загружать в систему можно видео и аудио. Ресурс платный, за конвертирование исходника надо заплатить 16 р./мин. 1,5-минутные материалы транскрибируются бесплатно.
Перед началом работы на главной странице пользователь выбирает язык. при нажатии на кнопку “Продолжить” на экране появляется вкладка с инструментом загрузки файла.
как только файл загрузится, система выдает информацию о длительности исходника и времени выполнения транскрибации.
Кликнув по надписи “Перейти в МОи медиа”, пользователь попадает на страничку с загруженным материалом.
Остается нажать на кнопку “Транскрибировать” и получить счет к оплате.
Сейчас на сервисе функция регистрации отсутствует, видимо она появится позже, после его доработки. В условиях пользования разработчик указывает, что пользоваться всеми благами веб-сайта можно только после получения лицензии на его использование. Но пока механизм подписания Соглашения непонятен.
7. WordVoice
Сервис работает с речью, видео- и аудиозаписью. Отличный ресурс для записи лекций и расшифровки совещаний.
WordVoice – платный, оплата конвертации осуществляется по единому тарифу – 5 р./мин. После регистрации каждый пользователь получает бонус в размере 90 рублей. В дальнейшем ему придется следить за содержимым кошелька. Минимальная сумма при пополнении счета – 100 рублей.
Для регистрации кликните по надписи «Личный кабинет».
Заполните форму, дождитесь письма и подтвердите регистрацию. Создайте пароль и войдите в личный кабинет. Вы увидите вот такую картину:
Обратите внимание на левый верхний угол: там виден ваш 90-рублевый бонус.
Когда файл загрузится, запускайте расшифровку.
Вас может ждать вот такой сюрприз: средств в кошельке недостаточно, система показывает расчет стоимости и предлагает оплатить заказ.
Отсутствие тестового режима отпугивает потенциальных клиентов, поскольку они не могут оценить результат конвертирования.
И еще один существенный недостаток: если пользователь во время загрузки файла (а этот процесс не быстрый) перейдет на другую вкладку, задание в приложении обнуляется.
8. oTranscribe
Бесплатное приложение, способное работать с видеороликами и аудиозаписями. Отличительная черта ресурса – абсолютная конфиденциальность исходников и расшифровки.
Процесс конвертирования протекает в следующем порядке:
Пользователь нажимает на кнопку с надписью “Начать расшифровку”.и переходит на вкладку с инструментами загрузки исходника.
Выбирает файл и…. дальше ничего не происходит.
Возможно, файл поставлен в очередь, или приложению не понравился его формат - никакой информации на этот счет система не выдает..
9. Speech to Text
Сервис ориентирован на работу с аудиозаписями. Для пользования приложением требуется регистрация. Загрузить звуковой файл можно только в личном кабинете.
В ней вы указываете электронный адрес и придуманный пароль. Но владение личным кабинетом само по себе не дает возможности проверить качество приложения: надо еще положить деньги на счет. и вот тут начинается самое интересное: собственник конвертера утверждает, что его услуги стоят дешевле многих конкурентов. При внимательном изучении информации о ценах в глаза бросается несоответствие: час распознавания стоит $10, а расшифровка часовой записи - 100 рублей. По крайней мере, такой тариф указан на сайте.
10. Бесплатная технология распознавания речи (ASR) от ВКонтакте
По заявлению владельцев сервиса он одинаково хорошо справляется с правильной речью и сленгом.
Каждый пользователь ограничен суточным лимитом в 100 минут суммарной длительности аудиофайлов. Каждый исходник не должен превышать объема 100 МБ.
Сайт с удовольствием предоставит вам безлимит – но за отдельную плату. Информации об условиях и тарифах в свободном доступе нет. Чтобы добраться до них клиенту необходимо отправить заявку на электронный адрес, указанный в разделе «Ограничения» на вкладке «Документация».
11. Teamlogs
Войти в систему можно после регистрации либо используя ник и пароль Гугл-аккаунта. В личном кабинете можно протестировать ресурс, загрузив файл длительностью не более 15 минут (они бесплатны такой подарок ждет новичков на сайте Teamlogs)
Для проверки возможностей системы в нее был загружен файл с песней. Вот как нейросеть справилась с нестандартной речью:
Судя по итоговому тексту, приложение Teamlogs желательно использовать для транскрибации правильной речи с четким произношением.
Стоимость одной минуты при пополнении:
- 0-30 мин – 20 р.;
- 30-150 мин – 10 р.;
- 150-300 мин – 9 р.;
- 301-1000 мин – 8 р.;
- 1000-5000 мин – 7 р.;
- 5000-10000 мин – 6 р.
Время обработки и стоимость заказа система рассчитывает автоматически.
12. Apihost (транскрибация Аудио в текст онлайн)
Онлайн-сервис по преобразованию голоса, видеозаписи и аудиофайла в текст справляется с задачей быстро: всего от 6 до 10 минут ему понадобится для конвертирования часовой звукозаписи. Приложение «владеет» 70-ю языками, что делает его универсальным. Однако картину немного портит несовершенство услуги коррекции. Эта функция находится в стадии корректирования, и в ближайшем будущем будет встроена в инструментарий приложения.
Демо-версии ресурса нет, поэтому даже его тестирование приходится выполнять платно. Не удивительно, что при невысоких ценах сайт до сих пор находится далеко от первенства.
Онлайн-сервис предлагает 7 тарифов. Три из них – безлимитные (два по 5000 и один по 10000 рублей). Пользователю доступны 4 тарифа с оплатой по символам стоимостью от 0,6 до 6,5 руб./1000 симв.
13. Transkriptor
Бот Transkriptor – отличный помощник для бизнесменов, большую часть рабочего времени проводящих в совещаниях, общениях с деловыми партнерами и подчиненными. Приложение исправно записывает все разговоры, а затем расшифровывает их и выдает в виде текста.
На сайте есть возможность познакомиться с ботом поближе бесплатно. Но система все равно попросит вас авторизоваться. проще всего это сделать через Гугл-аккаунт. Для сравнения с Teamlogs дадим боту поработать с тем же аудиофайлом.
Результирующий файл получился хуже чем в Teamlogs.
После такого эксперимента возникает сомнение в способностях бота транскрибировать живую речь без ошибок. Ведь на деловые встречи приходят люди с разной дикцией.
Тарифные планы сервиса не отличаются разнообразием. Их всего четыре – по паре для физических и юридических лиц.
Частным лицам предлагается Лайт ($4,99) с ограничением в 300 мин/мес. и Премиум ($ 12,99) на 2400 мин/мес.
Компаниям доступны Премиум + и Бизнес. Первый тариф допускает выбор месячной нормы (часовой) транскрибаций, второй – количества членов команды. От значения этих величин зависит стоимость тарифного плана.