Транскрибация с помощью искусственного интеллекта — это быстрый способ перевести аудио в текст, загрузив файл в программу-расшифровщик. Такой способ экономит время на ручную расшифровку, но есть несколько но. Аi транскрибация может выдать кучу ошибок. Пропущенные слова, искаженные фразы, странные разбивки на короткие предложения вроде: «Он говорил. Чтобы. Все поняли. Что происходит». А ещё транскрибаторы коверкают названия городов и фамилий, пропускают слова и знаки препинания. В итоге приходится тратить часы на правки или заказывать расшифровку у специалистов.
Мы поговорили с журналистами и выделили 7 самых частых ошибок AI-транскрибаторов. Расскажем, сколько за них платит райтер текста и как этого избежать.
ТОП распространенных ошибок
Качество транскрибации сильно зависит от качества звука и наличия шумов на заднем фоне, например, музыки или голосов. Лучше всего работать с микрофоном в тихом помещении. Тогда после преобразования вам останется только вычитать текст и внести несколько правок, которые не отнимут часы жизни.
Ошибка 1: Ошибки в тайм-кодах. ИИ может неправильно определить начало или конец фрагмента речи, особенно если в аудиозаписи есть паузы или говорящий резко меняет темп речи.
Ошибка 2: Некорректное написание сокращений и аббревиатур. Пример: «тезе» вместо «ТЗ» (техническое задание). Пример 2: «ГИББД» вместо «ГИБДД».
Ошибка 3: Неправильная интерпретация жаргона, терминов и имен. AI-транскрибация не всегда справляется со специфическими словами, именами и фамилиями. Пример: «бабки» (деньги) воспринимаются как «бабушки». Пример 2: фамилия «Петриков» превращается «Петряков».
Ошибка 4: Искажение смыслов. Пример: «это может быть полезно» AI понимает как «это бесполезно».
Ошибка 5: Трудности с распознаванием шепота и тихой речи. Нейросеть для транскрибации аудио в текст может не расслышать речь и не зафиксировать некоторые слова, фразы, буквы или заменить одно слово другим. Пример: в середине предложения «ключевое слово» превращается в пробел. Пример 2: слово «давно» интерпретируется как «равно».
Ошибка 6: Искажение числовых данных и единиц измерения. Чаще всего такие ошибки можно встретить в аудио и видео, где есть какая-то техническая информация. Пример: «5 кг» интерпретируется как «5 грамм». Или «25 000» превращается в «2 500».
Ошибка 7: Ошибки в обозначении времени. Пример: «пять минут назад» AI превращает в «пятнадцать минут назад». Такой перевод текста в нейросети заставляет переслушивать запись, чтобы исправить хронологические ошибки.
Среди других ошибок: пропущенные абзацы и куски текста, проблема с обозначением спикеров, ошибки в пунктуации. Также нейросетям пока сложно перевести голосовое в текст, сохранив эмоциональный подтекст, например, саркастическую фраза «ну, молодец!» он может понять в буквальном смысле, что влияет на весь тон текста. Также онлайн транскрибатор текста может не всегда корректно понимаать региональные особенности речи, что искажает смысл. Или может залипнуть и воспроизвести одно слово несколько раз подряд.
Цена ошибки
Некачественный текст нужно редактировать. В зависимости от длины материала, специфики тематики, а также ставки корректора/редактора ошибки будут стоить райтеру от 200 до 600 рублей за 1000 знаков и 1-2 часа на редактуру часовой записи. Корректировку технических, медицинских, юридических текстов оценивают от 500 до 1000 рублей.
В некоторых случаях запись придется переслушивать полностью или частично. Чтобы расшифровать аудио в текст, специалист возьмет в среднем 200 рублей за 10 минут. Расшифровка займет от 24 часов до 4 дней — зависит от длины записи. Все данные основаны на расценках, которые мы нашли на сайтах корректоров, редакторов, транскрибаторов.
Работа транскрибатора VS нейросеть
Несмотря на ошибки, нейросети выигрывают по скорости и стоимости и с каждым годом становятся все точнее, так как постоянно обучаются. На 2024 год точность AI-транскрибаторов доходит до 95%. Нужно просто найти тот сервис, который подойдет вам лучше всего.
На что обратить внимание при выборе
В первую очередь задайте себе вопрос, для чего вам перевод аудио в текст, как часто вы будете использовать транскрибатор, какие объемы он должен конвертировать за раз. Кроме точности обратите внимание на:
- ограничения по объему и длине;
- ценообразование — сравните цены и тарифы, чтобы выбрать тот сервис, который соответствует бюджету и объемам транскрибации;
- мультиязычность (случается ли вам работать с разными языками?);
- удобство интерфейса: пришел, увидел, загрузил, получил;
- скорость должна быть высокой, но не в ущерб качеству.
3 популярных программы для расшифровки аудио в текст
Предлагаем три сервиса с положительными отзывами, которые вы можете протестировать на бесплатной основе, чтобы сделать свой выбор.
Charla
- Точность расшифровки: 93%
- Тестовый период: 5 дней
- Скорость: 5 часов аудио/видео расшифрует за 7 минут
- Расшифровка более 100 языков
- Разделение на спикеров: есть
- Разделение на абзацы: есть
- Без лимитов по весу и длительности
- Установка тайм-кодов: есть
- Расшифровка видео в текст: есть
- Тарифы: от 2 рублей за минуту, есть безлимиты, которые сокращают стоимость минуты практически до нуля
- Чат-бот в Telegram для расшифровки небольших файлов
Главные плюсы: точность, длительность тестового периода, высокая скорость, мультиязычность, отсутствие лимитов по весу и времени, невысокая стоимость, быстрая транскрибация небольших файлов через чат-бот в Telegram, за каждого приглашенного пользователя — от 1 до 26 дней бесплатного безлимита для расшифровки аудио и видео.
Teamlog
- Точность расшифровки: 95%
- Тестовый период: 15 минут
- Скорость: 1 час аудио/видео расшифрует за 6 минут
- Расшифровка на русском и английском языках
- Разделение на спикеров: есть
- Разделение на абзацы: есть
- Видео любой длительности, ограничение по размеру файла – 1,5 Гб
- Установка тайм-кодов: есть
- Расшифровка видео в текст: есть
- Тарифы: от 6 рублей за минуту
Главные плюсы: точность расшифровки, удобный интерфейс, загрузка видео любой длительности.
Отзыв
Conspecto
- Точность расшифровки: 95%
- Тестовый период: 1 минута
- Скорость: 1 час аудио/видео расшифрует за 5-7 минут
- Расшифровка более 50 языков
- Разделение на спикеров: есть
- Разделение на абзацы: есть
- Ограничение по размеру файла – 2 000 Мб
- Установка тайм-кодов: есть
- Расшифровка видео в текст: есть
- Тарифы: от 4 рублей за минуту
- Чат-бот Telegram для расшифровки небольших файлов
Главные плюсы: высокая точность, мультиязычность, невысокая стоимость, чат-бот для расшифровки небольших файлов.
Отзыв
Несколько советов по работе с AI
Напоследок скажем, что 100% точности AI-транскрибатор не даст, как и человек. Могут быть ошибки в распознавании фамилий и топонимов — это нормально. Тем не менее перевод аудио в текст онлайн через AI значительно сэкономит время и деньги. Если человек расшифрует час записи за 180 минут и возьмет за в среднем 1000-1200 рублей, то программа сделает это за 2-5 минут и 120-360 рублей в зависимости от выбранного вами транскрибатора (мы учитывали только представленные в статье), плюс не забываем, что безлимитные тарифы могут ещё сократить стоимость минуты.
Сэкономленное время вы потратите на сокращение текста, его редактуру и форматирование. Главное, выбрать программу, которая отвечает вашим потребностям.