Найти в Дзене
charla-ai

7 ошибок AI-транскрибаторов, которые могут стоить райтеру времени и денег

Оглавление

Транскрибация с помощью искусственного интеллекта — это быстрый способ перевести аудио в текст, загрузив файл в программу-расшифровщик. Такой способ экономит время на ручную расшифровку, но есть несколько но. Аi транскрибация может выдать кучу ошибок. Пропущенные слова, искаженные фразы, странные разбивки на короткие предложения вроде: «Он говорил. Чтобы. Все поняли. Что происходит». А ещё транскрибаторы коверкают названия городов и фамилий, пропускают слова и знаки препинания. В итоге приходится тратить часы на правки или заказывать расшифровку у специалистов.

Источник: freepik.com
Источник: freepik.com

Мы поговорили с журналистами и выделили 7 самых частых ошибок AI-транскрибаторов. Расскажем, сколько за них платит райтер текста и как этого избежать.

ТОП распространенных ошибок

Качество транскрибации сильно зависит от качества звука и наличия шумов на заднем фоне, например, музыки или голосов. Лучше всего работать с микрофоном в тихом помещении. Тогда после преобразования вам останется только вычитать текст и внести несколько правок, которые не отнимут часы жизни.

Ошибка 1: Ошибки в тайм-кодах. ИИ может неправильно определить начало или конец фрагмента речи, особенно если в аудиозаписи есть паузы или говорящий резко меняет темп речи.

Ошибка 2: Некорректное написание сокращений и аббревиатур. Пример: «тезе» вместо «ТЗ» (техническое задание). Пример 2: «ГИББД» вместо «ГИБДД».

Ошибка 3: Неправильная интерпретация жаргона, терминов и имен. AI-транскрибация не всегда справляется со специфическими словами, именами и фамилиями. Пример: «бабки» (деньги) воспринимаются как «бабушки». Пример 2: фамилия «Петриков» превращается «Петряков».

Ошибка 4: Искажение смыслов. Пример: «это может быть полезно» AI понимает как «это бесполезно».

Ошибка 5: Трудности с распознаванием шепота и тихой речи. Нейросеть для транскрибации аудио в текст может не расслышать речь и не зафиксировать некоторые слова, фразы, буквы или заменить одно слово другим. Пример: в середине предложения «ключевое слово» превращается в пробел. Пример 2: слово «давно» интерпретируется как «равно».

Ошибка 6: Искажение числовых данных и единиц измерения. Чаще всего такие ошибки можно встретить в аудио и видео, где есть какая-то техническая информация. Пример: «5 кг» интерпретируется как «5 грамм». Или «25 000» превращается в «2 500».

Ошибка 7: Ошибки в обозначении времени. Пример: «пять минут назад» AI превращает в «пятнадцать минут назад». Такой перевод текста в нейросети заставляет переслушивать запись, чтобы исправить хронологические ошибки.

Среди других ошибок: пропущенные абзацы и куски текста, проблема с обозначением спикеров, ошибки в пунктуации. Также нейросетям пока сложно перевести голосовое в текст, сохранив эмоциональный подтекст, например, саркастическую фраза «ну, молодец!» он может понять в буквальном смысле, что влияет на весь тон текста. Также онлайн транскрибатор текста может не всегда корректно понимаать региональные особенности речи, что искажает смысл. Или может залипнуть и воспроизвести одно слово несколько раз подряд.

Цена ошибки

Некачественный текст нужно редактировать. В зависимости от длины материала, специфики тематики, а также ставки корректора/редактора ошибки будут стоить райтеру от 200 до 600 рублей за 1000 знаков и 1-2 часа на редактуру часовой записи. Корректировку технических, медицинских, юридических текстов оценивают от 500 до 1000 рублей.

В некоторых случаях запись придется переслушивать полностью или частично. Чтобы расшифровать аудио в текст, специалист возьмет в среднем 200 рублей за 10 минут​. Расшифровка займет от 24 часов до 4 дней — зависит от длины записи. Все данные основаны на расценках, которые мы нашли на сайтах корректоров, редакторов, транскрибаторов.

Работа транскрибатора VS нейросеть

Несмотря на ошибки, нейросети выигрывают по скорости и стоимости и с каждым годом становятся все точнее, так как постоянно обучаются. На 2024 год точность AI-транскрибаторов доходит до 95%. Нужно просто найти тот сервис, который подойдет вам лучше всего.

Источник: freepik.com
Источник: freepik.com

На что обратить внимание при выборе

В первую очередь задайте себе вопрос, для чего вам перевод аудио в текст, как часто вы будете использовать транскрибатор, какие объемы он должен конвертировать за раз. Кроме точности обратите внимание на:

  • ограничения по объему и длине;
  • ценообразование — сравните цены и тарифы, чтобы выбрать тот сервис, который соответствует бюджету и объемам транскрибации;
  • мультиязычность (случается ли вам работать с разными языками?);
  • удобство интерфейса: пришел, увидел, загрузил, получил;
  • скорость должна быть высокой, но не в ущерб качеству.

3 популярных программы для расшифровки аудио в текст

Предлагаем три сервиса с положительными отзывами, которые вы можете протестировать на бесплатной основе, чтобы сделать свой выбор.

Charla

-3
  • Точность расшифровки: 93%
  • Тестовый период: 5 дней
  • Скорость: 5 часов аудио/видео расшифрует за 7 минут
  • Расшифровка более 100 языков
  • Разделение на спикеров: есть
  • Разделение на абзацы: есть
  • Без лимитов по весу и длительности
  • Установка тайм-кодов: есть
  • Расшифровка видео в текст: есть
  • Тарифы: от 2 рублей за минуту, есть безлимиты, которые сокращают стоимость минуты практически до нуля
  • Чат-бот в Telegram для расшифровки небольших файлов

Главные плюсы: точность, длительность тестового периода, высокая скорость, мультиязычность, отсутствие лимитов по весу и времени, невысокая стоимость, быстрая транскрибация небольших файлов через чат-бот в Telegram, за каждого приглашенного пользователя — от 1 до 26 дней бесплатного безлимита для расшифровки аудио и видео.

-4

Teamlog

-5
  • Точность расшифровки: 95%
  • Тестовый период: 15 минут
  • Скорость: 1 час аудио/видео расшифрует за 6 минут
  • Расшифровка на русском и английском языках
  • Разделение на спикеров: есть
  • Разделение на абзацы: есть
  • Видео любой длительности, ограничение по размеру файла – 1,5 Гб
  • Установка тайм-кодов: есть
  • Расшифровка видео в текст: есть
  • Тарифы: от 6 рублей за минуту

Главные плюсы: точность расшифровки, удобный интерфейс, загрузка видео любой длительности.

Отзыв

Источник: partnerkin.com
Источник: partnerkin.com

Conspecto

-7
  • Точность расшифровки: 95%
  • Тестовый период: 1 минута
  • Скорость: 1 час аудио/видео расшифрует за 5-7 минут
  • Расшифровка более 50 языков
  • Разделение на спикеров: есть
  • Разделение на абзацы: есть
  • Ограничение по размеру файла – 2 000 Мб
  • Установка тайм-кодов: есть
  • Расшифровка видео в текст: есть
  • Тарифы: от 4 рублей за минуту
  • Чат-бот Telegram для расшифровки небольших файлов

Главные плюсы: высокая точность, мультиязычность, невысокая стоимость, чат-бот для расшифровки небольших файлов.

Отзыв

Источник: irecommend.ru
Источник: irecommend.ru

Несколько советов по работе с AI

Напоследок скажем, что 100% точности AI-транскрибатор не даст, как и человек. Могут быть ошибки в распознавании фамилий и топонимов — это нормально. Тем не менее перевод аудио в текст онлайн через AI значительно сэкономит время и деньги. Если человек расшифрует час записи за 180 минут и возьмет за в среднем 1000-1200 рублей, то программа сделает это за 2-5 минут и 120-360 рублей в зависимости от выбранного вами транскрибатора (мы учитывали только представленные в статье), плюс не забываем, что безлимитные тарифы могут ещё сократить стоимость минуты.

Сэкономленное время вы потратите на сокращение текста, его редактуру и форматирование. Главное, выбрать программу, которая отвечает вашим потребностям.