Найти тему
Пригодится

Ещё один транс-. Транскрибация

Оглавление

Как по мне, русское слово "транскрибация" по смыслу одно и тоже, что и "транскрипция". И у меня есть появлению первого своё объяснение.
Читайте его (объяснение) после титульного коллажа этой моей статьи.

Титульный коллаж к статье Олега Лубского про транскрибацию | © автор коллажа Олег Лубски 2024
Титульный коллаж к статье Олега Лубского про транскрибацию | © автор коллажа Олег Лубски 2024

ЭТИМОЛОГИЯ ТЕРМИНА "ТРАНСКРИБАЦИЯ" ПО ВЕРСИИ ЛУБСКОГО

Слова-прямого аналога русскому слову "транскрибации" в английском нет, там всё называется едино: транскрипция. "Транскрибация" как термин, скорее всего, придуман взамен "транскрипции" российскими блогерами, рилсмейкерами или инстаграмщиками. Транскрипция как слово на слух звучит не совсем благозвучно. Им или захотелось что-то более звучное, хлёсткое, или кто-то решил переиначить одну из версий "транскрипции" на латыни в вариант "как пишется так и пишется": trans-("через; пере-") + scribo ("черчу", "пишу", "переписываю"). Так к началу "транс-" были добавлены корень "-скри-" и суффикс "-бация", а лишнюю "с" из сдвоенного "сс" вычеркнули. Получилось искажение слова "транскрипция", похожее на апробацию, фрагментацию, детализацию и т. д., которые чаще всего описывают в русском языке какие-либо процессы. То есть к ним добавилась "транскрибация".

Кстати, мою подробную статью про термин "транскрипция" (transcription) читайте по ЭТОЙ ССЫЛКЕ.

Теперь ищутся и находятся лингвисты (или не лингвисты?), которые пытаются нам всем объяснить, чем отличается транскрипция от транскрибации.

Одним из наиболее внятных мне показалось вот это:

"То есть задача транскрипции – обеспечить правильно чтение слова (зачастую, иностранного), передав графически запись его звучания для правильности произношения. А вот транскрибация – более обширный процесс, буквально означающий запись воспринимаемого на слух текста".

Вы что-нибудь поняли? Я лично понял подтекст.
Автор вышепредставленного объяснения постеснялся объяснить, что транскрибация делает то же самое:
обеспечивает правильное чтение слова, передавая графически запись его звучания для правильности произношения.

А если она это не обеспечивает, тогда что это такое?
Псевдотранскрипция? Полутранскрибация?

В любом случае, писать и говорить надо стараться правильно.

Поскольку слово "транскрибация" как искаженное от "транскрипции", прижилось в русском языке, опять же, благодаря большой популярности у людей, проводящих всевозможные семинары и вебинары, лекции и т. д. и т. п., которые транскрибацией обзывают любое преобразование аудио в текст, — давайте я всё-таки расскажу дополнительно об этом термине и о самом процессе под названием "транскрибация".

Транскрибация. Распространённая версия

Транскрибация — это перевод речи в текст.

Например, у вас есть запись конференции или интервью, по которым нужно написать статью или краткую выжимку мероприятия. Или, посложнее, есть аудиофайлы от автора книги, который поленился написать рукопись, а изложил свои мысли будущей книги в виде записанных на диктофон файлов. В этом случае вам тоже поможет транскрибация.

С помощью перевода звуковых файлов в текст можно транскрибировать следующие виды "речевой деятельности":

  • выступления на конференциях, записи вебинаров, записи уроков, лекций и презентаций, материалов и т. д.

Список материалов, которые могут быть интересны для перевода из звуковой формы в текстовый вид, вы можете прекрасно продолжить сами.

Типы транскрибации

В зависимости от того, как происходит транскрибация,
выделяют два её типа:

  • ручная;
  • автоматическая.

Иными словами, расшифровку аудио можно выполнить автоматически или вручную, т. е. делегировать специалисту по транскрибации. Его ещё называют жутко звучащим словом "транскрибатор". Почти Улан-Батор, но это столица Монголии.

Ручная транскрибация


Для этого вида работы транскрибатору понадобится слушать запись и печатать (набирать на клавиатуре) то, что он слышит. Некоторые транскрибаторы вместо набора текста используют свой голос.

С учётом пауз, нужных, чтобы записать услышанное, такая расшифровка может занять в несколько раз больше времени, чем длина записи.

Есть и другие минусы:

  • человек может ошибиться,
  • такую работу нужно оплатить,
  • не всю информацию можно передавать третьим лицам (иногда важно сохранить коммерческую тайну).

Автоматическая транскрибация


Транскрибация автоматическая основана на технологии распознавания речи, в английском она обозначается термином "speech-to-text" или STT.

Кроме расшифровки аудиофайлов, такие алгоритмы работают в виртуальных помощниках и голосовом управлении.

С помощью онлайн-технологий распознавания голоса можно расшифровать аудио- или видеозапись и автоматически преобразовать её в текстовую версию — быстро и с минимальными ошибками.

Но большинство программ распознавания речи устроены по схеме "заманиловки". Малые объемы вам транскрибируют бесплатно, а если что-то посерьёзнее по количеству знаков, то уже придется платить.

Среднестатистическая тахнология автоматической транскрибации


Звук — это цифровой поток, который обрабатывается обучаемыми нейросетями (ОНС). ОНС учатся распознавать голосовые данные так же, как находить объекты на картинках — с помощью датасетов (в которых есть аудио и размеченная текстовая расшифровка).

С помощью тренировок на датасетах система учится устанавливать соответствие определённой спектрограммы аудиозаписи символам.

В процессе распознавания файл (аудио или видео) с записью разбивается на очень короткие отрезки, каждый из которых представляет собой графический «рисунок». ОНС рассчитывает вероятность, что этому формату отрезка соответствует конкретный текст, например, на русском языке.

После распознавания система может получить несколько возможных вариантов слова. Чтобы выбрать правильный, используется декодер, у которого есть некоторый контекст (иными словами, список слов). Он (декодер) выбирает среди вероятностей распознанных символов те, из которых получаются релевантные контексту слова.

История транскрибации


С тех пор, как мы, люди научились говорить и писать, то, собираясь группами и что-то обсуждая, у нас появилась необходимость фиксировать сказанное. В общем, транскрипция появились очень и очень давно, как только родилась письменность. Если транскрибацией называть только перевод аудио- и аудиовидеофайлов в письменный (печатный) вид, то появление такого вида транскрипции надо привязывать к изобретению и внедрению первых устройств звукозаписи. А это 1860-й год, Париж и устройство "фоноавтограф".

Если "раскапывать" историю появления автоматической транскрибации, то надо выяснить, когда впервые в мире появились технологии распознавания речи. А это середина прошлого века. Поначалу это были устройства, реагировавшие на определенные фразы и выполнявшие только простые команды. В 1990-х годах появились первые программы для перевода голоса в текст. Они не всегда точно распознавали голос, допускали много ошибок в тексте. Но постепенно технологии совершенствовались, и сегодня существуют разнообразные решения и приложения для транскрибации.

Преимущества использования ручной транскрибации

Их немного, но они есть:

  1. Транскрибатор, владеющий навыками корректуры и редактирования, выдаёт более подготовленный к использованию текст, его не надо дополнительно вычитывать.
  2. В случае если в аудиофайлах много слэнга или присутствует путаная речь и смесь языков, поможет опытный транскрибатор и восстановит речь в текст до удобоваримого состояния.

Преимущества использования автоматической транскрибации

  1. Скорость распознавания. На обработку коротких аудио или видео в синхронном режиме уходят доли секунд.
  2. Возможность распознавать аудио в режиме онлайн. Такую функцию, например, имеют некоторые сервисы, создающие автоматические субтитры к видео для пользователей. Простейший пример ЮТьюб.
  3. Любые объёмы. Сервисы, которые переводят запись в текст, могут работать как с потоковыми данными, так и с записями (файлами) любой длины. От продолжительности зависит скорость распознавания, но это процесс, не требующий участия человека, кроме загрузки исходных файлов и выгрузки готовых результатов. В итоге и время получения результата сокращается.
  4. Интеграция по API. Если вы умеете автоматизировать внутренние рабочие процессы, можно обеспечить взаимодействие вашего программного продукта с сервисом распознавания речи, причём, разными способами: а) синхронное (если ответ нужен быстро); б) потоковое (если речь идёт о телефонии или записи аудио на мобильных устройствах); в) ассинхронное (если речь идёт об отложенной во времени обработке файлов).
  5. Иногда обучаемые нейросети «слышат» лучше человека: в записи с шумным фоном или несколькими источниками звуков они могут вычленить (отфильтровать) речь без помех.

Какой способ выбрать, решаете вы, с опорой на имеющиеся в вашем распоряжении ресурсы и намеченные цели.

---***---

#транскрибация #транскрипция #книга #статья #изданиепотребованию #ОлегЛубски #медиаиндустрия #копирайтинг #публикация #дизайн #ИздательскийДомНеЧитать #PublishingHouseDoNotRead