Про субтитры без грабель я писал недавно, но не субтитрами едиными… Иногда приходят заказы на «просто текст» из какого-нибудь видео, поэтому сейчас расскажу о том, что там тоже не все «просто».
Вообще, подготовка текста из видео — достаточно сложная в исполнении задача. Сложность заключается в завышенных ожиданиях заказчика. Заказчик, как правило, предполагает, что можно просто убрать таймкоды из субтитров и подчистить ошибки. Однако на выходе мы получим, как правило, текст с логическими нестыковками, неряшливой грамматикой и хаотичными аргументами — всё это делает текст нечитабельным. Отметим, что для субтитров с таймкодами «рваное» повествование вполне допустимо, там всё же разговорная речь.
Что касается обработки, то порядок выполнения такой — автоматически сгенерированные субтитры качаем без таймкодов и редактируем текст:
- убираем оговорки, повторы и т. д.;
- сглаживаем неудачные грамматические обороты и в крайнем случае выбираем более подходящие слова;
- разбиваем на абзацы для удобства (докладчик не обязательно будет делать паузы там, где они напрашиваются).
Недостатки такой обработки для заказчика в том, что текст подвергается минимальной редактуре. Как следствие, осмысленность, логичность и аргументированность текста определяются только подготовкой докладчика к выступлению и тем, насколько поставлена его речь. В отличие от субтитров, которые максимально синхронизированы с видеорядом и это позволяет компенсировать недостатки логики, грамматики и т. д. иллюзией общения, простой текст недостатки видео компенсировать не позволяет.
Надеюсь, было познавательно.