Найти в Дзене
Автоматизация работы с текстами

Автоматизация работы с текстами

Статьи про использование Python, VBA, ИИ и приложений для обработки текстов/контента.
подборка · 6 материалов
Применяем двойной фильтр в Trados / Заметки ИТ-переводчика
По лучшим практикам перевода оглавление всегда рекомендуется делать в конце перевода. Именно этим я и занялся, но возник еще один досадный нюанс, в дополнение к недавно написанной мною заметке о том, что нужно делать раньше - форматирование MS Word, а потом Trados, или наоборот (ссылка на эту заметку). Итак, я сделал перевод по распознанному MS Word, а сейчас начал прогонять через базу переводов уже новый и чистенький MS Word. Возникла проблема: список пунктов оглавления занимает почти 500 сегментов,...
Что делать раньше: форматирование или перевод? (Заметки ИТ-редактора)
Хочу поговорить об одном тонком моменте для переводчика, работающего с конечными клиентами. Звучит он так: если ты получаешь исходные файлы в PDF, а сдавать надо в DOCX, то когда надо готовить отформатированный MS Word — до загрузки в «кошку» или после? Или без разницы? Почему это касается переводчиков, которые взаимодействуют с конечными клиентами, а не с бюро? Когда переводчик работает на бюро, обычно форматированием занимается бюро; а когда переводчик работает с конечным клиентом, то головная боль с форматированием лежит на переводчике...
Новый курс по автоматизации работы письменного переводчика / Минутка рекламы
Некоторое время назад я прочитал один и тот же курс в двух местах: в бюро переводов «Медконсалт» и на ФИЯ ТГУ. (В «Медконсалте» он продается здесь под названием «Теория и практика перевода в области генеративного ИИ и больших языковых моделей»). Этот курс посвящен практике тематического перевода: то есть я там сначала объяснял темы, приведенные ниже, а потом мы взяли 40 вопросов для собеседование кандидатов на роль специалистов по LLM, и перевели их: Как и ожидалось, больше всего вызвала интерес последняя тема — она про практику процессов, а не тематического перевода...
🔍 Про «замыленный» редакторский глаз и ИИ в переводах ✅ Оговорюсь сразу: я не луддит, не ретроград, люблю всё автоматизировать, люблю промпт-инжиниринг, но тем не менее я с большей осторожностью стал использовать ИИ. Переболел, что ли. Кстати, ещё в эпоху активного использования машинного перевода я категорически запрещал переводчикам его использовать, и вот почему. ✅ Когда вы заходите в какое-то помещение со специфическим запахом — например, где что-то протухло, то вы запах чувствуете лишь первые несколько минут. Потом как-то привыкаете, «нанюхиваетесь» и уже этот запах не чувствуете. ✅ Со стилистически слабыми переводами — то же самое. Сначала вы какое-то время бодро этот перевод правите, потом уже менее бодро, потом совсем вяло, а потом вам уже начинает казаться, что переводчик вроде как набил руку и у него пошёл стиль. Нет, ничего у него не пошло — просто у вас «замылился» глаз, вы «нанюхались» тухлым переводом, и он вам стал казаться приличным. ❗️ Исключений из этого правила я не видел. ✅ Что греха таить, я и сам недавно таким образом запорол перевод книги — она мне полностью была понятна, но свежего взгляда не хватило, в итоге получил разгромную претензию от издательства; выводы сделал. ✅ Оно работает аналогичным образом, когда клиенты хотят заказывать носителей для русско-английского перевода. Например, бюро иногда предлагают гибридные варианты перевода: например, переводит русскоязычный переводчик, а редактирует носитель или переводит носитель и редактирует носитель. До ИИ и до войны первый вариант выходил почти в два раза дешевле, и многие бюро подавали его как равноценный. Но это не так. Носители тоже люди, они тоже «нанюхиваются» дурным переводом, и в итоге перевод так и остаётся до краёв наполненным русизмами (от русскоязычного переводчика). ✅ Сделаю оговорку. Если речь заходит о техническо-маркетинговом переводе на английский язык (слово «технически» тут ключевое), и там просто приходится из двух зол выбирать меньшее: либо ты переводишь русскоязычным техническим переводчиком (без грубых технических ляпов, но с каким уж получится стилем), либо ты переводишь сразу носителем (будет гладкий стиль, но в техническом плане обычно там полный «пердимонокль» — я за 20 лет работы главредом ни разу не встречал носителей, которые копают матчасть). Я обычно эти риски клиентам проговариваю, и они выбирают вариант с русскоязычным переводчиком по этой причине. Хотя, конечно, кому-то и бюджеты имеют значение. ✅ Возвращаясь к теме «замыливания»: именно по этой самой причине я избегаю редактировать живые проекты за слабыми переводчиками (редактирую только при обучении переводчиков). ✅ И теперь про ИИ — с ним то же самое. Если в вашем ИИ-ассистенте слабый промпт, слабая модель, неоптимальные настройки (температура, top-P и пр.), бедная база знаний (RAG) и т. п. — вы почти неизбежно будете получать от ИИ (или точнее LLM) слабый перевод. Поначалу вы будете явно видеть, что он слабый, но потом привыкнете и будете считать, что он приемлем. ✅ Как лечить, если прицел или чувство стиля-таки сбилось? Я знаю три рецепта: 1. Читать/слушать классическую литературу (её точно писали без ИИ и вдумчиво). 2. Отойти от перевода на несколько дней (он должен забыться, потом начнёте читать — ужаснётесь). 3. Читать перевод вслух (но это лучше после пунктов 1 и 2). ✅ Также помогает использование старых добрых «кошачьих» инструментов; да-да, я про CAT-инструменты, computer-assisted tools. Они по терминологии подстрахуют и по единообразию. А там, глядишь, когда термины и единообразие будете править, глаз ещё за другие изъяны зацепится, и уже больше шансов «вытянуть» перевод по качеству. ✅ Но это уже тема для другого поста. Спасибо за внимание!