Добавить в корзинуПозвонить
Найти в Дзене

Обновление системы Катминт: поддержка файлов SRX

Рады сообщить, что теперь Катминт поддерживает пользовательские правила сегментации, описанные в формате SRX (Segmentation Rules eXchange). Этот отраслевой стандарт на основе XMLпозволяет задавать точные правила сегментации текста, обеспечивая единообразное разбиение документов на сегменты (предложения или фразы) во всех ваших переводческих проектах. Зачем это нужно? Исторически разные CAT-системы и TMS-платформы использовали собственную логику сегментации. Например, если одна система разбивала предложение после двоеточия, а другая — нет, то записи памяти переводов (TM) переставали совпадать. Такое несовпадение приводит к значительным потерям в повторном использовании TM и снижает ценность накопленных переводов. Стандарт SRX был создан как переносимый формат правил именно для решения этой проблемы. Он позволяет задать и передать точную логику сегментации между инструментами, чтобы данные в TMоставались максимально пригодными для повторного использования вне зависимости от рабочей среды
Оглавление

Рады сообщить, что теперь Катминт поддерживает пользовательские правила сегментации, описанные в формате SRX (Segmentation Rules eXchange). Этот отраслевой стандарт на основе XMLпозволяет задавать точные правила сегментации текста, обеспечивая единообразное разбиение документов на сегменты (предложения или фразы) во всех ваших переводческих проектах.

Зачем это нужно?

Исторически разные CAT-системы и TMS-платформы использовали собственную логику сегментации. Например, если одна система разбивала предложение после двоеточия, а другая — нет, то записи памяти переводов (TM) переставали совпадать. Такое несовпадение приводит к значительным потерям в повторном использовании TM и снижает ценность накопленных переводов.

Стандарт SRX был создан как переносимый формат правил именно для решения этой проблемы. Он позволяет задать и передать точную логику сегментации между инструментами, чтобы данные в TMоставались максимально пригодными для повторного использования вне зависимости от рабочей среды.

Как работает SRX

Сегментация управляется двумя типами правил:

Правила разрыва (break rules) указывают системе, где разделять текст — как правило, после знаков завершения предложения: точек, восклицательных и вопросительных знаков.

Правила запрета разрыва (no-break rules) указывают системе, где не следует разделять текст — например, после сокращений («напр.», «т. д.», «г.»), инициалов, нумерованных заголовков и других случаев, которые в противном случае вызвали бы ошибочное разбиение на сегменты.

Сочетание этих правил даёт точный контроль над сегментацией контента, включая языковые исключения для сокращений, порядковых числительных и особых знаков препинания.

Ключевые преимущества SRX в Катминт

Максимальное использование памяти переводов. Единая логика сегментации, которую можно подправить при помощи пользовательских правил, описанных в формате SRX, гарантирует, что сегменты, созданные в других инструментах, будут распознаваться в Катминт как 100%-ные совпадения — и наоборот.

Стабильное качество. Централизованные шаблоны сегментации единообразно обрабатывают сложные случаи — сокращения, технические термины, особые знаки препинания — во всех проектах.

Лёгкая совместимость. Если вы уже используете SRX в других инструментах, вы можете применить те же правила в Катминт без необходимости пересегментации или очистки старых данных TM.

Централизованное управление. Сегментация становится управляемым ресурсом на уровне компании, а не скрытой настройкой для отдельного проекта. Правила применяются единообразно для всех пользователей.

Как это работает в Катминт

Настройки SRX доступны администратору компании (Company Superuser) на вкладке Custom Settings.

Чтобы загрузить шаблон сегментации для конкретного языка:

• В разделе Upload SRX Segmentation File выберите нужный язык из выпадающего списка.

• Нажмите кнопку загрузки и укажите ваш SRX-файл.

• При желании добавьте краткое описание в поле Description.

Загруженные шаблоны отображаются в списке SRX Segmentation Files ниже, где их можно скачать или удалить.

При загрузке документа на перевод Катминт автоматически проверяет, задан ли SRX-файл для языка этого документа. Если файл найден, сегментация выполняется по вашим правилам. Если нет — используется стандартный встроенный алгоритм разбиения.

Мы надеемся, что новая функция сделает работу с переводами ещё удобнее и эффективнее. Ждём ваших отзывов и впечатлений!

Катминт – российская TMS и CAT-система