504 читали · 4 года назад
Подборка бесплатных терминологических баз для переводчиков
Терминологическая база — это база данных, которая содержит список терминов на разных языках и правила их употребления. Благодаря четкому порядку лексики и управлению ей как на исходном, так и на целевом языке, терминологические базы помогают подобрать наиболее точный вариант перевода и увеличить результативность работы переводчика. Мы собрали несколько сервисов, которые помогут найти подходящие термины при переводе материалов различной тематики. Wipo Pearl Этот многоязычный портал терминологии...
592 читали · 1 год назад
Про датасеты для обучения языковых ИИ моделей
Всем привет! Давно хотел написать публикацию в которой были бы перечислены самые распространённые варианты датасетов для обучения языковых моделей. Про то как правильно собирать датасеты для языковых моделей меня спрашивают не то чтобы часто, но каждый раз приходится достаточно подробно расписывать что да как. Поэтому я решил собрать все свои мысли на этот счёт в одну небольшую публикацию и в дальнейшем просто ссылаться на неё. Кстати, также рекомендую ознакомиться с моей публикацией про систему Label Studio, там я рассказывал про то как упростить процедуру создания и разметки датасетов...