7245 подписчиков

Модели Hunyuan-MT от Tencent обошли Google Translate и GPT-4.1 почти во всех языковых парах

3 сентября 20253 сен 2025

1 мин

Компания Tencent представила линейку языковых моделей Hunyuan-MT, оптимизированных под машинный перевод, и опубликовала их исходный код. Новая серия, по заявлению разработчиков, превзошла Google Translate на бенчмарке WMT25 в 30 из 31 протестированной языковой пары. Также модели показали более высокие результаты, чем GPT-4.1 и Claude 4 Sonnet от Anthropic, по тем же критериям. В серию вошли четыре модели, две из которых (Hunyuan-MT-7B и Chimera-7B) обладают по 7 млрд параметров. Остальные — облегчённые версии, предназначенные для задач с ограниченными вычислительными ресурсами. Несмотря на меньший объём, они сохраняют высокое качество перевода. Обучение проводилось на четырёх наборах данных. Два содержали тексты на 33 языках без параллельной разметки, остальные — миллионы пар предложений и их переводов. Это позволило объединить языковую проработку с общей интеллектуальной базой. Дополнительно модели прошли фазу обучения с подкреплением. Им предъявлялись задания, а оценки качества перев

Также модели показали более высокие результаты, чем GPT-4.1 и Claude 4 Sonnet от Anthropic, по тем же критериям.

В серию вошли четыре модели, две из которых (Hunyuan-MT-7B и Chimera-7B) обладают по 7 млрд параметров. Остальные — облегчённые версии, предназначенные для задач с ограниченными вычислительными ресурсами. Несмотря на меньший объём, они сохраняют высокое качество перевода.

Обучение проводилось на четырёх наборах данных. Два содержали тексты на 33 языках без параллельной разметки, остальные — миллионы пар предложений и их переводов. Это позволило объединить языковую проработку с общей интеллектуальной базой.

Дополнительно модели прошли фазу обучения с подкреплением. Им предъявлялись задания, а оценки качества перевода давала отдельная система ИИ. Она анализировала смысловую точность, контекстуальную уместность и соблюдение терминологической корректности.

Структурно Hunyuan-MT-7B опирается на классическую архитектуру языковых моделей, тогда как Chimera-7B использует ансамбль — несколько нейросетей обрабатывают текст одновременно, а итог формируется путём объединения их решений. Такой подход гарантирует более высокий уровень соответствия оригиналу.

Тесты WMT25 подтвердили эффективность — преимущество над Google Translate достигало 65% по отдельным парам. В дополнение к этому, модели Tencent продемонстрировали лучший результат на MMLU-Pro по сравнению с Llama-3-8B-Base, несмотря на меньший размер.

Ещё по теме:

Гаджеты и электроника

5,73 млн интересуются