Компания Tencent представила линейку языковых моделей Hunyuan-MT, оптимизированных под машинный перевод, и опубликовала их исходный код. Новая серия, по заявлению разработчиков, превзошла Google Translate на бенчмарке WMT25 в 30 из 31 протестированной языковой пары. Также модели показали более высокие результаты, чем GPT-4.1 и Claude 4 Sonnet от Anthropic, по тем же критериям. В серию вошли четыре модели, две из которых (Hunyuan-MT-7B и Chimera-7B) обладают по 7 млрд параметров. Остальные — облегчённые версии, предназначенные для задач с ограниченными вычислительными ресурсами. Несмотря на меньший объём, они сохраняют высокое качество перевода. Обучение проводилось на четырёх наборах данных. Два содержали тексты на 33 языках без параллельной разметки, остальные — миллионы пар предложений и их переводов. Это позволило объединить языковую проработку с общей интеллектуальной базой. Дополнительно модели прошли фазу обучения с подкреплением. Им предъявлялись задания, а оценки качества перев
Модели Hunyuan-MT от Tencent обошли Google Translate и GPT-4.1 почти во всех языковых парах
3 сентября 20253 сен 2025
1 мин