2797 подписчиков
Новые языковые модели Qwen2-Math превосходят GPT-4o и Claude 3.5 в решении математических задач
Команда Qwen представила новую серию математических языковых моделей Qwen2-Math, которые значительно превосходят по своим возможностям существующие модели, такие как GPT-4o и Claude 3.5.
Флагманская модель Qwen2-Math-72B-Instruct показывает лучшие результаты на широком спектре математических бенчмарков, включая GSM8K, MATH, MMLU-STEM, CMATH, GaoKao Math Cloze и GaoKao Math QA.
Модели Qwen2-Math были предварительно обучены на специально подобранном математическом корпусе, включающем высококачественные математические тексты, книги, код и синтетические данные. Затем они были дополнительно обучены с использованием математической системы вознаграждения, что позволило значительно улучшить их математические способности.
В ближайшее время Qwen планирует выпустить двуязычные (английский и китайский) математические модели, а в дальнейшем - многоязычные. Команда также продолжит работу над повышением возможностей моделей в решении сложных математических задач.
Спросите у них про яблоки
Около минуты
9 августа 2024