Найти тему
2797 подписчиков

Новые языковые модели Qwen2-Math превосходят GPT-4o и Claude 3.5 в решении математических задач


Команда Qwen представила новую серию математических языковых моделей Qwen2-Math, которые значительно превосходят по своим возможностям существующие модели, такие как GPT-4o и Claude 3.5.

Флагманская модель Qwen2-Math-72B-Instruct показывает лучшие результаты на широком спектре математических бенчмарков, включая GSM8K, MATH, MMLU-STEM, CMATH, GaoKao Math Cloze и GaoKao Math QA.

Модели Qwen2-Math были предварительно обучены на специально подобранном математическом корпусе, включающем высококачественные математические тексты, книги, код и синтетические данные. Затем они были дополнительно обучены с использованием математической системы вознаграждения, что позволило значительно улучшить их математические способности.

В ближайшее время Qwen планирует выпустить двуязычные (английский и китайский) математические модели, а в дальнейшем - многоязычные. Команда также продолжит работу над повышением возможностей моделей в решении сложных математических задач.

Спросите у них про яблоки


Новые языковые модели Qwen2-Math превосходят GPT-4o и Claude 3.
Около минуты