ИИ-стартап Ai2 представил OLMo 3.1 32B Think – новую модель семейства OLMo 3, разработанную для решения сложных задач, требующих последовательного рассуждения. Модель распространяется под лицензией Apache 2.0, обеспечивая полный доступ к коду, контрольным точкам и данным обучения для исследовательских и образовательных целей. OLMo 3.1 32B Think – это трансформер-модель с 32 миллиардами параметров, обученная на англоязычном датасете Dolma 3 и прошедшая многоэтапное пост-обучение на специализированных наборах Dolci, направленных на развитие математического, алгоритмического и программного мышления. Разработчики Ai2 подчеркивают важность открытости: архитектура, данные и процесс обучения полностью задокументированы и доступны. Финальная версия модели формировалась в три этапа: SFT-обучение (математика, программирование, общение и инструкции), DPO (обучение выбору качественных рассуждений) и RLVR (обучение с подкреплением на основе проверяемых вознаграждений), которое обеспечило значительн
OLMo 3.1 32B Think: Новая открытая модель ИИ для сложного мышления
14 декабря 202514 дек 2025
1 мин