Представляете: Allen Institute for AI (Ai2) только недавно похвасталась своим самым мощным семейством моделей Olmo 3, а уже вернулась с улучшенной версией — Olmo 3.1. Команда не сидела сложа руки: расширила RL-тренировки (это такие специальные методы обучения, где модель учится через усиление результатов) и создала ещё более способные варианты. Новые Olmo 3.1 сосредоточены на трёх ключевых вещах: эффективность, прозрачность, контроль. То есть, если вы корпорация или исследовательская лаборатория — вам будет интересно. Ai2 обновила два основных варианта из трёх версий Olmo 2: Кроме того, осталась Olmo 3-Base — всё ещё хороша для программирования, понимания текстов и математики. Плюс отлично подходит для дополнительной тренировки под ваши нужды. Вот тут интересно. Чтобы апгрейдить Think 32B, исследователи просто продолжили процесс обучения с усилением, но дольше и интенсивнее. Слушайте, что они написали: «После запуска Olmo 3, мы возобновили RL-тренировку для 32B Think — учили 21 день на
Olmo 3.1: Allen Institute выпустил модели, которые догоняют Qwen и Llama. Вот что изменилось
16 декабря 202516 дек 2025
5
2 мин