OpenAI представила две открытые языковые модели нового поколения — gpt-oss-120b и gpt-oss-20b, впервые за долгое время открыв доступ к масштабным архитектурам с высоким качеством генерации. Обе модели ориентированы на «мощные рассуждения, агентские сценарии и задачи программной разработки» и по результатам бенчмарков приближаются к закрытым моделям o3 и o4-mini. * gpt-oss-120b: модель с 120 миллиардами параметров, использующая архитектуру Mixture-of-Experts (MoE). Каждое из 36 слоёв включает 128 экспертов, из которых 4 активируются на каждый токен, что позволяет эффективно управлять вычислениями и масштабом. * gpt-oss-20b: облегчённая версия с 20 миллиардами параметров и активацией 3.6 млрд параметров на токен. Подходит для менее ресурсоёмких задач при сохранении высокого качества генерации. * Контролируемая глубина reasoning: пользователи могут задавать уровень рассуждений — low, medium или high, подстраивая поведение модели под конкретные задачи. * Открытые веса: обе модели выложены
GPT-OSS: Открытые модели от OpenAI с топовой производительностью для агентных задач и reasoning
5 августа 20255 авг 2025
1 мин