526 подписчиков

GPT-OSS: Открытые модели от OpenAI с топовой производительностью для агентных задач и reasoning

5 августа 20255 авг 2025

1 мин

OpenAI представила две открытые языковые модели нового поколения — gpt-oss-120b и gpt-oss-20b, впервые за долгое время открыв доступ к масштабным архитектурам с высоким качеством генерации. Обе модели ориентированы на «мощные рассуждения, агентские сценарии и задачи программной разработки» и по результатам бенчмарков приближаются к закрытым моделям o3 и o4-mini. * gpt-oss-120b: модель с 120 миллиардами параметров, использующая архитектуру Mixture-of-Experts (MoE). Каждое из 36 слоёв включает 128 экспертов, из которых 4 активируются на каждый токен, что позволяет эффективно управлять вычислениями и масштабом. * gpt-oss-20b: облегчённая версия с 20 миллиардами параметров и активацией 3.6 млрд параметров на токен. Подходит для менее ресурсоёмких задач при сохранении высокого качества генерации. * Контролируемая глубина reasoning: пользователи могут задавать уровень рассуждений — low, medium или high, подстраивая поведение модели под конкретные задачи. * Открытые веса: обе модели выложены

Оглавление

Основные характеристики
Производительность
Преимущества

Основные характеристики

* gpt-oss-120b: модель с 120 миллиардами параметров, использующая архитектуру Mixture-of-Experts (MoE). Каждое из 36 слоёв включает 128 экспертов, из которых 4 активируются на каждый токен, что позволяет эффективно управлять вычислениями и масштабом.

* gpt-oss-20b: облегчённая версия с 20 миллиардами параметров и активацией 3.6 млрд параметров на токен. Подходит для менее ресурсоёмких задач при сохранении высокого качества генерации.

* Контролируемая глубина reasoning: пользователи могут задавать уровень рассуждений — low, medium или high, подстраивая поведение модели под конкретные задачи.

* Открытые веса: обе модели выложены с доступом к весам, лицензии позволяют коммерческое использование, включая дообучение и интеграцию в другие решения.

Производительность

* По ряду бенчмарков (MMLU, GSM8K, HumanEval) модели демонстрируют производительность, приближающуюся к o3 и o4-mini.

* gpt-oss-120b активирует около 5.1 млрд параметров на токен, обеспечивая высокую эффективность reasoning-задач.

* Совместимы с HF Transformers, поддерживают запуск через vLLM и DeepSpeed-MII.

Преимущества

* Прозрачность и открытость: модели доступны на Hugging Face и через GitHub.

* Гибкость использования: от локального запуска до облачных решений с поддержкой ускоренного инференса.

* Лёгкая интеграция: поддержка популярных ML-фреймворков и инфраструктур.

* Поддержка агентных фреймворков: оптимизированы под современные подходы в разработке AI-агентов.

Скачать с Hugging Face

– gpt-oss-120b

– gpt-oss-20b

GPT-5 может выйти уже 7 августа – до релиза самой мощной нейросети от OpenAI осталось всего два дня. Альтман тоже подогревает интригу, намекая на большой запуск на этой неделе.

⬇️Поддержать автора⬇️

✅SBER: 2202 2050 7215 4401