138 подписчиков

🤖 2 модели GPT-OSS в AI Wiz: OpenAI впервые открыл веса — и это важнее, чем кажется

13 мая13 мая

3 мин

Несколько лет OpenAI держали все сильные модели закрытыми. В августе 2025 года они выпустили первые настоящие открытые модели под лицензией Apache 2.0 — GPT-OSS-120B и GPT-OSS-20B. Можно использовать в коммерческих продуктах, дообучать, запускать локально. Без ограничений. Почему сейчас? Скорее всего потому, что отдавать поле только китайским открытым моделям стало некомфортно. 📍 Два размера — две задачи Это не одна модель в двух вариантах. Это две разные истории. GPT-OSS-120B — для серьёзной работы. По уровню рассуждений близка к o4-mini. Математика, сложная аналитика, многошаговые задачи. Запускается на одной профессиональной видеокарте с 80 ГБ памяти. На бенчмарке AIME-2024 (олимпийская математика) — 82%, что выше GPT-5.4-mini. GPT-OSS-20B — для локального запуска и экспериментов. Уровень o3-mini, но помещается в 16 ГБ памяти. Домашний компьютер, корпоративный сервер без топового железа, образовательный гаджет без постоянного интернета. Разработчики гоняют по четыре копии пара

Почему сейчас? Скорее всего потому, что отдавать поле только китайским открытым моделям стало некомфортно.

📍 Два размера — две задачи

Это не одна модель в двух вариантах. Это две разные истории.

GPT-OSS-120B — для серьёзной работы. По уровню рассуждений близка к o4-mini. Математика, сложная аналитика, многошаговые задачи. Запускается на одной профессиональной видеокарте с 80 ГБ памяти. На бенчмарке AIME-2024 (олимпийская математика) — 82%, что выше GPT-5.4-mini.

GPT-OSS-20B — для локального запуска и экспериментов. Уровень o3-mini, но помещается в 16 ГБ памяти. Домашний компьютер, корпоративный сервер без топового железа, образовательный гаджет без постоянного интернета.

Разработчики гоняют по четыре копии параллельно на обычных профессиональных видеокартах — для обработки больших массивов данных.

Обе модели работают с контекстом около 128 тысяч токенов. Обе обучены на реальных агентных задачах с инструментами и браузером.

⚡️ Что здесь интересного

✅GPT-OSS-120B почти не врёт. Даже в сжатом формате она галлюцинирует значительно меньше большинства открытых моделей. Пользователи из сообщества разработчиков отмечают: "ощутимо честнее, пусть и не всегда гениальна". Это редкость для открытых моделей.

✅GPT-OSS-120B — лучший открытый вариант для кода прямо сейчас. По независимым оценкам она обходит Kimi K2 и Qwen3 Coder на задачах реального кодинга. Уступает только Claude Opus и Grok 4, которые закрытые и дороже.

✅GPT-OSS-20B живёт там, где другие не работают. Офлайн-ассистенты, устройства без постоянного интернета, корпоративные системы с жёсткими требованиями к данным. Там, где обновить модель почти невозможно, нужен стабильный надёжный инструмент — вот её территория.

✅Обе модели можно дообучать. GPT-OSS-20B дообучают даже на бесплатных облачных сессиях с 15 ГБ памяти. Для небольших команд, которые хотят сделать специализированного ассистента под свой домен — это реальный входной билет без серьёзных вложений в железо.

❌ Честно о слабых местах

❗️GPT-OSS-120B любит поговорить. Даже с явной просьбой быть кратким она остаётся многословной. Решается ограничениями в промпте, но требует внимания.

❗️GPT-OSS-120B иногда ленится. Если задача не требует усилий по формулировке промпта — модель может дать поверхностный ответ. Заставьте её думать явно, и качество сразу вырастет.

❗️GPT-OSS-20B слабее по глубине. Для сложных архитектурных задач и глубокого анализа она уступает старшей версии заметно. Её сила — в скорости, локальности и количестве итераций, а не в максимальном интеллекте.

🔧 Как работать с этими моделями

Для 120B: думайте о ней как об умном, но немного ленивом аналитике. Давайте полный контекст — целые документы, фрагменты кода, спецификации. Ставьте чёткую роль в системном промпте. И явно просите думать пошагово — без этого она может выдать быстрый поверхностный ответ вместо глубокого разбора.

Пример, который работает: "Ты — ведущий системный аналитик. Вот три документа. Найди противоречия, выдели ключевые риски, предложи три конкретных решения. Рассуждение — не больше 300 слов, потом краткий итог."

Для 20B: используйте её там, где важна скорость и количество итераций. Один запрос не дал точного ответа — задайте ещё три уточняющих. За то время, что 120B думает над сложной задачей, 20B успевает пройти пять-шесть итераций на простых.

Включайте режим рассуждений для сложных задач — обе модели умеют показывать ход мыслей, и это помогает поймать ошибку до того, как она стала результатом.

Обе модели доступны в AI Wiz без VPN. Текст и файлы — в одном интерфейсе.

👉 aiwiz.ru/trial

#AIWiz #GPTOSS #OpenAI #ИИмодели

Гаджеты и электроника

5,73 млн интересуются