Добавить в корзинуПозвонить
Найти в Дзене
AI Wiz

🤖 2 модели GPT-OSS в AI Wiz: OpenAI впервые открыл веса — и это важнее, чем кажется

Несколько лет OpenAI держали все сильные модели закрытыми. В августе 2025 года они выпустили первые настоящие открытые модели под лицензией Apache 2.0 — GPT-OSS-120B и GPT-OSS-20B. Можно использовать в коммерческих продуктах, дообучать, запускать локально. Без ограничений. Почему сейчас? Скорее всего потому, что отдавать поле только китайским открытым моделям стало некомфортно. 📍 Два размера — две задачи Это не одна модель в двух вариантах. Это две разные истории. GPT-OSS-120B — для серьёзной работы. По уровню рассуждений близка к o4-mini. Математика, сложная аналитика, многошаговые задачи. Запускается на одной профессиональной видеокарте с 80 ГБ памяти. На бенчмарке AIME-2024 (олимпийская математика) — 82%, что выше GPT-5.4-mini. GPT-OSS-20B — для локального запуска и экспериментов. Уровень o3-mini, но помещается в 16 ГБ памяти. Домашний компьютер, корпоративный сервер без топового железа, образовательный гаджет без постоянного интернета. Разработчики гоняют по четыре копии пара

🤖 2 модели GPT-OSS в AI Wiz: OpenAI впервые открыл веса — и это важнее, чем кажется

Несколько лет OpenAI держали все сильные модели закрытыми. В августе 2025 года они выпустили первые настоящие открытые модели под лицензией Apache 2.0 — GPT-OSS-120B и GPT-OSS-20B. Можно использовать в коммерческих продуктах, дообучать, запускать локально. Без ограничений.

Почему сейчас? Скорее всего потому, что отдавать поле только китайским открытым моделям стало некомфортно.

📍 Два размера — две задачи

Это не одна модель в двух вариантах. Это две разные истории.

GPT-OSS-120B — для серьёзной работы. По уровню рассуждений близка к o4-mini. Математика, сложная аналитика, многошаговые задачи. Запускается на одной профессиональной видеокарте с 80 ГБ памяти. На бенчмарке AIME-2024 (олимпийская математика) — 82%, что выше GPT-5.4-mini.

GPT-OSS-20B — для локального запуска и экспериментов. Уровень o3-mini, но помещается в 16 ГБ памяти. Домашний компьютер, корпоративный сервер без топового железа, образовательный гаджет без постоянного интернета.

Разработчики гоняют по четыре копии параллельно на обычных профессиональных видеокартах — для обработки больших массивов данных.

Обе модели работают с контекстом около 128 тысяч токенов. Обе обучены на реальных агентных задачах с инструментами и браузером.

⚡️ Что здесь интересного

✅GPT-OSS-120B почти не врёт. Даже в сжатом формате она галлюцинирует значительно меньше большинства открытых моделей. Пользователи из сообщества разработчиков отмечают: "ощутимо честнее, пусть и не всегда гениальна". Это редкость для открытых моделей.

✅GPT-OSS-120B — лучший открытый вариант для кода прямо сейчас. По независимым оценкам она обходит Kimi K2 и Qwen3 Coder на задачах реального кодинга. Уступает только Claude Opus и Grok 4, которые закрытые и дороже.

✅GPT-OSS-20B живёт там, где другие не работают. Офлайн-ассистенты, устройства без постоянного интернета, корпоративные системы с жёсткими требованиями к данным. Там, где обновить модель почти невозможно, нужен стабильный надёжный инструмент — вот её территория.

✅Обе модели можно дообучать. GPT-OSS-20B дообучают даже на бесплатных облачных сессиях с 15 ГБ памяти. Для небольших команд, которые хотят сделать специализированного ассистента под свой домен — это реальный входной билет без серьёзных вложений в железо.

❌ Честно о слабых местах

❗️GPT-OSS-120B любит поговорить. Даже с явной просьбой быть кратким она остаётся многословной. Решается ограничениями в промпте, но требует внимания.

❗️GPT-OSS-120B иногда ленится. Если задача не требует усилий по формулировке промпта — модель может дать поверхностный ответ. Заставьте её думать явно, и качество сразу вырастет.

❗️GPT-OSS-20B слабее по глубине. Для сложных архитектурных задач и глубокого анализа она уступает старшей версии заметно. Её сила — в скорости, локальности и количестве итераций, а не в максимальном интеллекте.

🔧 Как работать с этими моделями

Для 120B: думайте о ней как об умном, но немного ленивом аналитике. Давайте полный контекст — целые документы, фрагменты кода, спецификации. Ставьте чёткую роль в системном промпте. И явно просите думать пошагово — без этого она может выдать быстрый поверхностный ответ вместо глубокого разбора.

Пример, который работает: "Ты — ведущий системный аналитик. Вот три документа. Найди противоречия, выдели ключевые риски, предложи три конкретных решения. Рассуждение — не больше 300 слов, потом краткий итог."

Для 20B: используйте её там, где важна скорость и количество итераций. Один запрос не дал точного ответа — задайте ещё три уточняющих. За то время, что 120B думает над сложной задачей, 20B успевает пройти пять-шесть итераций на простых.

Включайте режим рассуждений для сложных задач — обе модели умеют показывать ход мыслей, и это помогает поймать ошибку до того, как она стала результатом.

Обе модели доступны в AI Wiz без VPN. Текст и файлы — в одном интерфейсе.

👉 aiwiz.ru/trial

#AIWiz #GPTOSS #OpenAI #ИИмодели