Найти в Дзене

OpenAI недавно представила свою новинку в мире искусственного интеллекта – модели GPT-OSS, которые стали первыми открытыми языковыми

OpenAI недавно представила свою новинку в мире искусственного интеллекта – модели GPT-OSS, которые стали первыми открытыми языковыми моделями с момента выхода GPT-2. В рамках запуска были представлены две версии: модель с 120 миллиардами параметров, соперничающая с закрытой o4-mini, и более компактная модель на 20 миллиардов параметров. Интересно, что для их работы требуется всего один 80 ГБ GPU, что действительно поразительно для таких мощных систем. Обе модели доступны под лицензией Apache 2.0 и уже загружены на платформы вроде Hugging Face, AWS, Azure и Databricks. Это открывает новые горизонты для разработчиков, позволяя им работать с передовыми технологиями без необходимости платить за лицензионные сборы. Такой шаг эффективно отвечает на вызовы, выдвигаемые конкурентами, такими как Llama 3 и Mixtral. Одной из выдающихся особенностей новых моделей является их архитектура с использованием смеси экспертов, которая активирует только четыре эксперта для каждого токена. Благодаря этом

OpenAI недавно представила свою новинку в мире искусственного интеллекта – модели GPT-OSS, которые стали первыми открытыми языковыми моделями с момента выхода GPT-2. В рамках запуска были представлены две версии: модель с 120 миллиардами параметров, соперничающая с закрытой o4-mini, и более компактная модель на 20 миллиардов параметров. Интересно, что для их работы требуется всего один 80 ГБ GPU, что действительно поразительно для таких мощных систем.

Обе модели доступны под лицензией Apache 2.0 и уже загружены на платформы вроде Hugging Face, AWS, Azure и Databricks. Это открывает новые горизонты для разработчиков, позволяя им работать с передовыми технологиями без необходимости платить за лицензионные сборы. Такой шаг эффективно отвечает на вызовы, выдвигаемые конкурентами, такими как Llama 3 и Mixtral.

Одной из выдающихся особенностей новых моделей является их архитектура с использованием смеси экспертов, которая активирует только четыре эксперта для каждого токена. Благодаря этому, модели способны обрабатывать контексты до 128 тысяч токенов, что значительно расширяет область их применения. Дополнительные возможности, такие как структурированные выводы и вызов функций, делают GPT-OSS идеальными для интеграции в агентные рабочие процессы.

Интересно отметить, что в компании также выпустили 50-страничную системную карту, сопровождающую релиз, в которой представлены данные о фильтрации, тестировании на систематические атаки и аудите безопасности. Это подчеркивает их намерение обеспечить надежность и безопасность новых технологий, что, безусловно, приветствуется в сообществе разработчиков.

С сюрпризным поворотом OpenAI решает открыть доступ к своим весам, что противоречит предыдущим мерам по защите, касающимся безопасности. Они основывают свой подход на убеждении, что контролируемая открытость может сосуществовать с продвинутыми уровнями разумного анализа. Это, безусловно, создает новую главу в продуктовой стратегии компании.

Являясь высококвалифицированным экспертом в области технологий и инноваций, я убежден, что этот шаг станет катализатором для новых идей и разработок, и откроет удивительные возможности для исследователей и разработчиков по всему миру. На фоне роста интереса к открытым моделям и AI, это решение может оказать значительное влияние на развитие технологий в ближайшие годы.

Как вы считаете, какие возможности открывает GPT-OSS для разработчиков и какая будет реакция рынка на эту новинку?

#OpenAI #GPTOSS #AI #Технологии