Добавить в корзинуПозвонить
Найти в Дзене
DigiNews

StepFun выпускает Step 3.5 Flash — «open-source» базовую модель, созданную для «AI agents»

StepFun представила Step 3.5 Flash — модель с открытым исходным кодом, ориентированную на агентов, обеспечивающую до 350 токенов/сек, поддержку контекста 256 тыс. и производительность, сравнимую с закрытыми моделями в задачах рассуждений и работы с агентами. 2 февраля китайская компания StepFun, занимающаяся разработкой ИИ, официально представила Step 3.5 Flash — свою новейшую и самую мощную модель с открытым исходным кодом, позиционируемую как «созданную для агентов». По заявлению компании, модель обладает высокими возможностями логического вывода, стабильностью и производительностью, оптимизированной специально для рабочих процессов на основе агентов. Ключевые особенности включают: По мнению StepFun, следующее поколение базовых моделей должно быть не только «умнее», но и надежным, отзывчивым и экономически эффективным. Для достижения этого баланса Step 3.5 Flash использует несколько архитектурных инноваций: Step 3.5 Flash теперь полностью доступна, и StepFun также сообщила, что обуче

StepFun представила Step 3.5 Flash — модель с открытым исходным кодом, ориентированную на агентов, обеспечивающую до 350 токенов/сек, поддержку контекста 256 тыс. и производительность, сравнимую с закрытыми моделями в задачах рассуждений и работы с агентами.

2 февраля китайская компания StepFun, занимающаяся разработкой ИИ, официально представила Step 3.5 Flash — свою новейшую и самую мощную модель с открытым исходным кодом, позиционируемую как «созданную для агентов». По заявлению компании, модель обладает высокими возможностями логического вывода, стабильностью и производительностью, оптимизированной специально для рабочих процессов на основе агентов.

-2

Ключевые особенности включают:

  • Быстрее: Скорость инференса до 350 токенов в секунду для задач кодирования с одним запросом
  • Мощнее: Производительность в сценариях с агентами и в математических рассуждениях сравнима с ведущими моделями с закрытым исходным кодом
  • Стабильнее: Способна обрабатывать сложные, долгосрочные, многоэтапные задачи
-3

По мнению StepFun, следующее поколение базовых моделей должно быть не только «умнее», но и надежным, отзывчивым и экономически эффективным. Для достижения этого баланса Step 3.5 Flash использует несколько архитектурных инноваций:

  • Разреженное смешение экспертов (Sparse Mixture-of-Experts, MoE): Каждый токен активирует около 11 миллиардов параметров из общего числа в 196 миллиардов, что значительно снижает вычислительные затраты
  • MTP-3 (Multi-Token Prediction): Модель предсказывает три токена за шаг, эффективно удваивая эффективность инференса
  • Гибридная архитектура внимания (Hybrid Attention Architecture, SWA + Full Attention): Сочетание скользящего окна и глобального внимания в соотношении 3:1 позволяет модели фокусироваться на ключевых сегментах в длинных текстах, обеспечивая эффективную обработку контекста длиной до 256 тыс. токенов при меньших вычислительных затратах

Step 3.5 Flash теперь полностью доступна, и StepFun также сообщила, что обучение модели Step 4 уже началось. Компания пригласила разработчиков и исследователей принять участие в открытой разработке модели и совместном создании экосистемы.

С акцентом на интеллект агентов, обработку длинного контекста и эффективность инференса, Step 3.5 Flash демонстрирует амбиции StepFun по созданию конкурентоспособной открытой основы для систем ИИ-агентов следующего поколения.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи

Open Source
12 тыс интересуются