Пока большинство обсуждает GPT, Claude и Gemini, китайская компания StepFun quietly выпустила одну из самых интересных моделей этого года. Новая модель называется Step 3.7 Flash. На первый взгляд характеристики выглядят впечатляюще: Но самое интересное даже не это. По данным StepFun, в некоторых задачах программирования новая модель достигает 97% производительности Claude Opus 4.6, при этом обходится примерно в 9 раз дешевле. Обычно, когда речь идёт о моделях на сотни миллиардов параметров, сразу возникает вопрос стоимости. Но здесь используется архитектура: Mixture-of-Experts (MoE) В такой системе работает не вся сеть целиком. Для каждого токена активируются только нужные эксперты. В результате модель имеет: То есть по вычислительным затратам она ближе к модели на 11 млрд параметров, чем к полноценным 198 млрд. Step 3.5 Flash была исключительно текстовой моделью. Теперь Step 3.7 Flash получила полноценную мультимодальность. Внутри работает отдельный визуальный энкодер: Vision Transfor
Китайцы выпустили убийцу дорогих ИИ? Step 3.7 Flash показывает почти уровень Claude Opus, но стоит в 9 раз дешевле
8 июня8 июн
12
3 мин