StepFun выпустила Step 3.7 Flash — мультимодальную MoE-модель для агентных задач, поиска, кода и работы с изображениями. Модель имеет 198B параметров, из них около 11B активны на токен. Заявлены скорость до 400 токенов в секунду, контекст 256K и три уровня рассуждения. По данным StepFun, модель занимает первое место в ClawEval-1.1 и SimpleVQA Search, второе место в SWE-Bench PRO. Она умеет работать с интерфейсами, графиками, документами и изображениями, а затем писать код или вызывать инструменты по увиденному. Веса открыты под Apache 2.0. Модель доступна на Hugging Face, StepFun API, OpenRouter и NVIDIA NIM; локальный запуск поддерживается через vLLM, SGLang, Transformers и llama.cpp, но для полноценного запуска требуется очень мощное железо. #AI #StepFun #Step37Flash #OpenSource #LLM #Multimodal #Agents #HuggingFace