11 подписчиков

Nvidia представила открытую ИИ-модель Nemotron 3 Super с гибридной архитектурой Mamba-Transformer и пятикратным приростом скорости работы

19 марта19 мар

2 мин

Nvidia представила новую открытую языковую модель Nemotron 3 Super, предназначенную специально для сложных задач агентного искусственного интеллекта. Это первая модель в серии Nemotron 3, которая сочетает в себе несколько передовых технологий: парадигму LatentMoE, слои Multi-Token Prediction и метод предварительного обучения NVFP4. Модель обладает 120 миллиардами общих параметров, но при этом активно использует только 12 миллиардов в каждом запросе — это ключевая особенность архитектуры Mixture-of-Experts, позволяющая эффективно распределять вычислительные ресурсы. Главное преимущество Nemotron 3 Super — её гибридная архитектура, объединяющая Mamba и Transformer. По данным Nvidia, такая комбинация обеспечивает до пяти раз более высокую пропускную способность и до двух раз большую точность по сравнению с предыдущей версией Nemotron Super. Это особенно важно для задач, где требуется не просто ответить на вопрос, а последовательно выполнять несколько шагов: от анализа данных до генераци

Главное преимущество Nemotron 3 Super — её гибридная архитектура, объединяющая Mamba и Transformer. По данным Nvidia, такая комбинация обеспечивает до пяти раз более высокую пропускную способность и до двух раз большую точность по сравнению с предыдущей версией Nemotron Super. Это особенно важно для задач, где требуется не просто ответить на вопрос, а последовательно выполнять несколько шагов: от анализа данных до генерации кода или принятия решений на основе длинных контекстов.

Одной из ключевых возможностей модели является поддержка контекстного окна в один миллион токенов. Это означает, что агент на основе Nemotron 3 Super может хранить в памяти целые рабочие процессы — например, тысячи страниц финансовых отчётов, исходный код крупного проекта или историю взаимодействия с пользователем — и не терять связь с целью. Такой объём позволяет избежать «забывания» важных деталей, что часто ломает работу других ИИ-агентов.

Модель была обучена не на обычных текстах, а на синтетических данных, сгенерированных с помощью моделей логического мышления. Nvidia опубликовала полную методологию: более 10 триллионов токенов обучающих данных, 15 различных сред для обучения с подкреплением и детальные рецепты оценки. Это делает Nemotron 3 Super не просто инструментом, а открытым исследовательским проектом, доступным для научного сообщества.

Для тонкой настройки и создания собственных версий исследователи могут использовать платформу Nvidia NeMo. Это особенно ценно для компаний, которые хотят адаптировать модель под специфические задачи — например, для автоматизации внутренних процессов в банках, юридических фирмах или IT-отделах. Модель оптимизирована для работы на новейших процессорах Nvidia Blackwell в формате NVFP4, что снижает требования к памяти и ускоряет вывод в четыре раза по сравнению с FP8 на предыдущем поколении Hopper — без потери точности.

Nemotron 3 Super уже доступна для использования. Её можно загрузить через build.nvidia.com, Hugging Face, OpenRouter и Perplexity. Для облачного развёртывания доступны партнёры: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI и Modal. Также модель представлена в виде микросервиса Nvidia NIM — это позволяет развернуть её как в облаке, так и на локальных серверах, что важно для компаний с жёсткими требованиями к безопасности данных.

Пока неясно, как именно эта модель повлияет на рынок агентных ИИ-систем. Хотя её возможности впечатляют, реальные кейсы применения в промышленности ещё только начинают формироваться. Также остаётся вопрос о том, насколько широко будут использоваться синтетические данные, на которых обучена модель — могут ли они создавать «эхо» ошибок, заложенных в генераторах логики? Тем не менее, Nvidia впервые предоставила столь открытый и мощный инструмент для агентного ИИ — и это меняет правила игры.

Если вы работаете с ИИ-агентами, стоит попробовать Nemotron 3 Super уже сейчас. Какие задачи вы бы хотели поручить модели с миллионом токенов контекста?