Добавить в корзинуПозвонить
Найти в Дзене
Нейро Отличник

Nemotron 3 Ultra (550B‑A55B): открытая модель NVIDIA для сложных ИИ-агентов

Компания NVIDIA представила Nemotron 3 Ultra (550B‑A55B) — открытую языковую модель с 550 миллиардами параметров, из которых 55 миллиардов активны одновременно. Модель ориентирована на работу в составе ИИ-агентов и рассчитана на сложные сценарии, где требуется удерживать длинный контекст и взаимодействовать с внешними инструментами. В основе Nemotron 3 Ultra лежит гибридная архитектура Mamba2 + Transformer с соотношением 4:1 в пользу Mamba. Это позволяет эффективно обрабатывать большие объёмы информации и поддерживать сложные многошаговые задачи. Дополнительно реализована LatentMoE-архитектура, что повышает гибкость и масштабируемость модели. Модель прошла предпросмотр на 20 триллионах токенов в формате NVFP4, а затем — двухэтапный MOPD post-training. В результате Nemotron 3 Ultra способна: В отличие от многих крупных моделей, Nemotron 3 Ultra полностью открыта: доступны базовая версия, варианты после дополнительного обучения, контрольные точки для оценки качества, NVFP4-квантованные в
Оглавление

Компания NVIDIA представила Nemotron 3 Ultra (550B‑A55B) — открытую языковую модель с 550 миллиардами параметров, из которых 55 миллиардов активны одновременно. Модель ориентирована на работу в составе ИИ-агентов и рассчитана на сложные сценарии, где требуется удерживать длинный контекст и взаимодействовать с внешними инструментами.

Особенности архитектуры

В основе Nemotron 3 Ultra лежит гибридная архитектура Mamba2 + Transformer с соотношением 4:1 в пользу Mamba. Это позволяет эффективно обрабатывать большие объёмы информации и поддерживать сложные многошаговые задачи. Дополнительно реализована LatentMoE-архитектура, что повышает гибкость и масштабируемость модели.

Модель прошла предпросмотр на 20 триллионах токенов в формате NVFP4, а затем — двухэтапный MOPD post-training. В результате Nemotron 3 Ultra способна:

  • удерживать и анализировать длинные контексты;
  • работать с внешними инструментами;
  • решать задачи, требующие нескольких последовательных шагов;
  • эффективно функционировать в агентных сценариях.

Доступность и открытость

В отличие от многих крупных моделей, Nemotron 3 Ultra полностью открыта: доступны базовая версия, варианты после дополнительного обучения, контрольные точки для оценки качества, NVFP4-квантованные версии, а также данные и рецепты обучения. Модель можно протестировать бесплатно через Opencode.

Для желающих ознакомиться с моделью доступны две основные сборки:

  • BF16
  • NVFP4

Nemotron 3 Ultra — инструмент для тех, кто работает с агентными ИИ-системами и ищет максимально гибкую и масштабируемую открытую модель.

Нейро Отличник www.neurootlichnik.ru