3 подписчика

🟢 NVIDIA выпустила Nemotron 3 Ultra

2 дня назад2 дня назад

~1 мин

NVIDIA открыла Nemotron 3 Ultra — большую reasoning-модель для долгих агентских задач. У неё 550 млрд параметров всего и 55 млрд активных за проход. Модель рассчитана на кодинг, глубокий анализ, работу с инструментами, длинные цепочки действий и большие кодовые базы. Контекст — до 1 млн токенов. Архитектура гибридная: Mamba-2, Attention, LatentMoE и MTP. NVIDIA заявляет до 5 раз более быстрый вывод и до 30% меньшую стоимость на сложных агентских задачах по сравнению с другими открытыми frontier-моделями. Весы доступны на Hugging Face в NVFP4, лицензия OpenMDW-1.1. Для локального запуска нужно серверное железо уровня 4×B200 или 8×H100, для обычных домашних GPU модель не подходит. #AI #NVIDIA #Nemotron #OpenSource #LLM #Agents #HuggingFace #TechNews

NVIDIA открыла Nemotron 3 Ultra — большую reasoning-модель для долгих агентских задач. У неё 550 млрд параметров всего и 55 млрд активных за проход.

Модель рассчитана на кодинг, глубокий анализ, работу с инструментами, длинные цепочки действий и большие кодовые базы. Контекст — до 1 млн токенов.

Архитектура гибридная: Mamba-2, Attention, LatentMoE и MTP. NVIDIA заявляет до 5 раз более быстрый вывод и до 30% меньшую стоимость на сложных агентских задачах по сравнению с другими открытыми frontier-моделями.

Весы доступны на Hugging Face в NVFP4, лицензия OpenMDW-1.1. Для локального запуска нужно серверное железо уровня 4×B200 или 8×H100, для обычных домашних GPU модель не подходит.

#AI #NVIDIA #Nemotron #OpenSource #LLM #Agents #HuggingFace #TechNews