Nvidia представила новую открытую языковую модель Nemotron 3 Super, предназначенную специально для сложных задач агентного искусственного интеллекта. Это первая модель в серии Nemotron 3, которая сочетает в себе несколько передовых технологий: парадигму LatentMoE, слои Multi-Token Prediction и метод предварительного обучения NVFP4. Модель обладает 120 миллиардами общих параметров, но при этом активно использует только 12 миллиардов в каждом запросе — это ключевая особенность архитектуры Mixture-of-Experts, позволяющая эффективно распределять вычислительные ресурсы. Главное преимущество Nemotron 3 Super — её гибридная архитектура, объединяющая Mamba и Transformer. По данным Nvidia, такая комбинация обеспечивает до пяти раз более высокую пропускную способность и до двух раз большую точность по сравнению с предыдущей версией Nemotron Super. Это особенно важно для задач, где требуется не просто ответить на вопрос, а последовательно выполнять несколько шагов: от анализа данных до генераци
Nvidia представила открытую ИИ-модель Nemotron 3 Super с гибридной архитектурой Mamba-Transformer и пятикратным приростом скорости работы
19 марта19 мар
2
2 мин