Nvidia представила семейство моделей Nemotron 3, в которых используются гибридные архитектуры Mamba и Transformer для работы с длинными текстами при минимальных затратах ресурсов. Главная задача Nemotron 3 — обеспечение автономной работы ИИ-агентов, которые могут выполнять сложные задачи в течение длительного времени. В линейку вошли три модели: Nano, Super и Ultra. Nano доступна уже сейчас, а выход Super и Ultra ожидается в первой половине 2026 года. Nvidia отошла от классической архитектуры Transformer. Вместо этого используется комбинация оптимизированных слоев Mamba 2 и блоков Transformer с применением технологии Mixture of Experts (MoE), которую ранее тестировали IBM и Mistral. Подход позволяет сократить расход… Подробнее
Nvidia Nemotron 3 использует гибрид Mamba для ИИ-агентов
17 декабря 202517 дек 2025
~1 мин