NVIDIA и Mistral AI представили языковую модель Mistral-NeMo-Minitron 8B (8 миллиардов параметров) — «уменьшенную версию» новой высокоточной модели Mistral NeMo 12B, сообщает TweakTown. NVIDIA называет новую модель «одной из самых совершенных открытых моделей в своём размерном классе». Модель получилась достаточно «лёгкой», чтобы работать в режиме реального времени на широком спектре оборудования, начиная от персональных компьютеров с актуальными достаточно производительными видеокартами NVIDIA RTX и заканчивая облачными серверами. Источник изображения: Vishal Bansal, Unsplash NVIDIA сравнивает новый вариант модели с парой конкурентов, включая Gemma 7B от Google — Mistral-NeMo-Minitron 8B показывает лучшую точность как минимум в девяти популярных тестах для языковых моделей искусственного интеллекта (ИИ). «Мы объединили два различных метода оптимизации ИИ — обрезку (pruning) для сокращения 12 миллиардов параметров Mistral NeMo до 8 миллиардов и дистилляцию (distillation) для повышения
NVIDIA и Mistral AI представили языковую модель Mistral-NeMo-Minitron 8B
26 августа 202426 авг 2024
1
2 мин