142 тыс подписчиков

NVIDIA представила новую малую языковую модель Mistral-NeMo-Minitron 8B

26 августа 202426 авг 2024

2 мин

NVIDIA продолжает расширять возможности искусственного интеллекта, представляя новую языковую модель Mistral-NeMo-Minitron 8B. Эта модель была создана на основе предыдущей версии Mistral NeMo 12B и предназначена для использования в условиях, требующих высокой производительности и точности. С ее помощью разработчики смогут создавать более эффективные ИИ-приложения для различных задач, от чатботов до образовательных инструментов. Mistral-NeMo-Minitron 8B представляет собой "миниатюрную версию" более крупной модели Mistral NeMo 12B. Она была специально разработана для оптимизации работы в центрах обработки данных, облачных сервисах и на высокопроизводительных рабочих станциях с графическими процессорами NVIDIA RTX. В отличие от многих других моделей, которые часто жертвуют точностью ради производительности, новая модель от NVIDIA стремится объединить оба эти аспекта. Согласно заявлению компании, Mistral-NeMo-Minitron 8B демонстрирует выдающиеся результаты в тестах, связанных с чатботами и

Mistral-NeMo-Minitron 8B представляет собой "миниатюрную версию" более крупной модели Mistral NeMo 12B. Она была специально разработана для оптимизации работы в центрах обработки данных, облачных сервисах и на высокопроизводительных рабочих станциях с графическими процессорами NVIDIA RTX. В отличие от многих других моделей, которые часто жертвуют точностью ради производительности, новая модель от NVIDIA стремится объединить оба эти аспекта.

Согласно заявлению компании, Mistral-NeMo-Minitron 8B демонстрирует выдающиеся результаты в тестах, связанных с чатботами и виртуальными помощниками. Модель успешно конкурирует с Llama 3.1 8B и Gemma 7B, превосходя их в ключевых тестах на точность. Это делает ее идеальным выбором для разработчиков, стремящихся создать мощные ИИ-решения.

Интересно, что NVIDIA использовала два метода оптимизации, чтобы уменьшить количество параметров модели с 12 миллиардов до 8 миллиардов. Эти методы включают обрезку, которая удаляет менее значимые компоненты нейронной сети, и дистилляцию, позволяющую повысить точность обрезанной модели. Такой подход позволяет добиться сопоставимой точности с оригинальной моделью при меньших вычислительных затратах.

Кроме того, NVIDIA анонсировала еще одну версию модели под названием Nemotron-Mini-4B-Instruct. Эта "уменьшенная" версия оптимизирована для работы на устройствах с ограниченной памятью и обеспечивает более быстрые отклики на запросы. Это открывает новые возможности для пользователей, которые нуждаются в высокопроизводительных ИИ-решениях на своих ПК и ноутбуках.

Mistral-NeMo-Minitron 8B доступен как микросервис через NVIDIA NIM и может быть загружен через платформу Hugging Face. Это делает его доступным для широкой аудитории разработчиков, желающих интегрировать мощные языковые модели в свои приложения.

📃 Читайте далее на сайте

Гаджеты и электроника

5,73 млн интересуются