Найти тему
380 подписчиков

Llama 3.2 - Здравствуй мультимодальность.


Llama 3.2 включает компактные и средние модели Vision LLM (11B и 90B) и облегченные текстовые модели (1B и 3B). Модели на 1B и 3B оптимизированы для использования на мобильных устройствах, и разработаны для задач обобщения текста и выполнения инструкций.

Модели же на 11B и 90B параметров могут принимать на вход изображения и нативно работать с этим типом данных.

Квантованные варианты данных моделей вы можете найти на HuggingFaces

#llm #lama
Около минуты