380 подписчиков
Llama 3.2 - Здравствуй мультимодальность.
Llama 3.2 включает компактные и средние модели Vision LLM (11B и 90B) и облегченные текстовые модели (1B и 3B). Модели на 1B и 3B оптимизированы для использования на мобильных устройствах, и разработаны для задач обобщения текста и выполнения инструкций.
Модели же на 11B и 90B параметров могут принимать на вход изображения и нативно работать с этим типом данных.
Квантованные варианты данных моделей вы можете найти на HuggingFaces
#llm #lama
Около минуты
26 сентября 2024