40 подписчиков
Вышла новая версия визуальной языковой модели moondrem2.
модель: huggingface.co/...am2
гитхаб: github.com/...ile
Инструкция по распознаванию взгляда на видео: github.com/...deo
Moondream — это высокоэффективная языковая модель машинного зрения с открытым исходным кодом, которая сочетает в себе мощные возможности распознавания изображений с удивительно небольшим размером. Она разработана как универсальная и доступная модель, способная работать на широком спектре устройств и платформ.
Проект предлагает два варианта модели:
Moondream 2B: основная модель с 2 миллиардами параметров, обеспечивающая высокую производительность для задач общего назначения по распознаванию изображений, включая создание подписей, ответы на визуальные вопросы и обнаружение объектов.
Moondream 0,5B: компактная модель с 500 миллионами параметров, специально оптимизированная для периферийных устройств, что позволяет эффективно использовать её на ограниченном по ресурсам оборудовании, сохраняя при этом впечатляющие возможности.
Около минуты
12 января 2025