Найти в Дзене
40 подписчиков

Вышла новая версия визуальной языковой модели moondrem2.

модель: huggingface.co/...am2
гитхаб: github.com/...ile
Инструкция по распознаванию взгляда на видео: github.com/...deo
Moondream — это высокоэффективная языковая модель машинного зрения с открытым исходным кодом, которая сочетает в себе мощные возможности распознавания изображений с удивительно небольшим размером. Она разработана как универсальная и доступная модель, способная работать на широком спектре устройств и платформ.
Проект предлагает два варианта модели:
Moondream 2B: основная модель с 2 миллиардами параметров, обеспечивающая высокую производительность для задач общего назначения по распознаванию изображений, включая создание подписей, ответы на визуальные вопросы и обнаружение объектов.
Moondream 0,5B: компактная модель с 500 миллионами параметров, специально оптимизированная для периферийных устройств, что позволяет эффективно использовать её на ограниченном по ресурсам оборудовании, сохраняя при этом впечатляющие возможности.
Вышла новая версия визуальной языковой модели moondrem2. модель: huggingface.co/...am2 гитхаб: github.com/...ile Инструкция по распознаванию взгляда на видео: github.com/...
00:05
Около минуты