Найти в Дзене
1320 подписчиков

Вот здесь демо новой ИИ, которая описывает изображения. На английском идеально, а на русском - иногда с китайским, т.к. "под капотом" у нее Qwen2.5 насколько помню (а эту сделали наши Китайские партнеры).


"Доступна Molmo 72B - флагманская модель на базе Qwen2-72B в роли LLM и ViT-L/14 336px CLIP в роли visial-энкодера. Molmo-72B достигает наивысшего балла в бенчмарках и занимает второе место по человеческой оценке, лишь немного уступая GPT-4o."

Работает быстро, сами попробуйте демку. Я не знаю, как нам это применять в наших микробизнесах, но штука несомненно перспективная.

Вот здесь демо новой ИИ, которая описывает изображения. На английском идеально, а на русском - иногда с китайским, т.к. "под капотом" у нее Qwen2.
Около минуты