1320 подписчиков
Вот здесь демо новой ИИ, которая описывает изображения. На английском идеально, а на русском - иногда с китайским, т.к. "под капотом" у нее Qwen2.5 насколько помню (а эту сделали наши Китайские партнеры).
"Доступна Molmo 72B - флагманская модель на базе Qwen2-72B в роли LLM и ViT-L/14 336px CLIP в роли visial-энкодера. Molmo-72B достигает наивысшего балла в бенчмарках и занимает второе место по человеческой оценке, лишь немного уступая GPT-4o."
Работает быстро, сами попробуйте демку. Я не знаю, как нам это применять в наших микробизнесах, но штука несомненно перспективная.
Около минуты
30 сентября 2024