Найти в Дзене
79 подписчиков

Recognize Anything (RAM): система для распознавания контекста на изображениях и автоматического проставления тегов.


Модель:
* демонстрирует впечатляющую производительность в zero-shot режиме, значительно превосходя CLIP и BLIP.
* превосходит полностью контролируемый подход ML-Decoder.
* демонстрирует конкурентоспособную производительность при работе с Google API для проставления тегов.
* автоматически распознает 6400+ общих тегов, охватывая больше ценных категорий, чем OpenImages v6

Recognize Anything (RAM): система для распознавания контекста на изображениях и автоматического проставления тегов.
Около минуты