Найти в Дзене
10,2 тыс подписчиков

✅ Demystifying CLIP Data


MetaCLIP takes a raw data pool and metadata and yields a balanced subset over the metadata distribution.

Новый масштабируемый алгоритм MetaCLIP, работающий в конвейере обработки данных. MetaCLIP, примененная к CommonCrawl с 400 млн. пар данных "изображение-текст", превосходит данные CLIP по многим стандартным показателям. В классификации ImageNet точность MetaCLIP составляет 70,8%, что превосходит точность CLIP в 68,3% на моделях ViT-B.




✅ Demystifying CLIP Data  MetaCLIP takes a raw data pool and metadata  and yields a balanced subset over the metadata distribution.
Около минуты