10,2 тыс подписчиков
✅ Demystifying CLIP Data
MetaCLIP takes a raw data pool and metadata and yields a balanced subset over the metadata distribution.
Новый масштабируемый алгоритм MetaCLIP, работающий в конвейере обработки данных. MetaCLIP, примененная к CommonCrawl с 400 млн. пар данных "изображение-текст", превосходит данные CLIP по многим стандартным показателям. В классификации ImageNet точность MetaCLIP составляет 70,8%, что превосходит точность CLIP в 68,3% на моделях ViT-B.
⭐️ Dataset: https://paperswithcode.com/dataset/laion-400m
Около минуты
1 октября 2023