Крупные наборы данных играют жизненно важную роль в компьютерном зрении. Существующие наборы данных либо собираются в соответствии с эвристическими системами маркировки, либо собираются вслепую без дифференциации на категории, что делает их неэффективными и немасштабируемыми. Вопрос о том, как систематически собирать, аннотировать и создавать мегамасштабный набор данных, остается открытым. В этой статье мы выступаем за активное и постоянное создание высококачественного набора данных для компьютерного зрения на основе комплексной системе маркировки. В частности, мы предоставляем Bamboo Dataset, мегамасштабный и информационный набор данных как для классификации, так и для обнаружения объектов. Bamboo стремится заполнить всеобъемлющие категории аннотациями классификации изображений 69M и аннотациями ограничивающей рамки 170 586 объектов. По сравнению с ImageNet22K и Objects365, модели, предварительно обученные на Bamboo, достигают превосходной производительности при выполнении различных
Bamboo: непрерывное создание мегамасштабного набора данных машинного зрения с синергией человека и машины
16 марта 202216 мар 2022
111
1 мин