Один из главных постулатов LabelMe - клиент должен убедиться в качестве прежде, чем заплатить за услуги. Поэтому мы всегда предлагаем потенциальным заказчикам получить бесплатный тестовый датасет по их задаче.
Сейчас расскажем про один из таких случаев: создание стереопар для НИУ МАИ.
Постановка задачи
С нами связался представитель НИУ МАИ с таким запросом:
Добрый день, коллеги. Остро нуждаюсь в датасете стереопар какого-либо объекта (в идеале, здания-достопримечательности). Чтобы было понятнее, мне нужно отладить алгоритм стерео визуальной одометрии.
В сети нахожу только монокулярные сеты, с бинокулярными как-то пока туго. Если знаете сайт/статью, в которых указаны датасеты с бинокулярными фото, буду очень благодарен.
Заранее спасибо!
Стереопара - пара плоских изображений одного и того же объекта, но с небольшими отклонениями с целью создать эффект объёма. Самый простой пример, где вы могли это видеть - 3D-фильмы. Там два картинки накладываются друг на друга со смещением.
На первый взгляд это просто коллаж из двух одинаковых фотографий. Одна там есть небольшое смещение, благодаря чему можно добиться объемного изображения.
Ознакомившись с письмом, наши специалисты обсудили детали выполнения заказа. Сперва мы буквально восприняли желание клиента о съемке здания и решили использовать синхронизированные коптеры. Однако, такая реализация выходила за рамки допустимого бюджета.
Пришлось продумывать план "б". Мы попросили заказчика указать необходимые параметры смещения и форму объекта для съемки.
Нужно было отснять предмет, напоминающий архитектурный памятник со всех сторон и смещением 480 мм (872 мм).
Окончательно изучив все пожелания, наша команда приступила к работе.
Выполнение заказа
На этом этапе мы столкнулись с дилеммой: у заказчика был ограниченный бюджет, а подобного рода датасет требует использования специального оборудования.
Поэтому было принято решение самим создать платформу для съемки и использовать смартфоны с идентичными камерами. Наш выбор пал iPhone 7.
Мы прикрепил оба смартфона скотчем к столу на колесиках, а в качестве направляющей рельсы для смены ракурсов использовали обруч, на котором разметили нужные нам градусы смещения.
Далее мы добавили задний фон, чтобы было проще обработать объект на постпродакшне. Начали съемку, постепенно вращая опорную конструкцию по нужной траектории.
Результат
В конечном счете мы получили набор фотографий (по 100 с каждой камеры), параметры конструкции и съемки. В будущем заказчик объединит все эти данные, прогонит через алгоритм и получит объемную модель.
Мы в свою очередь можем показать, небольшой пример того, как выглядит еще не наложенные, но синхронизированные стереопары.
Подготавливая этот тестовый датасет, наша команда в буквальном смысле смогла обойтись сподручными предметами. Тем самым мы сэкономили заказчику немалую сумму, ведь для полномасштабной реализации нужна студия, свет, вращающаяся платформа, синхронизаторы движения.
Если вам интересен такой формат, дайте нам об этом знать в комментариях. LabelMe с удовольствием поделится с вами секретами нашей внутренней кухни.
Другие наши статьи:
Почему разметка данных в LabelMe на 25% быстрее, чем на биржах
Как ускорить кластеризацию k-средних в 8 раз и допускать в 27 раз меньше ошибок
Model Search: новая платформа от Google для поиска оптимальной модели машинного обучения