Найти тему
Когда скучно SDET`у

Разметка изображений для датасета

Одно из самых важных вещей в нейронах сетях - данные для обучения. Точнее, не просто набор данных, а в варианте: "что на входе - что хотим получить". Если мы хотим просто детектировать объект на картинке (который там обычно один) - то проблем нет. Создаем папку "neco" - кидаем туда кошко-девочек, в папку "fox" - кицуне и т. д. )

Картинка условная, так там чуть другая архитектура
Картинка условная, так там чуть другая архитектура

Но вот с множественной сегментацией так не пройдет. На картинках для этой задачи может быть несколько разных объектов, несколько экземпляров одного и такого типа. Ту нейросети нужно скормить специально размеченные данные, типа: Смотри, вот тут у нас две кошки, видишь я тебе обвел. Вот тут собака и кот, а вот тут стайка из 3 собак. А тут вообще синий круг и зеленый квадрат. При этом каждый объект должен быть помечен отдельно.

Интерфейс приложения cvat
Интерфейс приложения cvat

Для данной задачи я взял для себя cvat. Во первых это достаточно простой интерфейс и удобство использования, во-вторых его можно установить локально через docker.

Не обошлось и без минусов правда. Основной это то что не все функции доступны бесплатно на сайте.

Например, экспорт сразу с изображениями. Можно, конечно, экспортировать разметку а картинки взять локальные, но не удобно, если ты в процессе разметки часть удалил как неподходящие. Тут проще сделать бекап проекта и развернуть его локально и нормально экспортировать. Мелочь, но отвлекает.

Второй более серьезный, но касается только локального запуска. Пока не удалось прикрутить локально "волшебную кисть" (Правда не так чтобы сильно старался). Что-то там падает в процессе установки дополнений. Есть у меня подозрение что либо я что-то не так делаю, либо связано с совместимость с моим Mac m3.

За подсказку спасибо видео:

www.youtube.com/watch?v=FF3mIWF0vFs

Там же, более подробно как этим пользоваться.

А мне нужно разметить хотя бы 300 страниц манги...

ДОП: Известные проблемы: