Одно из самых важных вещей в нейронах сетях - данные для обучения. Точнее, не просто набор данных, а в варианте: "что на входе - что хотим получить". Если мы хотим просто детектировать объект на картинке (который там обычно один) - то проблем нет. Создаем папку "neco" - кидаем туда кошко-девочек, в папку "fox" - кицуне и т. д. )
Но вот с множественной сегментацией так не пройдет. На картинках для этой задачи может быть несколько разных объектов, несколько экземпляров одного и такого типа. Ту нейросети нужно скормить специально размеченные данные, типа: Смотри, вот тут у нас две кошки, видишь я тебе обвел. Вот тут собака и кот, а вот тут стайка из 3 собак. А тут вообще синий круг и зеленый квадрат. При этом каждый объект должен быть помечен отдельно.
Для данной задачи я взял для себя cvat. Во первых это достаточно простой интерфейс и удобство использования, во-вторых его можно установить локально через docker.
Не обошлось и без минусов правда. Основной это то что не все функции доступны бесплатно на сайте.
Например, экспорт сразу с изображениями. Можно, конечно, экспортировать разметку а картинки взять локальные, но не удобно, если ты в процессе разметки часть удалил как неподходящие. Тут проще сделать бекап проекта и развернуть его локально и нормально экспортировать. Мелочь, но отвлекает.
Второй более серьезный, но касается только локального запуска. Пока не удалось прикрутить локально "волшебную кисть" (Правда не так чтобы сильно старался). Что-то там падает в процессе установки дополнений. Есть у меня подозрение что либо я что-то не так делаю, либо связано с совместимость с моим Mac m3.
За подсказку спасибо видео:
www.youtube.com/watch?v=FF3mIWF0vFs
Там же, более подробно как этим пользоваться.
А мне нужно разметить хотя бы 300 страниц манги...
ДОП: Известные проблемы: