Наконец-то разметил 100 страниц манги для тренировки второй версии детектора. Первая версия неплохо детектировала текстовые блоки (даже лучше easyocr), но в том виде, в котором был результат удалял слишком много информации. Что было нежелательно, так как я планировал восстанавливать фон, а там чем меньше удаляешь - тем, в теории, лучше результат. Во вторую версия я заложил возможность распознавания 4 типов данных. Баблы обычные, баблы квадратные, баблы "солнышко" и просто текст на фоне. Но для того нужно было переразметить датасет. Если датасет для первой версии я разметил где-то за полтора часа, то вот на этот... В общем несколько дней я на это потратил. Не полный день, естественно, но ушло много. В среднем на нармальную разметку бабла нужно от минуты до пяти (а на некторые и больше). Звучит немного, но на странице может быть до 10 баблов, что в результате дает приличное количество времени. Несколько примеров ниже. Но вот разметил хотя бы 100. Дальше, после проверки общей работосп
[YOLO v8] Нейросеть DETECTOR 2.1 для поиска и сегментизации текста
10 марта 202410 мар 2024
73
1 мин