Для многих людей обнаружение объектов на изображении кажется каким-то колдовством, однако существует огромное количество способов распознать на изображении определенные объекты. Одно только перечисление займет всю статью, а уж их сравнение вполне тянет на серьезное исследование. Для начала поставим задачу. Нужно посчитать количество людей, имеющихся на изображении. Делать это будем в бесплатном colab. Считать людей будем на публичном наборе изображений с людьми: https://www.cis.upenn.edu/~jshi/ped_html/PennFudanPed.zip. Известные мне системы обнаружения объектов используют фреймворк Pytorch, поэтому право первой "брачной ночи" очереди за предобученными моделями этого фреймворка. Объявляем необходимые библиотеки. Объяснение функций torchvision будет непосредственно в коде: Загрузим датасет и распакуем его. Из всего датасета нам нужно только папка PennFudanPed/PNGImages: Получим веса нашей модели (третья объявленная функция) и саму модель (вторая объявленная функция), в модель передадим
Обнаружение объектов на изображении с помощью компьютерного зрения
4 июня 20234 июн 2023
19
2 мин