Найти тему
ComBox Technology

Как нейронные сети помогают обработать фотографии на онлайн-сервисах?

Рассмотрим популярные сегодня онлайн-сервисы (сайты, интернет-ресурсы, мобильные приложения) и применение нейронных сетей в них. Существует, как минимум, три направления, в которых нейронные сети могут помогать в обработке входящего медиа-контента на онлайн-сервисах. Эти направления сводятся к детекции объектов, их сегментации и классификации. 

Например, представим, что у нас есть онлайн-сервис по продаже автомобилей. В качестве входящей информации пользователи загружают фотографии своего автомобиля и указывают сведения о нем. Используя детектор мы можем определить на фотографии машину и узнать площадь, которую она занимает. Если она занимает менее 1/3 фотографии, то можно попросить пользователя загрузить другую фотографию. Далее, обрезав автомобиль по контуру на фотографии, его можно загрузить в классификатор и определить марку и модель транспортного средства. Эти данные можно сравнивать с данными, выведенными пользователем в текстовом виде. Не обязательно жёстко ограничивать пользователя в каких-либо действиях, но накапливать информацию о несоответствиях в разрезе пользователей смысл есть. Также при наличии на фотографии гос. номера автомобиля, его можно проверять по базам оперативно-розыскных мероприятий или использовать как идентификатор поиска (как первичный для сопоставления, потом переключаясь на VIN). 

Другой пример использования нейронных сетей в анализе фотографии – предотвращение загрузки и распространения порнографических материалов. Таким образом, можно значительно сокращать ручную работу по анализу качества контента и обработку рекламаций пользователей и/или правоохранительных органов. 

Существуют масса онлайн-сервисов и мобильных приложений, где от пользователя требуется загрузить собственную фотографии (не стол, стул или пол, а фотографию, которая содержит лицо). Собственная она или нет удостовериться, конечно, не получится, но использовать детектор лица и определение половозрастной структуры целесообразно и, главное, просто. Готовые решения в части детекции и распознавания с формированием уникального хеша лица и дальнейшим поиском по этим наборам данных есть в моделях Intel OpenVINO. 

Вот несколько предобученных моделей от Intel OpenVINO (https://software.intel.com/en-us/openvino-toolkit/documentation/pretrained-models), которые можно использовать в своих проектах: 

Детектор лиц
Детектор лиц
Определение контрольных точек на лице
Определение контрольных точек на лице
Распознавание и детекция лиц
Распознавание и детекция лиц
Детектор людей
Детектор людей
Детектор людей, автомобилей и велосипедов
Детектор людей, автомобилей и велосипедов

Самое главное, что сегодня существует огромное количество готовых предобученных моделей, которые можно использовать в собственных проектах. Далее, обладая своим набором данных, сети можно дообучать и улучшать их качество.

Вот несколько наглядных примеров работы детекторов из публичных моделей OpenVINO: