Какой алгоритм эффективнее для целей защиты периметра при использовании тепловизионных камер — детектор движения или детектор пересечения виртуальной линии? Проведя серию экспериментов, отраслевые специалисты убедились в том, что «виртуальный барьер» существенно превосходит алгоритмы, основанные на обнаружении движения, по целому ряду показателей, ключевым из которых является частота ложных тревог. С учётом того, что современная видеоаналитика интенсивно использует возможности искусственного интеллекта, глубокого машинного обучения и нейросетей, этот вывод может определить стратегию дальнейших разработок софта в области периметровых систем на базе тепловизионных и двухспектральных (гибридных) камер.
Видеоаналитика, основанная на анализе движения, делает значительные успехи — от алгоритмов невозможно скрыть даже малейшие перемещения объектов интереса. Этим обусловлено её включение в состав периметровых систем на самых различных объектах, вплоть до критических инфраструктур. Видеодетекторы движения, применяемые в защите периметра в том числе и к тепловизионным изображениям, отделяют объект от фона, выделяют его контур, классифицируют и предоставляют управляющему софту возможность отслеживать перемещения объекта, сопоставляя его поведение с правилами, заданнымы в процессе начального конфигурирования системы. В основе обнаружения движущегося объекта лежит сопоставление доли пикселов, изменивших своё положение в заданной области, с допустимым пороговым значением. Такого рода анализ не требует больших вычислительных мощностей, и детектор движения достаточно просто реализовать «на борту» камеры. В этом случае существенно разгружается центральный сервер системы, поскольку тревожные события, связанные с обнаружением перемещения объектов в кадре, поступают в управляющее ПО в потоке метаданных — то есть, с минимальной задержкой и в формате, готовом к принятию решений по реагированию.
Видеоаналитические алгоритмы разделяют задачу обнаружения движения на три последовательных этапа — выделение фона, обнаружение объектов на переднем плане и обработка переднего плана. На первом этапе по предыдущей последовательности кадров создаётся опорный кадр, в котором содержится фоновое изображение. На этапе обнаружение текущий кадр сопоставляется с опорным, и различия между ними трактуются как проявление движения. На третьем этапе пикселы, отмеченные как «сдвинутые», проходят фильтрацию, позволяющую пренебречь относительно небольшими перемещениями. Описанная выше технология имеет достаточно высокие показатели чувствительности, но для устойчивой работы алгоритмов требуется достаточно сложная процедура калибровки и конфигурирования — в противном случае на реальном объекте будут слишком часто возникать ложные тревоги. Наиболее распространённые причины ошибочных срабатываний детекторов — движение растительности в кадре, вибрация камеры, игра теней и отражений. В обратной ситуации детектор может пропустить незамеченным объект, который движется слишком медленно либо с периодическими остановками, интервал между которыми сопоставим с интервалом между опорными кадрами. Видеоаналитика типа «виртуальный барьер» появилась относительно недавно. В её основе лежат алгоритмы распознавания образов, работающие на принципе глубокого машинного обучения — так называемые свёрточные нейронные сети (convolutional neural networks, CNN), имитирующие работу биологической нервной системы. CNN-сети также распознают объекты на изображении, оценивают их координаты и скорость. Однако, в отличие от детекторов движения, которые для уверенной идентификации объекта интереса нуждаются в задании извне целого ряда корректирующих фильтров, «виртуальный барьер» предоставляет алгоритмам право самостоятельно определять приоритетные признаки объектов и применять фильтрацию по своему усмотрению. Чтобы создать такую систему, необходимо вручную проанализировать десятки тысяч изображений, определяя местоположение и тип объектов интереса в сцене. На этих изображениях проводится обучение нейросети, причём в несколько итераций. В процессе обучения общедоступные наборы данных («датасеты»), по которым обычно тренируют сети, использовать нецелесообразно: целевая видеоаналитика должна быть ориентирована на решение вопросов безопасности, поэтому здесь необходим комплект изображений, отражающий специфику всего спектра угроз, принципиально обнаруживаемых как по телевизионным, так и по тепловизионным изображениям.