Видеоаналитика

Основная тенденция, которую мы отчетливо наблюдаем последние 5 лет, сводится к интеграции виртуального  и реального мира за счет создания специальных интерфейсов. Так, например, появился целый класс IoT систем умного дома с интернет-чайниками и множеством датчиков, появились роботизированные системы, способные к интерактивному управлению из digital, и даже современные дроны научились не просто летать под управлением пульта ДУ, но и выполнять задачи под контролем программы управления полетом.

Думая об интеграции еще глубже, мы понимаем, что главный интерфейс восприятия мира для человека — это его глаза. Поэтому в свое время и технологии видеонаблюдения получили бурное развитие. Ведь поставить множество камер и следить за порядком было вполне удобно. Но для анализа видеопотока с камер требовались операторы. Правда, операторы могли пропустить важное событие, которое хоть и можно было восстановить по записи, но среагировать оперативно было уже невозможно.

С развитием  технологиий и ростом возможностей быстрых вычислений появилось направление, которое в России получило название «видеоаналитика», то есть машинный контроль за событиями, объектами и их поведением с использованием данных с видеокамер.

Уже давно система распознавания лиц применяется в оперативно-розыскных мероприятиях, а распознавание номеров автомобилей - в выписывании всеми нелюбимых штрафов за превышение скорости или нарушения иных правил ПДД.

Казалось, что сфер применения таких технологий масса, и они должны работать везде и всюду. Но в этой статье мы постараемся ответить на вопрос «почему видеоаналитика развивается и внедряется повсеместно не так быстро, как хотелось».

Во-первых потому, что существующие алгоритмы, основанные на линейных и многомерных способах обработки визуальной информации, не идеальны. Требуется их адаптация под ту или иную задачу.  Во-вторых, есть сложности обучения нейронных сетей для идентификации тех или иных объектов, их свойств и событий.

Представьте себе привычный всем объект, например, ножницы. Во-первых, существует множество видов ножниц, во-вторых, они все выглядят по-разному в разных условиях – дождь, туман, сумерки и так далее. Задача нейронной сети - сделать быстрое сопоставление 1 к N с максимальным коэффициентом точности распознавания.  И для этого в процессе обучения нейронной сети нужно учесть все возможные сценарии распознавания, а сделать это весьма не просто.

Именно поэтому,  на проходной предприятия распознавание лица, как биометрическое средство прохода через турникет, работает хорошо (мы контролируем условия окружающей среды – свет, угол обзора и так далее). Но на улице распознать лицо в полуанфас - задача трудновыполнимая.

Тем не менее, технологии видеоаналитики развиваются достаточно динамично, и в скором будущем знаний нейросетей будут достаточно, чтобы решить практически любую идентификационную задачу.

Более подробно о видеонаблюдении и видеоаналитике можно прочитать здесь.

Консультация эксперта

Автор материала: Сергей Александрович Кулабухов, управляющий директор ГК "ЛАРГА"