Как современная видеоаналитика решает бизнес-задачи

Логотип компании
Как современная видеоаналитика решает бизнес-задачи
Прогресс превратил камеры из инструмента сбора визуальной информации в инструмент аналитики огромного массива данных. Интеграция оптических систем с возможностями искусственного интеллекта открыла дверь в новую эпоху...

Представить сегодняшний мир без систем видеонаблюдения кажется невозможным. Камеры на улицах, в транспорте, магазинах, офисах и даже дома – часть современного ландшафта. Однако прогресс, диктуемый нашими потребностями, превратил камеры из инструмента сбора визуальной информации в инструмент аналитики огромного массива данных. Интеграция оптических систем с возможностями искусственного интеллекта открыла дверь в новую эпоху, где «умные» камеры стоят на страже безопасности общества, экономят силы человека и решают бизнес-задачи.

Что же представляет из себя нынешняя видеоаналитика и какие проблемы ей по плечу? Предлагаем разобраться.

Возможности искусственного интеллекта – бескрайний простор для человечества. Сегодня технология нашла применение в промышленности, ретейле, банковской сфере, логистике и транспортной отрасли. Осознавая перспективность инновации, INTACT в 2018 году инвестировал в разработку facemetric – платформы компьютерного зрения на основе искусственного интеллекта для решения прикладных задач.

Традиционные системы

Все системы видеонаблюдения состоят из двух основных компонентов: камер, которые расставляются в ключевых точках, где необходимо наблюдение, и центральной системы, куда поступает, обрабатывается, записывается и хранится вся информация с камер. Раньше роль второго элемента мог выполнять, например, видеомагнитофон, сейчас же это в большинстве случаев делают специализированные программные продукты, которые устанавливаются на серверы, работающие в центрах обработки данных. Информация с современных камер доставляется до места обработки и хранения по сетям связи при помощи различных технологий передачи данных.

Современные системы существенным образом развиваются по двум направлениям: возможности камер как оптической подсистемы и как дополнительных встроенных функций. В итоге камеры видят четче, способны анализировать картинку, умеют определять движение в кадре, сигнализировать о простых событиях. Важно, что все эти механизмы могут быть реализованы прямо на камере, что радикально увеличивает скорость реакции на вышеуказанные события и разгружает центральный сервер, который хранит видеозапись и отмечает на нем события, о которых сообщила камера.

Самый дорогостоящий элемент любой системы видеонаблюдения – система хранения данных. Чтобы оптимизировать ее общую стоимость, созданы различные технологии: сжатие изображения, динамическая работа с частотой кадров и разрешением картинки, технология записи по событиям. Действительно, вести постоянную запись, когда в кадре ничего не происходит, бессмысленно. Для этого используются технологии, которые, анализируя изображение, позволяют оставлять на центральном сервере запись с камеры за определенное время до и после начала движения в кадре. Таким образом экономится необходимое для хранения записей пространство и растет глубина видеоархива – временной промежуток, в котором доступно записанное видео.

Новые возможности

Современные системы развиваются и в контексте центральных систем хранения, которые позволяют отрабатывать различные механизмы и реализовать продвинутую аналитику. Так как камер достаточно много и человеку за ними тяжело уследить, приходится применять цифровые методы анализа, помогающие реализовать на центральном сервере сценарий уже продвинутого мониторинга изображений, например детектировать конкретные объекты: распознавать лица, оружие, багаж и действия, чтобы привлечь внимание сотрудников службы безопасности.

Технологии анализа видеоизображения, базирующиеся на продвинутых механизмах, в основном с использованием искусственного интеллекта, позволяют распознавать лица. Это заслуга обученных нейросетей. Детекция и распознавание сложных объектов требуют специальной тренировки – обучения нейросетей.

Как камера становится «умной»

Ключевой компонент обучения – датасет (Dataset), который хранит массив данных, где, в свою очередь, находится интересующий нас объект. Способность машины распознавать изображения тренируется на наборе картинок, где есть то, с чем мы хотим «познакомить» нейросеть. Для проведения обучения нейросети необходима разметка датасета, сделанная вручную людьми, чтобы подсказать необходимые элементы для обучения. Человек должен дать машине информацию для понимания базовых вещей. Размеченный датасет загружается в нейросетевую платформу и обрабатывается. Время обработки зависит от сложности модели и алгоритмов анализа.

Сбор датасета и его разметка – самое затратное по времени мероприятие во всем процессе обучения. У нас был кейс, связанный с распознаванием дефектов на производстве, где датасет собирался несколько дней путем установки камеры и ручного анализа видео. На это может уйти вплоть до нескольких недель.

Какие проблемы решает технология видеоаналитики

Основное преимущество автоматизированной видеоаналитики – масштабирование: машина может обрабатывать большой поток данных и работать без потери концентрации внимания. Работа людей с гигантским количеством информации стоит баснословных денег и занимает очень много времени. К тому же машины умеют работать с архивами ретроспективно, не только в реальном времени. Машина никогда не устает и абсолютно беспристрастна, что позволяет ей превосходить способности человека при анализе большого объема видеоданных.

Например, машина отлично справляется с распознаванием лиц, в то время как человеческому глазу не всегда под силу уловить едва заметные нюансы внешности, особенно когда приходится иметь дело с внушительным потоком людей. Невозможность постоянной концентрации, усталость, человеческий фактор делают свое дело – машина неуязвима в этом плане. В нашей истории был кейс с золотодобывающей компанией, где по пропускам двух работников на рудники проходило большое количество других людей, что заставило компанию платить бонусы за переработки. Охранники не смогли эффективно идентифицировать работников и предотвратить череду нарушений. В итоге внимательная и беспристрастная система распознавания лиц решила данную проблему.

Часто наши потенциальные клиенты интересуются видеоаналитикой с возможностью интеграции с системой контроля и управления доступом (СКУД). Например, в ситуациях, когда в помещение с пропускным режимом заходит человек без наличия доступа, может быть, вслед за коллегой, у которого разрешение в наличии. Дополнительно такая функция может помочь сформировать карту перемещения сотрудников по рабочим зонам.

Кроме того, существуют технологии, помогающие автоматизировать контроль при удаленной сдаче экзаменов: система прокторинга на базе продвинутой аналитики при помощи web-камеры распознает экзаменуемого и контролирует, как часто тот отвлекается и насколько сконцентрирован во время сдачи экзамена, привлекает внимание контролера-человека или автоматически фиксирует потенциальное нарушение в системе удаленного обучения.

Часто компании интересуются возможностями «умных» систем видеонаблюдения, но, как правило, не знают всех тонкостей технологий, не могут четко определить «проблемную» зону и сформулировать задачу. В таких случаях команда INTACT проводит анализ ситуации и формулирует задачи и проблемы, а также возможные пути их решения. Применение систем нейросетевой видеоаналитики далеко не всегда оказывается обоснованным и целесообразным.

Читайте также
Еще совсем недавно от западных облачных сервисов зависело 30% крупных российских компаний. Их отключение, порой внезапное, должно было поставить рынок перед сложными вызовами. Но оказалось, что российские облака готовы предложить рынку вполне зрелые решения. Это и многое другое обсудили участники круглого стола IT-World «Импортозамещение в облаках».

Можно ли обмануть «умную» систему?

По сути, любую систему можно обойти, но разработчики придумывают разные способы, чтобы предотвратить то или иное мошенничество. На данный момент разработаны и внедрены различные антифрод-механизмы. Во избежание попытки обмана системы распознавания лиц чьей-то фотографией может производиться одновременная съемка несколькими камерами с разных ракурсов. Существуют технологии распознавания микромимики человека по ключевым точкам на лице, которые нельзя повторить даже на объемной маске. Большую роль здесь играют качество картинки и доступность вычислительных ресурсов для анализа. В целом справедлив принцип: если человек может справиться с задачей, то и машина сможет.

Опубликовано 18.08.2020

Похожие статьи