Распознавание лиц в системах видеонаблюдения

Опубликовано: Скачать статью в формате pdf (необходимо зарегистрироваться или авторизоваться)

Наконец-то мы добрались до технологии распознавания лиц. Возможность автоматически идентифицировать человека по его лицу без каких-либо дополнительных операций по выяснению личности является весьма интересной темой не только для служб безопасности, но и для маркетологов, социологов, статистиков и вообще всех, чья работа связана с людьми и предполагает как выяснение личности, так и работу с обезличенными статистическими данными.

В первой части этой статьи мы бы хотели поделиться нашим опытом по тестированию ПО распознавания лиц, определить для себя и читателя, решение каких задач с помощью распознавания лиц возможно, а в каких случаях применение будет нецелесообразным или бесполезным. Во второй части затронем надёжность работы системы распознавания лиц и дадим полезные рекомендации проектировщикам и инсталляторам таких систем.

С результатами, которые мы получили во время тестирования модуля распознавания лиц, вы можете ознакомиться по ссылке, а также они стали основой нашего очередного видеоролика «Разрушители мифов видеонаблюдения» на канале YouTube:

На канале VIDEOМАХ регулярно публикуются обучающие видео, демонстрации работы технологий, записи мероприятий.
Подпишитесь, чтобы быть в курсе новых технологий видеонаблюдения.Подпишись на канал

Сразу скажем, что это не научное исследование. Эти данные получены эмпирическим путем в рамках близких к идеальным условиям. Результаты получились вполне убедительные. В рамках статьи мы периодически будем апеллировать к этим данным. Ещё одна оговорка: мы говорим о 2D распознавании. 3D распознавание можно считать специальной системой, и для широкого круга клиентов интереса не представляет.

А теперь давайте сосредоточимся на решаемых задачах.

Типовые задачи с распознаванием лиц

Как показывает практика, не бывает одинаковых объектов, и задачи возникают совершенно различные, но все же попробуем выделить типовые:

  • Организация контроля доступа с помощью распознавания лиц
  • Поиск человека в «чистой зоне»
  • Поиск человека в толпе
  • Поиск человека в толпе, которого нет в базе данных
  • Маркетинговые исследования

Давайте разберем каждую задачу относительно полученных в нашем исследовании данных и определим, выполнима она или нет.

Организация контроля доступа с помощью распознавания лиц

Организовать проход на территорию с помощью распознавания лиц - это наверно самая лояльная задача для подобной технологии. Человек сам заинтересован, чтобы система его узнала и впустила. Соответственно, он будет смотреть в камеру и снимет с себя очки, головной убор и т.п.

В идеальных условиях алгоритм распознавания лиц дает 99% вероятности правильного распознавания. Вероятность ошибки минимальная


Наши исследования показали, что вероятность распознавания в идеальных условиях близка к 100%. Распознавание лиц как дополнение к системе контроля и управления доступом можно считать вполне применимым.

Однако, стоит иметь в виду, что для проходной крупного предприятия с несколькими сотнями сотрудников и несколькими тысячами транзакций (распознаваний) в день нужно обязательно считать вероятность ошибки системы. Пример такого расчёта в конце статьи.

Возможность обмануть систему распознавания лиц с использованием распечатанного фото

Но все же указывать идентификацию по лицу, как единственный признак для принятия решения, впускать или нет, мы не рекомендуем. Как показали тесты, можно обмануть систему с помощью распечатанной фотографии! У нас же двухмерное распознавание.

Разумеется, оператор системы может увидеть и должным образом отреагировать на подобные случаи. Но смысл построения системы как раз и состоит в сокращении числа операторов. Поэтому распознавание лица должно сопровождаться дополнительными мерами по контролю доступа.

Рекомендация:

Одной из дополнительных мер может быть система верификации, где после прикладывания карты доступа система будет сравнивать посетителя с лицом владельца карты. В этом случае сличение будет 1:1, что значительно снижает вероятность ошибки.

Ошибки распознавания рассмотрены во второй части статьи.

Поиск человека в «чистой зоне»

Следующая задача – распознавание лица в «чистой зоне». Под чистой зоной подразумевается место, где единовременно человек в кадре находится один, где можно создать хорошие условия для работы алгоритма распознавания. Правильно расположить камеру, обеспечить хорошее освещение. Например, это может быть шлюз, турникет, проходная и т.п.

Распознавание лица и поиск злоумышленников в "чистой зоне"

Так как здесь есть возможность соблюсти все основные требования для корректной работы распознавания, остается только загрузить в базу данных качественную фотографию человека, которого мы ищем. О требованиях к качеству фотографии будет отображено ниже.

Если нам удастся получить хорошее изображение разыскиваемого, система становится вполне себе жизнеспособной. Усилить эффект мы можем, если оператор будет просить проходящего посмотреть в камеру.


Внимание

Одно НО! Как мы выяснили при тестировании, распознавание лиц имеет невысокую устойчивость к подлогу. То есть систему легко можно обмануть, наложив грим, надев парик и т.д. Разукрашенного фаната система вообще за человека не посчитала. В общем, система рабочая, если сам человек не захочет от нее скрыться.

Возможности маскировки лица для противодействия работе системы распознавания лиц

Поиск человека в толпе

Теперь давайте исследуем «поиск человека в толпе». Это наверно самое частое, чего хотел бы заказчик. Чтоб как в кино, на улице, с обзорной камеры, приблизить лицо и найти совпадение.

Как бы ни так!

Возможности для работы системы распознавания лиц в толпе

Для корректной работы алгоритма распознавания лиц необходимо соблюсти ряд жестких требований по установке камеры и расположению лица в кадре. Об этих требованиях мы в конце статьи рассмотрим. Человек же не всегда передвигается прямо, вертит головой, жестикулирует и прочее. Вероятность того, что в нужный момент времени, в нужном месте, лицо человека попадет в кадр в правильном ракурсе, сводится к минимуму. Если организовать какой-то коридор или проход в месте установки камеры, где человек будет вынужден проходить в нужном для камеры ракурсе, это улучшит ситуацию. Но тогда уже речь идет о «чистой зоне», а не о толпе.

Для корректной работы алгоритма также необходимо, чтобы лицо было равномерно освещено, но организовать правильный свет на улице в солнечную погоду, в свете фонарей или на открытом пространстве торгового центра с панорамным остеклением, скажем, не представляется реальным.

Это мы ещё опускаем тему маскировки и фото в базе данных, поскольку и без этого достаточно параметров, которые мешают корректной работе системы.

Следовательно, на сегодняшний день задача поиска человека в толпе с приемлемой вероятностью обнаружения и при этом с низким уровнем ложных срабатываний скорее невыполнима! Расчеты вероятностей предложены далее в статье.

Выявление незнакомцев

Дальше задача с обратной логикой. Когда, к примеру, на входе в зону ограниченного доступа камера в потоке людей должна выявить того, кто отсутствует в базе данных, и выдать тревогу. Другими словами, производить поиск чужих.

Таким образом, система, как минимум, должна правильно распознать всех остальных проходящих и найти соответствие в базе. А это, как мы только что обсудили, нерешаемая задача. Будет много ложных срабатываний. Например, готов ли заказчик к тому, что придётся каждого 10-го своего сотрудника останавливать для проверки?

Маркетинговые исследования

Всё чаще для решения задач в области маркетинга применяют данные, полученные с помощью систем распознавания лиц. Подсчет посетителей, тепловые карты и т.п. Распознавание лиц тоже нашло свое применение.

Распознавание лиц на службе у маркетинга

Одна из популярных бизнес-задач, а точнее маркетинговых, это получение данных о посетителях. Цель получения данных может меняться в зависимости от типа объекта. Чаще всего эту работу проводят в объектах с большой проходимостью. Например, магазины, рестораны, ночные клубы, кинотеатры и т.д. И безусловными главными заказчиками являются сетевые компании, где в управлении может быть не одна сотня объектов и данные по половозрастному составу посетителей позволяют корректировать маркетинговую политику, наполнение магазина соответствующими товарами для выявленной фокус группы и прочие все их продажные дела. Здесь мы говорим не о безопасности, а о маркетинге, а это всегда история об увеличении эффективности и в конечном итоге прибыльности бизнеса. И на это заказчики денег не жалеют.

Наши тесты показали, что этот функционал работает, и работает неплохо. Точность этой аналитики не велика, но это и не так важно, так как мы говорим не о безопасности, а о маркетинге, где важна общая статистика. Решение этой задачи вполне имеет право на жизнь.

Надежность работы системы распознавания лиц

А теперь давайте поговорим о том, о чем редко упоминают производители, продвигая свой продукт. Распознавание лиц - это биометрическая система, и как любая другая аналогичная система, основана на математической статистике, на вероятностях.

Ошибки первого и второго рода (FAR и FRR)

Данные об устойчивости своего алгоритма к ошибкам предоставляет каждый разработчик распознавания лиц. Однако сравнить алгоритмы разных разработчиков по этому параметру невозможно. Каждый производитель определяет FAR и FRR по своей некой эталонной базе изображений.

Система распознавания лиц никогда не выдаст вам информацию в виде - "он" или "не он". Система выдаст % схожести лица в кадре с изображением в базе данных. И далее вы в настройках устанавливаете порог, при котором принимается решение по соотнесению с "скорее он" или "все же не он". Если мы говорим о % схожести и о неком пороге, то логично предположить, что, меняя порог, мы меняем вероятности ошибки по пропуску злоумышленника или ошибки отказа тому человеку, доступ которому разрешен. Величина этих вероятностей является определяющей для принятия решения о внедрении системы. Такие ошибки называют - ошибки первого и второго рода. Рассмотрим этот вопрос подробно.

Ошибка первого рода - FAR (False Acceptance Rate). Это вероятность того, что мы разрешаем доступ злоумышленнику. Ещё одно название «ложная тревога» или другими словами - нашли в базе своего, а это на самом деле злоумышленник.

Ошибка второго рода - FRR (False Rejection Rate). Это вероятность того, что мы запрещаем доступ своему. Ещё одно название «пропуск цели» или другими словами - целью был свой, а система его не нашла в базе.

Это очень важные параметры системы распознавания лиц. К тому же они зависят друг от друга. Чем больше одна вероятность, тем меньше другая. Типовые значения вероятностей ошибок первого и второго рода и их взаимосвязь выглядит следующим образом:

FAR FRR
0.1% 3%
0.01% 7%
0.001% 10%

Эти данные в виде таблиц или графиков можно получить у производителя алгоритма распознавания. Но интересно, что сравнить системы двух разных производителей по этим параметрам невозможно, так как каждый рассчитывает их на основе своих баз эталонных изображений. В итоге у каждого получаются свои FAR и FRR.

А как же пользоваться этими данными? О чем они нам говорят? Тут лучше рассказать на примере.

Приведем два наиболее характерных варианта работы с базой лиц. Первый, когда в базе у нас сотрудники, и мы не хотим пропустить на объект злоумышленника. Второй, когда в базе у нас злоумышленники, и мы ищем их среди проходящих людей.

1. Вероятности ошибок для распознавания лиц на проходной

У нас режимный объект, вход на который осуществляется по распознаванию лиц. На объекте работает 300 человек. То есть в день минимум 300 распознаваний, а если лицо требуется и для выхода, то 600. Хотя наверняка распознаваний будет больше.

Вероятности ошибок для распознавания лиц на проходной

Здесь задача распознавания лиц – не пропустить на территорию злоумышленника. Берем в расчёт вероятность пропуска злоумышленника (FAR) - 0,01%.

100%/0,01%=10 000

Таким образом, получаем, что вероятность пропуска злоумышленника у нас одна на 10 000 попыток. Это хороший показатель для режимного объекта. Вряд ли объект будет в адекватном временном периоде столько раз атакован.

При этом вероятность того, что мы запрещаем доступ своему (FRR) – 7%.

100%/7%=14

Получаем, что система откажет каждому 14-му сотруднику. А как мы говорили, у нас 600 распознаваний в день.

600/14=43

Таким образом, 43-м сотрудникам в день потребуется доказывать, что они являются работниками предприятия, и их должны пропустить на объект. Предъявлять документы или как-то иначе подтверждать свою личность.

Допустимо ли это? - Решать заказчику. Но теперь у него есть информация об оценке этих вероятностей и количестве ложных срабатываний, и он может учесть это в регламенте работы проходной.

2. Вероятность успешного поиска злоумышленника в толпе

У нас ЖД вокзал с проходимостью 100 000 человек в день. У нас есть база преступников, которых нам нужно обнаружить. Предположим их всего лишь 100 человек.

Вероятность успешного поиска злоумышленника в толпе

Берем маленькую вероятность по пропуску цели (FRR) - 3%.

100%/3%=33

То есть каждый 33 преступник останется незамеченным, а если он пытается скрыть лицо, замаскироваться, отвернуться и т.п., показатель может ухудшаться до бесконечности.

А что у нас с ложными тревогами?

Вероятность ложной тревоги (FAR) при сравнении одного лица с одним злоумышленником (по таблице для FRR=3%) – 0,1%.

В базе у нас 100 человек, поэтому вероятность ошибки увеличивается в 100 раз, что составляет 10%.

100%/10%=10

Получаем, что система выдаст тревогу по каждому 10-му лицу, попавшему в кадр. А как мы говорили, у нас проходимость 100 000 человек в день.

100 000/10=10 000

Таким образом, каждый день охране придётся останавливать каждого 10-го или 10 000 невинных человек для проверки документов. А обрабатывать каждую ложную тревогу нужно обязательно, иначе вероятность пропуска цели возрастет. Кажется, что проверять такое количество людей на ЖД вокзале с довольно высокой вероятностью пропуска реального злоумышленника нецелесообразно.

Охраняемые объекты и задачи могут быть разными, поиск террориста или мелкого мошенника, режимные объекты или коммерческие. Поэтому, подходящую пару FAR и FRR для оценки нужно выбирать исходя из задачи распознавания лиц на объекте. Главное, что с помощью этих показателей мы можем предоставить заказчику ориентировочные цифры о работе алгоритма на его объекте. А дальше пусть он сам принимает решение, согласен ли он с предполагаемым процентом пропусков, и справится ли его служба охраны с обработкой такого количества неизбежных дополнительных проверок.

Напомним, что параметры FAR и FRR производитель определяет по своим выборкам при условии, что распознавание производилось в идеальных условиях. При соблюдении всех требований к качеству изображения, установке камеры, качеству фотографии в базе и т.д. Отступая от этих требований, процент ошибок будет возрастать! И какой он будет реальный понять практически невозможно.

Если после оценки качества работы системы и уровня ложных срабатываний на основе FAR и FRR заказчик посчитал эти уровни приемлемыми, нам необходимо обеспечить условия максимально близкие к идеальным. Давайте определим условия, при которых мы максимально приблизимся к корректной работе системы распознавания лиц.

Практические рекомендации для проектировщика

Залог корректной работы распознавания лиц – правильная фотография в базе данных и качественная картинка с камеры.

Требования и рекомендации, которые мы сейчас опишем, заведомо могут исключить возможность внедрения технологии на некоторых объектах, так как соблюдение их там будет невозможным. Более подробно мы разобрали эту часть статьи в нашем вебинаре.

Требование к изображению в базе данных

Чтобы с кем-то сравнивать попавшие в кадр лица, нам нужно эти лица занести в БД. Для этого необходимо идеальное изображение. Говоря идеальное, мы совсем не имеем в виду высокое разрешение. Достаточно всего 320х240. Большее разрешение никак на качество распознавания не влияет. Это мы проверяли!

Требования к изображению в базе данных системы распознавания лиц

Важным является равномерное освещение лица, нейтральный задний фон и расположение лица на фотографии в соответствии с определенными размерами. Требования к изображению изложены в стандарте ISO/IEC 19794-5:2013 или в ГОСТ Р ИСО/МЭК 19794-5-2013.

Далее переходим к получению правильной картинки с камеры.

Требования к установке камеры и ее характеристикам

Требования к установке камеры для системы распознавания лиц

Камера должна быть установлена с отклонением центральной оси наблюдения не более 15 градусов к плоскости лица как в горизонтальной, так и в вертикальной плоскостях. Условия по отклонению должны выполняться в каждой точке области распознавания, о чем мы говорили в мастер-классе на конференции PROIPvideo2017.

Критерий плотности пикселов является определяющим при проектировании системы распознавания лиц

Для распознавания лиц требуется плотность пикселов не менее 500 pix/м во всей предполагаемой зоне распознавания. Это требование в конечном итоге определяет разрешение и угол обзора камеры. О выборе разрешения камер на основе критерия плотности пикселов мы рассказывали в одном из наших видео.

Глубина резкости - важный параметр для работы системы распознавания лиц

Глубина резкости должна покрывать всю зону контроля. Как мы знаем, глубина резкости напрямую зависит от фокусного объектива и значения диафрагмы. То есть рекомендуется заранее просчитывать глубину резкости (особенно актуально для длиннофокусных объективов), выбирать камеру с возможностью управления диафрагмой. В идеале камера должна позволять задавать пределы открытия и закрытия диафрагмы объектива.

Значение времени накопления заряда (выдержка, shutter) для распознавания лиц

Для чёткости получаемого кадра рекомендация по значению времени накопления заряда (выдержки, shutter) – не более 1/100 секунды

Источник изображения для распознавания лиц играет ключевую роль

Камеру рекомендуем выбрать с высокой светочувствительностью (матрица от 1/3“ и больше), использовать светосильный объектив (от F1,4 и лучше)

Требования к освещению для распознавания лиц определяют возможность получения качественного изображения

В зоне контроля необходимо обеспечить хорошее и ровное освещение (150 и более люкс). Это, наверно, одно из самых сложно выполнимых требований. Тут нужен индивидуальный подход к каждому объекту. Например, контроль входной группы может быть затруднен засветкой камеры светом с улицы.

Нейтральный задний фон облегчит поиск лица и сократит ошибки алгоритма распознавания лиц

Так же как для фотографии в БД для камеры нужно обеспечить картинку с однородным нейтральным задним фоном. Вот тут совсем сложно, особенно при поиске лиц в толпе. Фоном друг для друга становятся другие лица, что совсем нельзя назвать однородным!

Технические требования к организации системы распознавания лиц можно свести в таблицу:

Параметр Требование
Плотность пикселей Не менее 500 пикс/м
Углы отклонения Не более 150 по вертикали и горизонтали
Диафрагма объектива Регулируемая, с возможностью ручного управления
Светосила объектива Не менее 1:1.4
т.е., например, объектив 1:1.2 имеет бОльшую светосилу, чем 1.4
Размер матрицы Не менее 1/3”
Выдержка Не более 1/100 с
т.е. с выдержкой, например, 1/25 с возможно появление смазывания движущихся объектов
Освещенность Не менее 150 лк, освещение лица должно быть равномерным
Требования к фото Размер - не менее 320x240, однотонный задний фон, расстояние между зрачками не менее 60 pix

Выполнение требований позволит приблизиться к значениям FAR и FRR, которые приведены в документации модуля распознавания лиц.

Заключение

Итак, система может работать эффективно, но только в идеальных условиях. Но даже тогда мы должны учитывать те вероятности ошибок, о которых ранее говорили.

Что в итоге: работает система распознавания или нет? Однозначно ответить нельзя. Распознавание лиц достаточно эффективно для некоторых описанных в статье задач, но только в идеальных условиях. Но и даже, создав правильные условия для работы алгоритма распознавания, мы должны учитывать вероятности ошибок и на основе этих данных оценить статистику отказов. Хуже всего, если для заказчика это станет сюрпризом, который ставит под сомнение возможность эксплуатации системы.

Многое определяет стоимость ошибки. Если из-за того, что система ошибется, ничего страшного не произойдет, то смело внедряйте с допущениями, о которых мы говорили в самом начале. Если ошибка стоит дорого (проникновение злоумышленника, террориста), а вероятность ее возникновения высока, то важно соблюсти рекомендации и досконально обсудить с заказчиком все возможные нюансы и проблемы. В таком деле помогает тестирование прямо на объекте.

Обратить внимание

Наша компания бесплатно осуществляет услуги консалтинга по проектированию, в том числе и по системе распознавания лиц, а также проводит аудит спецификаций проекта, который избавит вас от рисков совершить ошибку при выборе проектного решения. Прислать запрос можно на email: info@videomax.ru либо связаться с нами по бесплатному телефону 8 800 302-55-46.


Возврат к списку


Комментарии к статье:
Загрузка комментариев...
Рекомендуем прочитать

Мы собираем статистику о посещениях сайта, cookie, данные об IP-адресе и местоположении. Если Вы не хотите, чтобы эти данные обрабатывались нами, Вы должны покинуть сайт.