Структура системы идентификации человека по изображению лица

УДК 004.93

СТРУКТУРА системы идентификации человека

по изображению лица

Никитенко Е.В., канд. физ.-мат. наук,

Силиченко А.И., магистрант

Черниговский государственный технологический университет, г.Чернигов, Украина

Спроектирована структура системы идентификации человека по изображению лица, которая осуществляет распознавание лиц, выделение антропометрических точек и непосредственно идентификацию на основе отклика от различных алгоритмов, сочетание которых позволяет повысить достоверность результата идентификации.

Постановка проблемы

Задача идентификации человека по изображению лица является одной из сложнейших видов биометрической идентификации, так как чаще всего ее приходится выполнять при ограниченной информативности изображений и весьма распространенной недостаточной сопоставимости из-за разрыва во времени, разницы условий съемок и т.д. Это обстоятельство не дает возможности использовать весь арсенал приемов и методов данного вида биометрической идентификации.

Решение задачи идентификации считается наиболее сложным по следующим причинам:

а) система, как правило, никогда ранее не сталкивалась с изображением данного человека;

б) система сравнивает всегда отличающиеся изображения. Даже при создании оптимальных условий для сравнения (освещенность, ракурс, мимика) изображения всегда отличаются друг от друга, учет всех возможных различий в процессе предварительной настройки системы крайне затруднителен;

в) сравниваемые изображения, как правило, значительно различаются по времени их получения (возрастные, косметические и другие подобные изменения могут оказать значительное негативное влияние на качество идентификации).

Современные системы распознавания лиц обеспечивают высокий процент распознавания и могут использоваться совместно с системами контроля и управления доступом для увеличения уровня контроля доступа на объектах с повышенными требованиями к обеспечению безопасности, например, в банках или на режимных предприятиях.

Использование системы распознавания лиц актуально для торговых предприятий и развлекательных заведений. Магазины, супермаркеты, автозаправки, клубы, рестораны, кафе – всех их объединяет одно: желание извлечь максимальную прибыль, для чего необходимо повышать качество обслуживания клиентов и обезопасить посетителей. Для них важно ограничить доступ людям, которые по тем или иным причинам нежелательны в этом заведении и, наоборот, заранее узнав о прибытии постоянного клиента или VIP-персоны, на более высоком уровне обслужить его.

Анализ последних исследований и публикаций

Классические системы распознавания лиц основаны на методах, ориентированных на внешность в целом: PCA (Principal Component Analysis) [1], ICA (Independent Component Analysis) [2], а также LDA (Linear Discriminant Analysis) [3]. В работе [4] описывается применение SIFT-дескрипторов для распознавания лиц, но не предлагается решения проблемы идентификации человека. В работе [5] предлагается комбинация дескрипторов PCA и SIFT: PCA используется для распознавания глаз, носа и рта, а при помощи SIFT описываются области вокруг найденных элементов внешности. Наконец, в работе [6] предлагается рассчитывать расстояния между всеми парами дескрипторов обоих изображений и использовать в качестве меры близости наименьшее из них. В некоторых случаях используются только те дескрипторы, которые описывают положение глаз и рта, поскольку эти элементы внешности являются наиболее информативными.

Альтернативой методам, ориентированным на внешность в целом, являются методы локального описания внешности. Подобные методы в настоящее время подлежат активному исследованию в области распознавания лиц. В работе [7] описывается алгоритм ASM (Active Shape Models – Активные Модели Формы). Цель алгоритма – подстроить модель формы под форму объекта на изображении. ASM успешно используется для решения широкого спектра задач, в том числе определение формы органов на медицинских снимках, распознавание лиц и рукописных символов.

На сегодняшний день наиболее эффективным алгоритмом поиска лиц на изображении является алгоритм, предложенный П. Виолой и М. Джонсом [8]. Ими был предложен метод классификации объектов (не только лиц) на основании метода усиления слабых классификаторов. Усиление слабых классификаторов – это подход к решению задачи классификации путем комбинирования примитивных классификаторов в один более сильный. П. Виола и М. Джонс построили каскад слабых классификаторов, работающий по принципу последовательных приближений. Каскад состоит из нескольких ступеней, каждая ступень – множество простых классификаторов. Если ступень принимает решение о том, что вектор признаков относится к классу искомого объекта, то принимается положительное решение, только если все ступени каскада это подтвердили, иначе вектор признаков классифицируется как неискомый объект. По показателям работы в реальных системах данный подход обеспечивает высокую точность, высокий уровень верных обнаружений и низкий уровень ошибок второго рода[9].

Цель статьи

Целью данной статьи является создание структуры системы идентификации человека, которая выполняла бы поставленную задачу идентификации на основе отклика от различных алгоритмов. Установление соответствия неизвестного человека одному из зарегистрированных в системе должно выполняться на основании взаимного расположения антропометрических точек лица.

Обобщенная схема биометрической идентификации

Одна из обобщенных реализаций схемы биометрической идентификации приведена на рисунке 1. Как видно из рисунка 1, существует две фазы функционирования биометрической системы: регистрация и идентификация. В подобных системах наиболее часто выполняется процесс идентификации. Следует отметить, что в процессе функционирования система может быть переключена в фазу регистрации для добавления новых пользователей.

Процедура сравнения признаков осуществляет сравнение полученных признаков и признаков, имеющихся в базе данных. Как правило, в подобных системах решается задача поиска изображения наиболее похожего на данное в большой базе изображений. Такое направление характеризуется высокими требованиями к ошибкам первого рода – система должна найти все изображения, соответствующие данному, не пропустив, по возможности, ни одного из достаточно схожих. При этом считается допустимым, если в выборке присутствует более одного изображения, определенного как схожее с данным.

Рис. 1. Обобщенная схема функционирования биометрических методов

Принцип минимизации временного промежутка обработки изображения реализуется путем хранения в базе данных небольших наборов заранее извлеченных ключевых признаков, максимально характеризующих каждое изображение.

Биометрические системы, как правило, функционируют в режиме свободного поиска в многолюдных общественных местах (улицы, транспортные пассажирские узлы, общественные здания). Главными целями подобных систем являются оперативное распознавание лиц, находящихся в розыске, и фиксация в режиме реального времени перемещений лиц, представляющих потенциальную опасность для общества или отобранных по каким-либо другим критериям.

В подобных системах обычно имеется возможность хранения в базе данных более одного изображения каждого конкретного физического лица, полученного при изменяющихся условиях (освещенность, ракурс, мимика, прическа, наличие очков и головного убора и т.д.).

Разработка системы идентификации по изображению лица

Структура разрабатываемой системы должна состоять из модулей (рисунок 2). Модульность системы позволит без особых трудностей заменять реализацию того или иного алгоритма или вовсе заменить реализацию одного алгоритма совершенно иным без внесения существенных изменений в структуру системы в целом. Такая особенность системы идентификации человека по изображению лица просто необходима, поскольку все системы, выполняющие распознавание лиц, часто применяются в различных условиях и для получения наилучшего результата, в поставленных условиях, может потребоваться заменить какой либо компонент системы более подходящим.

Подсистема распознавания лиц (Image sender) предназначена для захвата видеоизображения с видеокамеры, поиска всех лиц, отобразившихся на текущем кадре при помощи алгоритма Виолы-Джонса, и отправки подсистеме идентификации фрагментов кадра, соответствующих найденным лицам. Взаимодействие с подсистемой идентификации должно производиться посредством обмена сетевыми пакетами. В первую очередь должно установиться соединение. Когда соединение установлено, подсистема распознавания должна отправить в первом пакете информацию об изображении (размер, тип: кадр, лицо), а во втором – само изображение.

Рис. 2. Диаграмма компонентов системы

Подсистема идентификации (Portrait identification) играет роль связующего звена между всеми компонентами и содержит в себе ядро всей системы. Для взаимодействия с подсистемой распознавания в подсистеме идентификации должен присутствовать модуль взаимодействия с подсистемой распознавания (Image receiver), который отвечает за получение изображений и передачу их на дальнейшую обработку. После установления связи image receiver обрабатывает поступающую от подсистемы распознавания информацию: целое изображение или найденное лицо. В зависимости от типа, изображение либо сразу передается в подсистему обработки результатов идентификации, если это целый кадр, либо в модуль нормализации, если это изображение лица.

Следующим этапом разработки системы является модуль нормализации изображения лица (Normalizer). В большинстве случаев изображение для упрощения обработки, если оно цветное, конвертируется в оттенки серого. Также данный модуль должен выполнять нормализацию яркости и контрастности изображения, подбор наиболее подходящего динамического диапазона для более точного выделения ключевых точек. Нормализованное изображение лица передается подсистеме выделения антропометрических точек.

В подсистеме выделения антропометрических точек (Points finder adapter) предлагается использовать алгоритм ASM, реализованный во внешней библиотеке (Points finder). В алгоритме ASM используются активные формы модели – это статистические модели, которые итеративно деформируются, чтобы соответствовать объекту на изображении, и состоят из модели формы, управляемой набором ключевых точек, и моделей областей распределения вокруг каждой точки. Модель формы и модели распределения обучаются на тестовых изображениях с отмеченными позициями ключевых точек. В алгоритме применяется "грубо-точный" поиск, для этого необходимо обучить множество моделей распределения каждой ключевой точки, по одной модели на каждом уровне разрешения изображения. Поиск начинается с изображения в наиболее грубом (низком) разрешении, далее, в процессе поиска, разрешение изображения повышается до тех пор, пока могут быть улучшены позиции ключевых точек. В результате работы алгоритма ASM будет сформировано множество точек, соответствующих точкам формы лица и его основных элементов, отобразившихся на снимке.

Массив выделенных антропометрических точек передается модулю формирования признаков (Feature extractor). В качестве идентификационных признаков должны выделяться относительно неизменяемые за идентификационный период характеристики элементов внешности. Введение признаков в виде отношений определенных параметров лица делает их инвариантными к масштабу изображения и расстоянию, с которого делается фотография человека. Использование абсолютных значений размеров лица и его участков недопустимо, поскольку размеры всех объектов на изображении зависят от расстояния до объектива камеры, значение которого, в общем случае, определить невозможно.

При вычислении количественных признаков внешности следует соблюдать ряд требований. Пропорции размеров должны составляться из измерений линий, одинаково и примерно в одной плоскости расположенных по отношению к съемочной камере. Вследствие невозможности точного определения искажений, возникших в результате произвольного ракурса лица на изображении, расстояние между антропометрическими точками, для каждого отдельного признака, измеряется только по горизонтали или по вертикали.

На этапе установления личности по признакам внешности модуль идентификации (Identifier) выполняет серию запросов к БД для получения множества биометрических портретов зарегистрированных пользователей (рисунок 3). Поскольку условия получения изображения каждый раз несколько отличаются, а внешность человека также не вполне постоянна, то следует учитывать тот факт, что всегда будет присутствовать некоторая погрешность в позициях выделенных антропометрических точек и соответственно в значениях признаков. Для того, чтобы учесть указанную погрешность, следует в поисковый запрос включить значения отклонений от значений идентификационных признаков, и при каждом запросе увеличивать отклонения, если количество найденных пользователей менее заданного.

Рис. 3. Диаграмма последовательности функционирования системы

Практически все алгоритмы идентификации основываются на сравнении той или иной меры близости или сходства между неизвестным и известным лицами. В качестве обратной меры близости может быть использовано евклидово расстояние в пространстве признаков. Если мера сходства между вектором признаков идентифицируемого человека и эталонного описания зарегистрированного пользователя превышает некоторое заранее заданное число P, то принимается решение о соответствии идентифицируемого человека зарегистрированному пользователю. Если мера близости не превышает число P, то принимается решение о том, что в базе данных системы не содержится биометрического портрета идентифицируемого человека. Очевидно, варьируя число P, появляется возможность регулировать “строгость” системы идентификации. В теории систем распознавания это число иногда называют порогом принятия решения.

Подсистема обработки результатов идентификации (Display) предназначена для выполнения предопределенных разработчиками действий, которые зависят от предметной области применения системы: разрешение доступа к вычислительным ресурсам или данным, открытие дверей в охраняемое помещение, запуск двигателя в автомобиле, оповещение службы охраны о появлении преступника или менеджера о VIP-клиенте.

Выводы

На базе обобщенной структуры системы идентификации предложена структура системы, в которую заложены модули, реализующие алгоритмы Виолы-Джонса и ASM. Для решения задачи поиска биометрических портретов был предложен метод с использованием обновляемых отклонений значений признаков, позволяющий регулировать количество результатов поиска.

Список литературных источников

1. Kirby M. and Sirovich L. Application of the Karhunen-Loeve procedure for the characterization of human faces // IEEE Trans. Pattern Analysis and Machine Intelligence. – 1990. – № 12. – P. 103-108.

2. Bartlett M.S., Movellan J.R. and Sejnowski J. Face recognition by independent component analysis // IEEE. Trans. Neural Networks. – 2002. – № 13. – P. 1450-1464.

3. Belhumeur P.N., Hespanha J.P., Kriegman D.J. Eigenfaces vs. Fisherfaces: Recognition using Class Specific Linear Projection // Proc. of the 4th European Conference on Computer Vision. – Cambridge, UK. – 1996. – P. 45-58.

4. Lowe D.G. Distinctive image features from scale-invariant keypoints // International Journal of Computer Vision. – 2004. – № 60. – P. 91-110.

5. Sivic J., Everingham M. and Zisserman A. Person spotting: Video shot retrieval for face sets // Lecture Notes in Computer Science. – 2005. – P. 226-236.

6. Bicego M., Lagorio A., Grosso E. and Tistarelli M. On the use of SIFT features for face authentication // Proceedings of Conf. on Computer Vision and Pattern Recognition Workshop. – New York, NY, USA. – 2006. – 35 p.

7. Cootes T.F. and Taylor C.J. Statistical Models of Appearance for Computer Vision. – University of Manchester. – 2004. – 124 p.

8. Viola P., Jones M.J. Robust Real-Time Face Detection // International Journal of Computer Vision. – 2004. – Vol. 57, №. 2. – P. 137-154.

9. Вежневец А.П. Методы классификации с обучением по прецедентам в задаче распознавания объектов на изображениях // Труды конференции Graphicon-2006. – 2006. – С. 166-173.