Распределенная система распознавания лиц на основе геометрических характеристик
Колесник А. В., Ладыженский Ю. В.
Донецкий национальный технический университет
Кафедра прикладной математики и информатики
Аннотация
Колесник А.В., Ладыженский Ю.В. Распределенная система выделения геометрических характеристик лиц для распознавания. Рассматривается технология автоматического распознавания лиц в реальном времени путем выделения антропометрических точек лица с использованием геометрического подхода, реализуется в распределенной интернет-системе.
Общая постановка проблемы. Современный уровень развития компьютерной техники и интернета обуславливает возникновение широкого круга задач, связанных с биометрической идентификацией человека, на основе изображения лица, радужной оболочки глаза, отпечатков пальцев, голоса, формы ушей и носа. Идентификация человека по лицу может использоваться в информационной безопасности для разграничения доступа, банковской сфере, социальных сетях, криминалистике, компьютерных играх, практически в любой системе, где необходима аутентификация.
Постановка задач исследования. Существующие алгоритмы распознавания плохо справляются с задачами распознавания слабоконтрастных изображений, не способны решать задачи распознавания в реальном времени и не могут гарантировать успешного распознавания, что препятствует их распространению. В данной работе рассматриваются методы создания распределенной системы распознавания лиц, способной решать поставленные задачи в реальном времени с использованием алгоритмов, которые обеспечивают качественное распознавание лиц людей.
Решение задачи и результаты исследований. Применение распределенной системы для решения поставленной задачи позволяет не только получить прирост в производительности, но и делает систему распознавания более «прозрачной» [1]. Подробная архитектура разработанной распределенной системы распознавания лиц представлена на рис. 1.
Рисунок 1 – Архитектура системы распознавания изображений
Пользователь инициирует начало работы системы отправкой изображений на почтовый сервер, после чего это изображение попадает на сервер распознавания, который осуществляет распределение среди клиентов распознавания. Клиенты распознавания выделяют геометрические характеристики лиц и при помощи их выполняют сопоставление с базой изображений, после чего полученный результат передается на сервер распознавания, который осуществляет посредством почтового сервера передачу результата пользователю [2].
Как показывает практика криминалистики [3], необходимо выделить около 30 особых точек на изображении лица человека, которые будут максимально устойчивыми к небольшим изменениям (ракурса, освещенности, мимики, косметики, возрастным изменениям). Группы точек имеют следующий приоритет: глаза, брови, нос, рот, на их основе возможно выделение множества разных параметров для идентификации. В качестве параметров для распознавания используются расстояния, измеряемые вдоль горизонталей и вертикалей, так как они требуют меньше вычислительных затрат на их получение и обработку, имеют высокую точность измерения.
Наиболее часто используемые точки при построении автоматических систем идентификации человека показаны на рис. 2.
Рисунок 2 – Точки, применяемые в системах автоматической идентификации
Для оптимального решения задачи распознавания лиц проведен анализ существующих алгоритмов. После чего была выбрана схема распознавания лиц, которую разработал Самаль Д. И. [4]:
- - поиск области лица на изображении;
- - обнаружение центров зрачков на портрете;
- - поворот изображения (если требуется) – центры зрачков должны находиться на горизонтальной прямой;
- - масштабирование (нормализация всех портретов по определённому расстоянию между зрачками);
- - кадрирование (вырезание прямоугольной области с заданными размерами из полученного в результате предыдущих шагов изображения);
- - выравнивание яркостных характеристик изображения, т.е. применение различных фильтров, изменяющих контраст, интенсивность и т.д., в зависимости от исходных значений параметров;
- - выравнивание яркостных характеристик изображения, т.е. применение различных фильтров, изменяющих контраст, интенсивность и т.д., в зависимости от исходных значений параметров;
- - выделение информации, требуемой для дальнейшего процесса распознавания, например, использование детектора края (оператор Собеля, Дериша – Deriche) либо подчёркивание некоторых черт лица («High Boosting»).
В ходе поиска области лица на изображении первоначально используется алгоритм Viola-Jones, который реализован в библиотеке компьютерного зрения OpenCV, пример работы алгоритма показан на рис. 3А.
Рисунок 3 – Главное окно демоверсии программы распознавания лиц
Детектор на основе алгоритма Viola-Jones является одним из лучших по соотношению показателей эффективность распознавания/скорость работы. Также этот детектор обладает крайне низкой вероятностью ложного обнаружения лица. Алгоритм Viola-Jones достаточно устойчив (около 20 градусов) к поворотам изображения. При угле наклона свыше 20 градусов процент обнаружений резко падает. Однако при небольших углах наклона до 10 градусов, алгоритм продолжает надежно определять лицо человека. В отличие от истинных лиц, случайные, ложные обнаружения других объектов не обладают такой устойчивостью. Данный метод основан на усилении простых классификаторов. Усиление простых классификаторов – подход к решению задачи классификации (распознавания), путём комбинирования примитивных «слабых» классификаторов в один «сильный». Под «силой» классификатора в данном случае подразумевается эффективность (качество) решения задачи классификации [5].
Для обнаружения центров зрачков на найденной области лица используется оператор Собеля, инверсия и метод Отсу [6]. Оператор Собеля представляет собой свёртку исходного изображения [7] с двумя масками размером 3×3 по отдельности и суммирование результатов. Выделенные контуры и найденные центры зрачков, отмеченные крестиками, показаны на рис. 3B.
Поворот, масштабирования, кадрирование и выравнивание яркостных характеристик изображения обеспечивают функции библиотеки OpenCV.
В качестве детектора краев, кроме перечисленных ранее, возможно использовать популярный и эффективный детектор краев Кэнни [8], который хорошо зарекомендовал себя. Оператор Кэнни сначала выполняет сглаживание полутонового изображения, а затем формирует протяженные контурные сегменты, прослеживая соседние пиксели с большими значениями модуля градиента. Результаты его работы показаны на рис. 3С.
Выводы. Распознавание лиц на основе геометрических характеристик нуждается в надёжном механизме нахождения ключевых точек для общего случая, который обеспечивается предложенным алгоритмом. Представленная система реализует важные для практики функции: распознавание выполняется в реальном времени за счет использования распределенной технологии распознавания лиц, система способна работать автоматически, получая на вход изображение из почтового сервера и отправляя результат своей работы через почтовый сервер.
Список литературы
[1] Фаулер М. Архитектура корпоративных программных приложений.: Пер. с англ. – М.: Издательский дом «Вильямс», 2008. – 544 с. : ил. – Парал. тит. англ.
[2] Колесник А.В., Ладыженский Ю.В. Распределенная интернет-система автоматического распознавания изображений в реальном времени / А.В. Колесник, Ю.В. Ладыженский // Інформатика та ком'ютерні технології / Матеріали V міжнародної науково-технічної конференції студентів, аспірантів та молодих науковців – 24-26 листопада 2009 р., Донецьк, ДонНТУ. – 2009, с. 206-208.
[3] Зинин A.М., Кирсанова Л.З. Криминалистическая фотопортретная экспертиза. – М.: МВД СССР ВНКЦ, 1991. – 88с.
[4] Самаль Д.И. Алгоритмы идентификации человека по фотопортрету на основе геометрических преобразований. Автореферат на соискание ученой степени кандидата технических наук. – Минск, – 2002.
[5] Ole Helvig Jensen. Implementing the Viola-Jones Face Detection Algorithm. – Kongens Lyngby 2008.
[6] Klette R., Zamperoni P. Handbook of image processing operators // John Wiley & Sons. – Chichester. – 1996.
[7] Форсайт Д., Поинс Ж. Компьютерное зрение. Современный подход. : Пер. с англ. – М.: Издательский дом «Вильямс», 2004. – 928 с. : ил. – Парал. тит. англ.
[8] Шапиро Л., Стокман Дж. Компьютерное зрение; Пер. с англ. – М.: БИНОМ. Лаборатория знаний, 2009. – 752с., 8с. ил.