Назад в библиотеку

ОСОБЕННОСТИ МЕТОДОВ РАСПОЗНАВАНИЯ С ПОМОЩЬЮ АНТРОПОМЕТРИИ

Автор: Р. В. Лычагин (5 курс, кафедра КИ), А. Я. Аноприенко, к. т. н, проф. каф. КИ, С. В. Иваница, ассистент каф. КИ
Источник:

Постановка проблемы. Большую часть информации человек получает благодаря зрению. Отсюда развитие технологий компьютерного зрения и распознавания объектов, является наиболее значимой для развития искусственного интеллекта (ИИ), которое также является одним из основных предназначений программирования.

Направление распознавания лиц же является частной ветвью в технологии распознавании объектов. Поэтому, развитие данного направления неизменно приведет к развитию всей технологии распознавания объектов.

Таким образом, целью работы является анализ и практическое использование методов распознавания лиц.

Несмотря на большое разнообразие алгоритмов распознавания лица, можно выделить общую структуру процесса [1] (рис. 1):

Общая структура распознавания лиц

Рисунок 1 – Общая структура распознавания лиц

На первом этапе производится обнаружение и нахождение лица на изображении (наиболее эффективным методом Виолы-Джонса [4]). На втором этапе производится выравнивание изображения в найденной области (геометрическое преобразование и нормализация яркости, применение фильтров). Вычисление и сравнение признаков же – кардинально варьируется между методами, и при этом все сводится к некоторому сравнение вычисленных признаков с, заложенными в базу данных, эталонами (метод гибкого сравнения на графах).

В методе Виолы-Джонсона для описания объектов, таких как лица, руки, или другие предметы используются каскады из признаков. Сам по себе каскад Хаара (рис. 2) — это набор примитивов, для которых считается их свёртка с изображением. Используются самые простые примитивы, состоящих из прямоугольников и имеющих всего два уровня, +1 и –1. При этом необходимо многократно использовать каждый прямоугольник как в разной размерности так и в различных трансформациях. Под свёрткой тут подразумевается s = X–Y, где Y — сумма элементов изображения в тёмной области, а X — сумма элементов изображения в светлой области.

Каскад (примитивы) Хаара

Рисунок 2 – Каскад (примитивы) Хаара

Такие свёртки подчёркивают структурную информацию объекта. Например, для центра лица человека будет всегда отрицательна свёртка, продемонстрированная на рис. 3.

Пример свертки

Рисунок 3 – Пример свертки [3]

В методе используется интегральное представление изображения, благодаря которому вычисления суммы пикселей прямоугольника по формуле (2) выполняется с константной скоростью, для любых размеров, а также для любой другой фигуры, которую можно аппроксимировать несколькими прямоугольниками.

Формула (2)

С помощью признаков Хаара по алгоритму выбираются примитивы, наилучшим образом характеризующие объект. На основе таких классификаторов с отобранными наиболее эффективными примитивами строится каскад. Каждый последующий элемент каскада имеет более жёсткие условия успешного прохождения, чем предыдущий (используется больше примитивов). Таким образом, только удовлетворившие всем проверкам объекты считаются распознанными.

Метод гибкого сравнения на графах [1, 2] сводится к эластичному сопоставлению графов, описывающих изображения лиц. Лица представлены в виде графов со взвешенными вершинами и ребрами. На этапе распознавания один из графов – эталонный – остается неизменным, в то время как другой деформируется с целью наилучшей подгонки к первому. В подобных системах распознавания графы могут представлять собой как прямоугольную решетку (рис 4.а), так и структуру, образованную характерными (антропометрическими) точками лица (рис 4.б).

Пример структуры графа для распознавания лиц

Рисунок 4 – Пример структуры графа для распознавания лиц (а – регулярная решетка, б – граф на основе антропометрических точек лица) [1]

В вершинах графа вычисляются значения признаков, чаще всего используют комплексные значения фильтров Габора (рис. 5) или их упорядоченных наборов, которые вычисляются в некоторой локальной области вершины графа локально путем свертки значений яркости пикселей с фильтрами Габора.

набор фильтров Габора

Рисунок 5 – набор фильтров Габора

Решение задач и результаты исследований. Для реализации поставленной задачи использовалось OpenCV (computer vision) – набор открытых библиотек компьютерного зрения, обработки изображений и численных алгоритмов общего назначения. Для обнаружения лица (метод Виолы-Джонсона) использовалась модуль objdetect, вместе с подгружаемым файлом описателем haarcascade_frontalface_default.xml обученной модели. Фильтр Габора реализована, как и другие фильтры в главном модуле opencv. Реализация поставленной задачи для среды Windows была выполнена на языке C++ в MS VS 2013.

Алгоритм разработанной программы с использованием вышеупомянутых методов состоит из следующих этапов:

  1. Инициализация веб-камеры;
  2. Нахождение лица на считаном кадре;
  3. Применение ряда фильтров Габора к полученному участку изображения;
  4. Нахождение центра масс в пересечении результатов;
  5. Выделение и вывод результатов анализа;

Результат работы алгоритма реализован и представлен на рис. 6.

Пример работы программы

Рисунок 6 – Пример работы программы

Выводы. Компьютерное зрение – развивающаяся отрасль программирования, но при этом востребована и имеет большой спектр применения. Функцию идентификации людей на фотографиях активно используют в программном обеспечении для управления фотоальбомами (Picasa, iPhoto и др.). Скомбинировав ее с реальными параметрами, можно составлять альбомы по отдельному человеку. Идентификация также находит свое применение в системах безопасности, например при распознавании сотрудников объекта (учреждения).

При разработке программного обеспечения данного проекта идентификация личности да конца не реализована, однако выполнены нахождение лица и распознавание части признаков с помощью всего двух параллельных вейвлет Габора. С увеличением ряда фильтров и калибровки их параметров, возможны нахождение большего числа признаков и отсечки шумов. На основе полученных точек также появится возможность построения графа для выполнения сравнительного анализа и идентификации личности.

Основными трудностями на данном этапе выполнения проекта является настройка параметров фильтра Габора и разработка алгоритмов построения и сравнения графов.

В дальнейшем планируется использование средств и методов постбинарного компьютинга [5] для повышения точности вычислений. Так, например, некоторые помехи можно обозначать как неопределенность, в следствие чего они будут не отбрасываются, а сохранятся как возможные особенности лица.

ЛИТЕРАТУРА:


1. Коломиец В. Анализ существующих подходов к распознаванию лиц // Блог компании Синезис [Электронный ресурс]. — Режим доступа: .
2. Wiskott L., Fellous JM., Kruger N., Malsburg C. In Intelligent Biometric Techniques in Fingerprint and Face Recognition, eds. L.C. Jain et al., publ. CRC Press, ISBN 0-8493-2055-0, Chapter 11, pp. 355-396, (1999).
3. Мальцев А. Использование каскада Хаара для сравнения изображений. [Электронный ресурс]. — Режим доступа: http://habrahabr.ru/post/198338 .
4. Viola-Jones object detection framework. Материал из Википедии — свободной энциклопедии [Электронный ресурс]. — Режим доступа: http://en.wikipedia.org/wiki/Viola%E2%80%93Jones_object_detection_framework.
5. Аноприенко А. Я. Тетралогика, тетравычисления и ноокомпьютинг. Исследования 2010–2012. / А. Я. Аноприенко, С. В. Иваница — Донецк: ДонНТУ, Технопарк ДонНТУ УНИТЕХ, 2012. — 308 с.