Назад в библиотеку

Информатика и проблема телекоммуникаций/ Материалы российской научно-технической конференции.

Новосибирск: СибГУТИ,2005. Том I, с. 130-132.

ПРИМЕНЕНИЕ СКРЫТЫХ МАРКОВСКИХ МОДЕЛЕЙ К ЗАДАЧЕ РАСПОЗНАВАНИЯ ЛИЦ

Гультяева Татьяна Александровна

Научный руководитель — д.т.н, профессор Попов Александр Александрович

НГТУ, г. Новосибирск

gtany@mail.ru

Информатика и проблема телекоммуникаций/ Материалы российской научно-технической конференции. Новосибирск: СибГУТИ, 2005. Том I, с. 130-132.

В настоящее время возрос интерес к различным методам идентификации лиц. Для решения этой задачи необходимо выполнить два этапа: обнаружить лицо на фотографии и распознать его. Мы остановимся на задаче распознавания при помощи скрытых марковских моделей (СММ).

Элементами СММ являются множество наблюдаемых символов (наблюдения в данном случае — это коэффициенты дискретного косинусного преобразования фотографии лица человека сканирующим окном некоторого размера), множество различных состояний, набор наблюдаемых символов, вектор начальных состояний, матрица переходных вероятностей, матрица вероятностей наблюдаемых символов.

Возможность применения СММ к задаче распознаванию лиц связано с тем, что:

  1. в имеющейся последовательности псевдослучайных переменных (фрагментов лица) мы можем полагать, что каждое наблюдение независимо от предыдущих;
  2. каждая случайная переменная дает измерение, распределение вероятностей которых зависит от состояния.

Задача распознавания делиться на две подзадачи: на этапе обучения СММ надо построить модель по набору различных изображений лица конкретного человека, хранящихся в базе данных; на этапе распознавания некоторое предложенное изображение следует отнести к одной из модели с какой-либо вероятностью.

Первоначально (см. [1]) мы работали с простейшей моделью (рис. 1.)

Рис. 1. Пример марковской цепи в случае одномерной СММ.

На базе данных ORL1 был достигнут средний процент распознавание около 90%, максимальный процент распознавания составил 95%. Нами были установлены некоторые соотношения параметров модели, которые приводят к увеличению процента распознавания (например, при 85% пересечения параметров сканирующего окна).

Далее модель усложнили (см. [1]) : был выбран некоторый компромиссный вариант между одномерной СММ и псевдо двумерной СММ. Для этого сканирующие окно уменьшили по ширине и продвигали по змеевидной траектории: слева на право и сверху вниз. Пример цепи, соответствующей такому характеру наблюдений, приведен на рис. 2.

Рис. 2. Пример марковской цепи в случае усложненной одномерной СММ.

На той же базе данных был достигнут средний процент распознавания в 85% и максимальный в 96.5%. Падение числа верно распознанных изображений (в среднем) связано, по всей вероятности с тем, что в результате работы алгоритма определение оптимальной последовательности состояний происходило только в горизонтальном направлении, а в вертикальном направлении последовательности состояний инициировалась только на первоначальном шаге. Этот недостаток связан с одномерностью СММ.

Поэтому мы попытались совместить первую и второю модели: работая сначала с первой моделью, мы получаем оптимальное разбиение по вертикали для каждого изображения; далее работаем со второй моделью. Первый метод при определенных параметрах модели дал 71% верно распознанных фотографий2, второй — 69%, в последнем же методе процент распознавания достиг 80%.

Так как последовательность наблюдений известна, а последовательность состояний скрыта, то одним из основных шагов алгоритма распознавания является сегментация изображения. На рис. 3 представлены разбиения на состояния одного и того же изображения и последующие наложение результата на изображение для каждого из рассмотренных методов.

Рис. 3. Сегментация изображений для различных моделей.

Хорошо заметно, что третьим методом сегментация проведена более корректно с точки зрения выделения характерных физиологических областей лица (выделены глаза, скулы, губы, переносица). Таким образом, последний метод является более тонким инструментом распознавания в сравнении с первыми двумя.

Однако на базе данных ORLне было обнаружено столь высокого улучшения: например, при одних и тех же параметрах первый метод дал 85% процентов верно распознанных изображений, второй — 92%, третий — только на 0.25% выше второго.

В дальнейшем планируется более детальное развитие гибридного метода, совмещающего в себе одномерную скрытую марковскую модель и модель со скользящим окном по змеевидной траектории.

Литература:

1. Гультяева Т. А. Распознавание лиц с использованием скрытых марковских моделей //Наука. Технологии. Инновации// Материалы всероссийской научной конференции молодых ученых. Новосибирск: Изд-во НГТУ,2004. — Т.1. — С.159-160.