ДонНТУ
РУС УКР ENG

Колесник Андрей Викторович

Факультет: компьютерных наук и технологий

Специальность: программное обеспечение автоматизированных систем

Кафедра: прикладной математики и информатики

Тема выпускной работы:

Распределенная программная система для распознавания изображений

Научный руководитель: доцент, к.т.н. Ладыженский Ю.В.

Автореферат по теме выпускной работы
«Распределенная программная система для распознавания изображений»

Введение

Распознавание изображений с развитием компьютерных технологий стало важной проблемой для человека. На основе распознавания изображений построены многие системы автоматической идентификации.

Существует широкий круг задач, связанных с биометрической идентификацией человека, на основе изображения лица, радужной оболочки глаза, отпечатков пальцев, голоса, формы ушей и носа.

Цели и задачи исследования

Целью магистерской работы является разработка распределенной системы для автоматического распознавания изображений в реальном времени. Для достижения поставленной цели необходимо решить такие задачи:

- анализ технологий распознавания с использованием распределенных вычислений;

- разработка алгоритмов для распределенных систем распознавания изображений;

- разработка распределенной программной системы для распознавания изображений;

- экспериментальные исследования распределенной программной системы распознавания изображений.

Актуальность темы работы

В качестве функции распознавания изображений используется распознавание человеческих лиц. Идентификация человека по лицу может использоваться в информационной безопасности для разграничения доступа, банковской сфере, социальных сетях, криминалистике, компьютерных играх, практически в любой системе, где необходима аутентификация.

Предполагаемая научная новизна

Применение распределенной технологии для распознавания изображений.

Разработка алгоритмов распознавания лиц на основе антропометрических характеристик лиц, способных работать в реальном времени на слабоконтрастных изображениях.

Архитектура системы распознавания лиц

Для обеспечения широкого использования, доступности, стабильности для системы распознавания была разработана архитектура (рис. 1).

Архитектура системы распознавания изображений

Рис.1 – Архитектура системы распознавания изображений (анимация: объем – 27,7 КБ, количество кадров – 24, задержка до повторного воспроизведения 11,2 с., количество циклов повторения – 10, размер – 600x287)

Система работает с изображениями, источниками которых могут быть фото- и видеокамеры, телефоны, КПК, различные сканеры. Изображения с этих устройств через Internet, по почтовых протоколам SMTP, IMAP пересылаются на определенный почтовый ящик [1]. Почтовый клиент, который является частью системы распознавания, загружает изображения из почтового сервера и передает их серверу распознавания, который осуществляет распределение среди клиентов распознавания. (рис. 2).

Архитектура системы распознавания изображений

Рис. 2 – Схема распределения в системе распознавания изображений

Клиенты распознавания выделяют геометрические характеристики лиц и при помощи их выполняют сопоставление с базой изображений, после чего полученный результат передается на сервер распознавания, который осуществляет посредством почтового сервера передачу результата пользователю [2].

Антропометрические точки в системах атоматической идентификации

Практика криминалистики показывает, что необходимо выделить около 30 особых точек на изображении лица человека [3,4], которые будут максимально устойчивыми к небольшим изменениям (ракурса, освещенности, мимики, косметики, возрастным изменениям). Группы точек имеют следующий приоритет: глаза, брови, нос, рот, на их основе возможно выделение множества разных параметров для идентификации. В качестве параметров для распознавания используются расстояния, измеряемые вдоль горизонталей и вертикалей, так как они требуют меньше вычислительных затрат на их получение и обработку, имеют высокую точность измерения. Наиболее часто используемые антропометрические точки лица при построении автоматических систем идентификации человека показаны на рис. 3.

Точки, применяемые в системах автоматической идентификации

Рис. 3 – Точки, применяемые в системах автоматической идентификации

Разработанный алгоритм распознавания лиц

Для оптимального решения задачи распознавания лиц проведен анализ существующих алгоритмов. После чего была выбрана такая схема распознавания лиц [5]:

- поиск области лица на изображении;

- обнаружение центров зрачков на портрете;

- поворот и масштабирование (если требуется) найденной области лица;

- улучшение контрастности изображения при помощи различных фильтов;

- выделение антропометрических точек с использованием детектора края (оператор Собеля, Дериша – Deriche) либо подчёркивание некоторых черт лица («High Boosting»).

Результаты исследований

В ходе поиска области лица на изображении первоначально используется алгоритм Viola-Jones, который реализован в библиотеке компьютерного зрения OpenCV, пример работы алгоритма показан на рис. 4А.

Программа поиска лиц на изображении

Рис. 4 – Программа поиска лиц на изображении

Детектор на основе алгоритма Viola-Jones является одним из лучших по соотношению показателей эффективность распознавания/скорость работы. Также этот детектор обладает крайне низкой вероятностью ложного обнаружения лица. Алгоритм Viola-Jones достаточно устойчив (около 20 градусов) к поворотам изображения. При угле наклона свыше 20 градусов процент обнаружений резко падает. Однако при небольших углах наклона до 10 градусов, алгоритм продолжает надежно определять лицо человека. В отличие от истинных лиц, случайные, ложные обнаружения других объектов не обладают такой устойчивостью. Данный метод основан на усилении простых классификаторов [6]. Усиление простых классификаторов – подход к решению задачи классификации (распознавания), путём комбинирования примитивных «слабых» классификаторов в один «сильный». Под «силой» классификатора в данном случае подразумевается эффективность (качество) решения задачи классификации [7].

Для обнаружения центров зрачков на найденной области лица используется оператор Собеля и метод Отсу [8]. Оператор Собеля представляет собой свёртку исходного изображения [9] с двумя масками размером 3×3 по отдельности и суммирование результатов. Выделенные контуры и найденные центры зрачков, отмеченные крестиками, показаны на рис. 4B.

Поворот, масштабирования, кадрирование и выравнивание яркостных характеристик изображения обеспечивают функции библиотеки OpenCV.

В качестве детектора краев, кроме перечисленных ранее, возможно использовать популярный и эффективный детектор краев Кэнни [10], который хорошо зарекомендовал себя. Оператор Кэнни сначала выполняет сглаживание полутонового изображения, а затем формирует протяженные контурные сегменты, прослеживая соседние пиксели с большими значениями модуля градиента. Результаты его работы показаны на рис. 4С.

Заключение

Распознавание лиц на основе геометрических характеристик нуждается в надёжном механизме нахождения ключевых точек для общего случая, который обеспечивается предложенным алгоритмом. Представленная система реализует важные для практики функции: распознавание выполняется в реальном времени за счет использования распределенной технологии распознавания лиц, система способна работать автоматически, получая на вход изображение из почтового сервера и отправляя результат своей работы через почтовый сервер.

Список литературы

[1] Колесник А.В., Ладыженский Ю.В. Распределенная система распознавания лиц на основе геометрических характеристик / А.В. Колесник, Ю.В. Ладыженский // Інформаційні управляючі системи та комп’ютерний моніторинг (ІУС та КМ-2010) / Материіали I всеукраїнської науково-технічної конференції студентів, аспірантів та молодих вчених – 19-21 травня 2010р., Донецьк, ДонНТУ. – 2010. – с. 29-32.

[2] Колесник А.В., Ладыженский Ю.В. Распределенная интернет-система автоматического распознавания изображений в реальном времени / А.В. Колесник, Ю.В. Ладыженский // Інформатика та ком'ютерні технології / Матеріали V міжнародної науково-технічної конференції студентів, аспірантів та молодих науковців – 24-26 листопада 2009 р., Донецьк, ДонНТУ. – 2009, с. 206-208.

[3] Зинин A.М., Кирсанова Л.З. Криминалистическая фотопортретная экспертиза. – М.: МВД СССР ВНКЦ, 1991. – 88с.

[4] Эксперт-криминалист, портретная экспертиза [Электронный ресурс] / Интернет-ресурс. – Режим доступа: http://www.expert-kriminalist.ru/readers/portret_readingroom

[5] Самаль Д.И. Алгоритмы идентификации человека по фотопортрету на основе геометрических преобразований. Автореферат на соискание ученой степени кандидата технических наук. – Минск, – 2002.

[6] Вежневец А.П., Вежневец В.П. Boosting – Усиление простых классификаторов [Электронный ресурс] / А.П. Вежневец, В.П. Вежневец. – Режим доступа: http://cgm.computergraphics.ru/content/view/112

[7] Ole Helvig Jensen. Implementing the Viola-Jones Face Detection Algorithm. – Kongens Lyngby 2008.

[8] Klette R., Zamperoni P. Handbook of image processing operators // John Wiley & Sons. – Chichester. – 1996.

[9] Форсайт Д., Поинс Ж. Компьютерное зрение. Современный подход. : Пер. с англ. – М.: Издательский дом «Вильямс», 2004. – 928 с. : ил. – Парал. тит. англ.

[10] Шапиро Л., Стокман Дж. Компьютерное зрение; Пер. с англ. – М.: БИНОМ. Лаборатория знаний, 2009. – 752с., 8с. ил.

Важное замечание

При написании данного автореферата магистерская работа еще не завершена. Окончательное завершение: декабрь 2010. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.