Колесник Андрій Вікторович
Факультет: комп'ютерних наук і технологій
Спеціальність: програмне забезпечення автоматизованих систем
Кафедра: прикладної математики та інформатики
Тема випускної роботи:
Розподілена програмна система для розпізнання зображень
Науковий керівник: доцент, к.т.н. Ладиженський Ю.В.
Автореферат на тему випускної роботи
«Розподілена програмна система для розпізнавання зображень»
Введення
Розпізнавання зображень з розвитком комп'ютерних технологій стало важливою проблемою для людини. На основі розпізнавання зображень побудовано багато системи автоматичної ідентифікації.
Існує багато задач, пов'язаних з біометричної ідентифікації людини, на основі зображення особи, райдужної оболонки ока, відбитків пальців, голосу, форми вух та носа.
Мета та завдання дослідження
Метою магістерської роботи є розробка розподіленої системи для автоматичного розпізнавання зображень в реальному часі. Для досягнення поставленої мети необхідно вирішити такі завдання:
- аналіз технологій розпізнавання з використанням розподілених обчислень;
- розробка алгоритмів для розподілених систем розпізнавання зображень;
- розробка розподіленої програмної системи для розпізнавання зображень;
- експериментальні дослідження розподіленої програмної системи розпізнавання зображень.
Актуальність теми роботи
Для розпізнання зображень використовується функція, яка виконує розпізнавання людських облич. Ідентифікація людини по обличчю може використовуватися в інформаційній безпеці для розмежування доступу, банківській сфері, соціальних мережах, криміналістиці, комп'ютерних іграх, практично в будь-якій системі, де необхідна аутентифікація.
Передбачувана наукова новизна
Застосування розподіленої технології для розпізнавання зображень.
Розробка алгоритмів розпізнавання осіб на основі антропометричних характеристик облич, здатних працювати в реальному часі на слабоконтрастних зображеннях.
Архітектура системи розпізнавання осіб
Для забезпечення широкого використання, доступності, стабільності для системи розпізнавання була розроблена архітектура (рис. 1).
Рис.1 – Архітектура системи розпізнавання зображень (анімація: об'єм – 27,8 КБ, кількість кадрів – 24, затримка до повторного відтворення 11,2 с., Кількість циклів повторення – 10, розмір – 600x287)
Система працює з зображеннями, джерелами яких можуть бути фото-і відеокамери, телефони, КПК, різні сканери. Зображення з цих пристроїв через Internet, по поштових протоколів SMTP, IMAP пересилаються на певний поштову скриньку [1]. Поштовий клієнт, який є частиною системи розпізнавання, завантажує зображення з поштового сервера і передає їх серверу розпізнавання, який здійснює розподіл серед клієнтів розпізнавання. (Рис. 2).
Рис. 2 – Схема розподілу в системі розпізнавання зображень
Клієнти розпізнавання виділяють геометричні характеристики облич і за допомогою їх виконують зіставлення з базою зображень, після чого отриманий результат передається на сервер розпізнавання, який здійснює за допомогою поштового сервера передачу результату користувачеві [2].
Антропометричні точки в системах атоматичної ідентифікації
Практика криміналістики показує, що необхідно виділити близько 30 особливих точок на зображенні обличчя людини [3,4], які будуть максимально стійкими до невеликих змін (ракурсу, освітлення, міміки, косметики, віковим змінам). Групи точок мають такий пріоритет: очі, брови, ніс, рот, на їх основі можливе виділення безлічі різних параметрів для ідентифікації. Як параметри для розпізнавання використовуються відстані, вимірювані уздовж горизонталей і вертикалей, так як вони потребують менше обчислювальних витрат на їх отримання і обробку, мають високу точність вимірювання. Найбільш часто використовувані антропометричні точки особи при побудові автоматичних систем ідентифікації людини показані на рис. 3.
Рис. 3 – Точки, що застосовуються в системах автоматичної ідентифікації
Розроблений алгоритм розпізнавання облич
Для оптимального рішення задачі розпізнавання осіб проведено аналіз існуючих алгоритмів. Після чого була обрана така схема розпізнавання облич [5]:
- пошук області обличчя на зображенні;
- виявлення центрів зіниць на портреті;
- поворот і масштабування (якщо потрібно) знайденої області обличчя;
- поліпшення контрастності зображення за допомогою різних фільтрів;
- виділення антропометричних точок з використанням детектора краю (оператор Собеля, Деріша - Deriche) або підкреслення деяких рис обличчя («High Boosting»).
Результати досліджень
В ході пошуку області обличчя на зображенні, спочатку використовується алгоритм Viola-jones, який реалізований в бібліотеці комп'ютерного зору OpenCV, приклад роботи алгоритму показаний на рис. 4А.
Рис. 4 – Програма пошуку осіб на зображенні
Детектор на основі алгоритму Viola-Jones є одним з кращих по співвідношенню показників ефективністi розпізнавання / швидкість роботи. Також цей детектор має вкрай низьку ймовірністю помилкового виявлення особи. Алгоритм Viola-Jones досить стійкий (близько 20 градусів) до поворотів зображення. При куті нахилу понад 20 градусів відсоток виявлення різко падає. Однак при невеликих кутах нахилу до 10 градусів, алгоритм продовжує надійно визначати обличчя людини. На відміну від справжніх облич, випадкові, помилкові виявлення інших об'єктів не володіють такою стабільністю. Даний метод заснований на посиленні простих класифікаторів [6]. Посилення простих класифікаторів - підхід до вирішення задачі класифікації (розпізнавання), шляхом комбінування примітивних «слабких» класифікаторів в один «сильний». Під «силою» класифікатора в даному випадку мається на увазі ефективність (якість) рішення задачі класифікації [7].
Для виявлення центрів зіниць на знайденій області обличчя використовується оператор Собеля і метод Отсу [8]. Оператор Собеля представляє собою згортку вихідного зображення [9] з двома масками розміром 3×3 по окремо і підсумовування результатів. Виділені контури і знайдені центри зіниць, відмічені хрестиками, показані на рис. 4B.
Поворот, масштабування, кадрування і вирівнювання яскравості характеристик зображення забезпечують функції бібліотеки OpenCV.
В якості детектора країв, крім перерахованих раніше, можливо використовувати популярний і ефективний детектор країв Кенні [10], який добре зарекомендував себе. Оператор Кенні спочатку виконує згладжування напівтонового зображення, а потім формує протяжні контурні сегменти, простежуючи сусідні пікселі з великими значеннями модуля градієнта. Результати його роботи показані на рис. 4С.
Висновок
Розпізнавання осіб на основі геометричних характеристик потребує надійний механізм знаходження ключових точок для загального випадку, який забезпечується запропонованим алгоритмом. Представлена система реалізує важливі для практики функції: розпізнавання виконується в реальному часі за рахунок використання розподіленої технології розпізнавання облич, система здатна працювати автоматично, отримуючи на вхід зображення з поштового сервера і відправляючи результат своєї роботи через поштовий сервер.
Список літератури
[1] Колесник А.В., Ладыженский Ю.В. Распределенная система распознавания лиц на основе геометрических характеристик / А.В. Колесник, Ю.В. Ладыженский // Інформаційні управляючі системи та комп’ютерний моніторинг (ІУС та КМ-2010) / Материіали I всеукраїнської науково-технічної конференції студентів, аспірантів та молодих вчених – 19-21 травня 2010р., Донецьк, ДонНТУ. – 2010. – с. 29-32.
[2] Колесник А.В., Ладыженский Ю.В. Распределенная интернет-система автоматического распознавания изображений в реальном времени / А.В. Колесник, Ю.В. Ладыженский // Інформатика та ком'ютерні технології / Матеріали V міжнародної науково-технічної конференції студентів, аспірантів та молодих науковців – 24-26 листопада 2009 р., Донецьк, ДонНТУ. – 2009, с. 206-208.
[3] Зинин A.М., Кирсанова Л.З. Криминалистическая фотопортретная экспертиза. – М.: МВД СССР ВНКЦ, 1991. – 88с.
[4] Эксперт-криминалист, портретная экспертиза [Электронный ресурс] / Интернет-ресурс. – Режим доступа: http://www.expert-kriminalist.ru/readers/portret_readingroom
[5] Самаль Д.И. Алгоритмы идентификации человека по фотопортрету на основе геометрических преобразований. Автореферат на соискание ученой степени кандидата технических наук. – Минск, – 2002.
[6] Вежневец А.П., Вежневец В.П. Boosting – Усиление простых классификаторов [Электронный ресурс] / А.П. Вежневец, В.П. Вежневец. – Режим доступа: http://cgm.computergraphics.ru/content/view/112
[7] Ole Helvig Jensen. Implementing the Viola-Jones Face Detection Algorithm. – Kongens Lyngby 2008.
[8] Klette R., Zamperoni P. Handbook of image processing operators // John Wiley & Sons. – Chichester. – 1996.
[9] Форсайт Д., Поинс Ж. Компьютерное зрение. Современный подход. : Пер. с англ. – М.: Издательский дом «Вильямс», 2004. – 928 с. : ил. – Парал. тит. англ.
[10] Шапиро Л., Стокман Дж. Компьютерное зрение; Пер. с англ. – М.: БИНОМ. Лаборатория знаний, 2009. – 752с., 8с. ил.
Важливо
При написанні даного автореферату магістерська робота ще не завершена. Остаточне завершення: грудень 2010. Повний текст роботи та матеріали по темі можуть бути отримані у автора або його керiвника пiсля зазначеної дати.