Русский   English
ДонНТУ   Портал магістрів

Реферат за темою випускної роботи

Зміст

Вступ

Інтерес до процесів ідентифікації і автентифікації особи в сучасному світі набирає дедалі більшу практичну потребу: від систем охорони і верифікації банківських карток до криміналістичної експертизи та ідентифікації злочинців за рецидив. Оскільки, одним з однозначно помітних критеріїв особи, є людське обличчя, то в аспекті ідентифікації (а пізніше, і автентифікації) особистості слід розуміти процедуру динамічного розпізнавання осіб.

Задача ефективного пошуку та ідентифікації людської особи, не являється для комп'ютерних систем тривіальною і цілком очевидною для розробників спеціалізованого програмного забезпечення. Робота зі слабо контрастними об'єктами (з точки зору сприйняття комп'ютерною системою людського обличчя, на відміну від природної ідентифікації особи людським оком) є найбільш значущою для розвитку штучного інтелекту (AI), що робить акцент на системах комп'ютерного (кібернетичного) зору, які крім процедур розпізнавання забезпечують кодування / декодування і зберігання цифрових зображень обличь. Такі системи можна розглядати як в світі класичної проблеми сприйняття, так і в світі нових підходів [1] до розпізнавання об'єктів.

1.1 Мотивація теми роботи

Велику частину інформації людина отримує завдяки зору. Звідси розвиток технологій комп'ютерного зору і розпізнавання об'єктів, є найбільш значущою для розвитку штучного інтелекту (AI), яке також є одним з основних призначень програмування.

Напрямок розпізнавання осіб ж є приватною гілкою в технології розпізнавання об'єктів. Тому, розвиток даного напряму незмінно призведе до розвитку всієї технології розпізнавання об'єктів.

1.2 Ціль, об'єкт і предмет дослідження

Метою магістерської роботи є створення системи, яка буде зчитувати і розпізнавати антропологічні ознаки особи, порівнювати їх з динамічної базою даних, щоб ідентифікувати особу.

Об'єкт дослідження: розробка системи ідентифікації особи.

Предмет дослідження: об'єднання методів розпізнавання осіб з методами постбінарного комп'ютингу для покращення точності ідентифікації особи.

1.3 Передбачувана наукова новизна

Збільшення швидкодії і точності методу розпізнавання обличь шляхом використання методів постбінарного комп'ютингу.

1.4 Плановані практичні результати

Для експериментальної оцінки отриманих теоретичних результатів буде розроблена Система динамічного розпізнавання антропологічних ознак особи і порівняння їх з динамічної базою даних з метою ідентифікації особи. Розробка даної системи буде включати в себе створення наступних елементів:

  1. Алгоритм пошуку обличчя на зображенні для подальшого зменшення області зображення, що аналізується;
  2. Алгоритм обчислення антропометричних ознак обличчя;
  3. Алгоритм порівняння цих ознак обличчя з наявними в базі даних;
  4. Базу даних з інформацією про людей і даними для їх ідентифікації;
  5. Структуру даних ознак обличчя для їх подальшого зберігання;
  6. Впровадження методів пост бінарного комп'ютингу

Також буде створена база даних із зображеннями обличь для перевірки якісних параметрів (точність, швидкість і тощо) Системи розпізнання.

2. Загальна структура розпізнавання осіб

Незважаючи на велику різноманітність алгоритмів розпізнавання осіб, можна виділити загальну структуру даного процесу [2], яка представлена на рис. 1.

Загальна структура розпізнавання обличчя

Рисунок 1 – Загальна структура розпізнавання обличчя

На першому етапі проводиться виявлення і локалізація особи на зображенні (найбільш ефективним є використання методу Віоли-Джонса). Стеження передбачає більш спрощені способи локалізації особи (так як обличчя до даного моменту однозначно виявлено) на наступних кадрах безперервного відео.

На другому етапі проводиться вирівнювання зображення в знайденої області (геометричне перетворення і перетворення яскравості, застосування фільтрів). Обчислення і порівняння ознак варіюється між методами, і при цьому все зводиться до певного порівнянні обчислених ознак з закладеними в базу даних еталонами. У даній роботі буде також розглянуто використання методу гнучкого порівняння на графах.

2.1 Метод Віоли-Джонса

У методі Віоли-Джонса використовується інтегральне представлення зображення - матриця, яка збігається за розмірами з початковою і в кожному її елементі зберігається сума всіх елементів, що знаходяться лівіше і вище даного [3].

Елементи представлені в матричному вигляді і розраховуються за формулою (1):

Формула 1 (1)

, де i(x', y') — яскравість пікселя вхідного зображення.

Таким чином, кожен елемент I (x, y) інтегрального зображення містить в собі суму інтенсивності пікселів в прямокутнику від (0, 0) до (x ', y').

Формування інтегрального зображення займає лінійний час, пропорційний числу пікселів вхідного зображення, і здійснюється за один прохід. Розрахунок інтегрального зображення I можна здійснювати по рекурентній формулі (2):

Формула 2 (2)

Найважливішим достоїнством інтегрального представлення зображення є можливість швидкого обчислення суми пікселів любого прямокутника (3), а також будь-якої іншої фігури, яку можна апроксимувати декількома прямокутниками.

Формула 3 (3)

Для опису потрібних об'єктів (обличчя, руки, або ін. предметів) використовуються каскади з ознаками. Сам по собі каскад Хаара - це набір примітивів (рис. 2), для яких розраховується їх згортка з зображенням. Використовуються найпростіші примітиви, що складаються з прямокутників і мають всього два рівні, +1 і -1. При цьому кожен прямокутник використовується кілька разів різного розміру. Під сверткой тут мається на увазі s = X - Y, де Y - сума елементів зображення у темній області, а X - сума елементів зображення у світлій області.

Набір примітивів для опису об'єктів

Рисунок 2 – Набір примітивів для опису об'єктів

Такі згортки призвані структурувати інформацію про об'єкт: наприклад, у роботі [6] показано що, для центру обличчя людини буде завжди негативна згортка, приклад отримання якої показаний на рис. 3.

Приклад отримання згортки для центру обличчя людини (а - вхідне зображення, б - накладення згортки на центр обличчя)

Рисунок 3 – Приклад отримання згортки для центру обличчя людини (а - вхідне зображення, б - накладення згортки на центр обличчя) [6]

2.2 Метод гнучкого порівняння на графах (Elastic graph matching)

Суть методу зводиться до еластичного порівнянні графів, що описують зображення обличчя [2, 5]. Обличчя представлені у вигляді графів зі зваженими вершинами і ребрами. На етапі розпізнавання один з графів - еталонний - залишається незмінним, в той час як інший деформується з метою найкращої підгонки до першого. У подібних системах розпізнавання графи можуть являти собою як прямокутну решітку, так і структуру, утворену характерними (антропометричними) точками особи (рис. 4). У вершинах графа обчислюються значення ознак, найчастіше використовують комплексні значення фільтрів Габора або їх упорядкованих наборів (рис. 5) - Габоровскіх вейвлет (строї Габора), які обчислюються в деякій локальній області вершини графа локальним шляхом згортки значень яскравості пікселів з фільтрами Габора (рис. 6).

Приклад структури графа для розпізнавання обличчя (а - регулярна решітка, б - граф на основі антропометричних точок обличчя)

Рисунок 4 – Приклад структури графа для розпізнавання обличчя (а - регулярна решітка, б - граф на основі антропометричних точок обличчя)

Ребра графа зважуються відстанями між суміжними вершинами. Різниця (відстань, дискримінаційна характеристика) між двома графами обчислюється за допомогою деякої цінової функції деформації, що враховує як різниця між значеннями ознак, обчисленими в вершинах, так і ступінь деформації ребр графа.

Набір (банк, jet) фільтрів Габора

Рисунок 5 – Набір (банк, jet) фільтрів Габора

Приклад згортки зображення особи з двома фільтрами Габора

Рисунок 6 – Приклад згортки зображення особи з двома фільтрами Габора

Деформація графа відбувається шляхом зсуву кожної з його вершин на деяку відстань в певних напрямках щодо її вхідного розташування і вибору такої її позиції, при якій різниця між значеннями ознак (відгуків фільтрів Габора) в вершині деформованого графа і відповідної їй вершині еталонного графа буде мінімальною. Дана операція виконується по черзі для всіх вершин графа до тих пір, поки не буде досягнуто найменше сумарне відмінність між ознаками деформованого і еталонного графів. Значення цінової функції деформації при такому положенні, що деформується графа і буде мірою відмінності між вхідним зображенням обличчя і еталонним графом. Дана релаксаційна процедура деформації повинна виконуватися для всіх еталонних осіб, закладених в базу даних системи. Результат розпізнавання системи - еталон з найкращим значенням цінової функції деформації (рис 7).

Приклад деформації графа у вигляді регулярної решітки

Рисунок 7 – Приклад деформації графа у вигляді регулярної решітки

В окремих публікаціях вказується 95-97% -а ефективність розпізнавання навіть при наявності різних емоцій і зміні ракурсу особи до 15 °. Однак розробники систем еластичного порівняння на графах посилаються на високу обчислювальну вартість даного підходу. Наприклад, для порівняння вхідного зображення особи з 87 еталонними витрачалося приблизно 25 секунд при роботі на паралельній ЕОМ з 23 транспьютерами [4]. В інших публікаціях з даної тематики час або не вказується, або говориться, що він великий.

До недоліків даного методу відноситься висока обчислювальна складність процедури розпізнавання, а також низька технологічність при запам'ятовуванні нових еталонів і лінійна залежність часу роботи від розміру бази комп'ютерного зображення особи.

2.3 Фільтр Габора

Фільтр Габора – лінійний електронний фільтр, імпульсна перехідна характеристика якого визначається у вигляді гармонійної функції, помноженої на Гауссіан[13].

Двомірний фільтр Габора має уявну і дійсну частину. Дійсна частина фільтра представлена формулою (4), в уявній частині косинус змінюється на синус. Графічно функція виглядає як гармонійна функція, обмежена гауссіаной.

Формула 4 (4)

, де x'=x cosθ+y sinθ; y'=-x sinθ+y cosθ; x, y – координати ядра в заздалегідь заданих межах; λ – період ядра в пікселях; θ – нахил ядра; σ – стандартне відхилення гауссовского ядра; ψ – зміщення фази ядра; γ - стиснення Гауссіана.

Як видно даний фільтр має параметр нахилу θ, що дозволяє задати кути шуканих країв. Стиснення γ, можна визначити, як похибка знаходять країв, заокруглення; ніж цей параметр менше, тим пряміше будуть знаходиться лінії. Цей параметр не слід завищувати, так як при цьому нахилу θ втрачає вплив. Таким чином, щоб виділити всі краї на обличчі (щодо круглому об'єкті), застосуємо фільтр Габора з різними кутами нахилу ядра і об'єднати результати деякою функцією (операцією).

В результаті фільтрації отримуємо матрицю з позитивними і негативними елементами. Для отримання підсумкової маски приймаємо, що всі негативні елементи рівні 0 (білі), а позитивні 1 (255, чорні).

3. Основні проблеми систем розпізнавання осіб

Основні проблеми [4, 7], пов'язані з розробкою систем розпізнавання обличчя представлені на рис. 8, 9.

Проблема нерівномірного освітленості обличчя

Рисунок 8 – Проблема нерівномірного освітленості обличчя

Проблема положення голови (в подібному випадку обличчя - тривимірний об'єкт)

Рисунок 9 – Проблема положення голови (в подібному випадку обличчя - тривимірний об'єкт)

З метою оцінки ефективності запропонованих методів розпізнавання обличчя, агентство DARPA і дослідницька лабораторія армії США розробили програму FERET (FacE REcognition Technology) [8].

У масштабних тестах програми FERET брали участь алгоритми, засновані на гнучкому порівнянні на графах і всілякі модифікації методу головних компонент (PCA). Ефективність всіх алгоритмів була приблизно однаковою. У зв'язку з цим важко або навіть неможливо провести чіткі відмінності між ними (особливо якщо узгодити дати тестування).

Для фронтальних зображень, зроблених в один і той же день, прийнятна точність розпізнавання, як правило, становить 95%. Для зображень, зроблених різними засобами при різному освітленні, точність, як правило, падає до 80%. Для зображень, зроблених з різницею в рік, точність розпізнавання склала приблизно 50%. При цьому варто зауважити, що 50% - це більш ніж прийнятна точність роботи системи подібного роду.

Щорічно FERET публікує звіт про порівняльному випробуванні сучасних систем розпізнавання обличчя [8] у базі обличь більше одного мільйона. При цьому в останніх звітах не розкриваються принципи побудови систем розпізнавання, а публікуються тільки результати роботи комерційних систем. На сьогоднішній день лідируючої є система NeoFace [10] розроблена компанією NEC.

Висновки

Комп'ютерне зір - розвивається галузь програмування, але при цьому затребувана і має великий спектр застосування. Функцію ідентифікації людей на фотографіях активно використовують в програмному забезпеченні для керування фотоальбомами (Picasa, iPhoto і ін.). Скомбінувавши її з реальними параметрами, можна складати альбоми по окремій людині. Ідентифікація також знаходить своє застосування в системах безпеки, наприклад, при розпізнаванні співробітників об'єкта (установи).

При розробці програмного забезпечення даного проекту ідентифікація особистості до кінця не реалізована, однак виконані знаходження обличчя і розпізнавання частини ознак за допомогою всього двох паралельних вейвлет Габора. Зі збільшенням ряду фільтрів і калібрування їх параметрів, можливі знаходження більшого числа ознак і відсічення шумів. На основі отриманих точок також з'явиться можливість побудови графа для виконання порівняльного аналізу і ідентифікації особи.

Основними труднощами на даному етапі виконання проекту є налагодження параметрів фільтра Габора і розробка алгоритмів побудови та порівняння графів.

Надалі планується використання засобів і методів постбінарного комп'ютингу [11, 12] для покращення точності обчислень. Так, наприклад, деякі перешкоди можна позначати як невизначеність, внаслідок чого перешкоди будуть просто відкидатися, а збережуться як можливі особливості обличчя.

При написанні даного реферату магістерська робота ще не завершена. Остаточне завершення: липень 2017 року. Повний текст роботи та матеріали по темі можуть бути отримані у автора або його керівника після зазначеної дати.

Список використаної літератури

  1. Технология распознавания лиц / Data Систем. Товары и технологии XXI. [Электронный ресурс]. — Режим доступа: http://hardbro-ker.ru/pages/recognition. — Заглавие с экрана.
  2. Коломиец В. Анализ существующих подходов к распознаванию лиц. [Электронный ресурс] / Блог компании Синезис. — Режим доступа: http://habrahabr.ru/company/synesis/blog/238129.
  3. OpenCV шаг за шагом. Интегральное изображение. [Электронный ресурс]. — Режим доступа: http://robocraft.ru/blog/computervision/53-6.html
  4. Lades М. Distortion Invariant Object Recognition in the Dynamic Link Architecture. [Электронный ресурс] / Martin Lades, Jan C. Vorbruggen, Joachim Buhmann, Jorg Lange, Christoph v.d. Malsburg, Rolf P. Wurtz, Wolfgang Konen. — IEEE Transactions on Computers, vol. 42, No. 3, March 1993. — Режим доступа: http://www.cse.psu.edu/~rtc12/CSE597E/papers/objrecLadesMarlsberg93.pdf.
  5. Grother Р. Face Recognition Vendor Test (FRVT). Performance of Face Identification Algorithms. / Patrick Grother, Mei Ngan. — Information Access Division National Institute of Standards and Technology. — May 26, 2014 — р. 138.
  6. Мальцев А. Использование каскада Хаара для сравнения изображений [Электронный ресурс] / Мальцев Антон. — Режим доступа: https://habrahabr.ru/post/198338/. — Заглавие с экрана.
  7. Face Recognition [Электронный ресурс] / NSTC Subcommittee on Biometrics and Identity Management Room. — 7 August, 2006. — Режим доступа: http://www.biometrics.gov/documents/.
  8. Face Recognition Technology (FERET). Instructions on getting FERET database [Электронный ресурс]. / National Institute of Standards and Technology's web site. — Режим доступа: http://www.nist.gov/itl/iad/ig/feret.cfm.
  9. Fast and robust face detection and tracking: mc-jesus/face_detect_n_track. [Электронный ресурс]. — Режим доступа: https://github.com/mc-jesus/face_detect_n_track.
  10. NeoFace® Watch Generate Real-time Alerts Using Highly Accurate Face Recognition Technology. [Электронный ресурс]. / NEC Corporation of America, 2013. — Режим доступа: https://www.necam.com/docs/?id=c8a08fd5-e79c-4f00-9f37-9919318cc772.
  11. Аноприенко А. Я. Постбинарный компьютинг и интервальные вычисления в контексте кодо-логической эволюции. / А. Я. Аноприенко, С. В. Иваница — Донецк, ДонНТУ, УНИТЕХ, 2011. — 248 с
  12. Аноприенко А. Я. Тетралогика, тетравычисления и ноокомпьютинг. Исследования 2010–2012. / А. Я. Аноприенко, С. В. Иваница — Донецк: ДонНТУ, Технопарк ДонНТУ УНИТЕХ, 2012. — 308 с.
  13. Фильтр Габора [Электронный ресурс]. / Википедия – свободная энциклопедия — Режим доступа:: https://ru.wikipedia.org/wiki/Фильтр_Габора