остецька Галина Юріївна
ru ua en

Костецька Галина Юріївна

Факультет: Вычислительной техники и информатики

Кафедра: Прикладной математики и информатики

Специальность: Программное обеспечение автоматизированных Систем

Тема выпускной работы: Дослідження програмної моделі конволюційної нейронної мережі для розпізнавання зображень людських облич

Научный руководитель: доцент, кандидат технических наук Федяев Олег Иванович

Автореферат: «Дослідження програмної моделі конволюційної нейронної мережі для розпізнавання зображень людських облич»


Вступ

 

На даний час все більш широкого поширення набувають біометричні системи ідентифікації особи. Розпізнавання людини по зображенню особи виділяється серед біометричних систем тим, що, по-перше, не потрібне спеціальне або дороге обладнання, а, по-друге, не потрібен безпосередній контакт із пристроєм.

У загальному випадку завдання ідентифікації особистості складається з двох етапів. Спочатку визначається місце розташування обличчя на зображенні, а після цього починається ідентифікація особи. Реалізація цих етапів багато в чому залежить від області застосування системи розпізнавання. Наприклад, є системи для знаходження особи в великій базі даних з наступним виведенням списку найбільш схожих людей. Також існує клас систем для ідентифікації визначеної людини в режимі реального часу (охоронні системи, системи розмежування доступу) [1].

На даний момент проблемі розпізнавання людини по зображенню обличчя присвячено безліч робіт, проте в цілому вона ще далека від вирішення. Основні труднощі полягають у тому, щоб розпізнати людину по зображенню обличчя незалежно від ракурсу, положення, умов освітлення.

Для вирішення задачі розпізнавання осіб були запропоновані різні методики, серед яких можна виділити підходи, засновані на нейронних мережах. Особливої уваги заслуговує новий підхід до розпізнавання за допомогою конволюційних нейронних мереж.

Цілі і завдання, які повинні вирішуватися

 

Метою дослідження є оцінка ефективності роботи конволюційних нейронних мереж при розпізнаванні зображень людських облич, розробка програмної моделі конволюційної нейромережі, а також її дослідження.

Намічено рішення наступних завдань:

  1. Побудова структури системи розпізнавання осіб на основі конволюційної нейронної мережі
  2. Розробка структури конволюційної нейромережі, вибір методики її навчання та навчальну множину, яка має достатню репрезентативність.
  3. Розробка структури модуля первинної обробки зображень для створення навчальної множини конволюційної нейронної мережі на основі карт Кохонена;
  4. Створення програмної моделі системи розпізнавання людських облич, яка б демонструвала процес навчання і розпізнавання, а також дозволяла проводити дослідження роботи конволюційної нейронної мережі.

 

Актуальність теми

На даний час біометричні системи ідентифікації людини набувають все більшого поширення. Їх головні переваги перед традиційними способами ідентифікації наступні: вони грунтуються на унікальних біологічних ознаках, а, отже, їх надзвичайно складно підробити. Також, очевидна зручність їх використання — вони не вимагають від людини володіння будь-якими спеціальними картками, ключами і т.д.

Існує кілька способів ідентифікації за біометричними ознаками. На даний момент лідерами є ідентифікація за відбитками пальців та сітківкою ока. Інші види ідентифікації (по обличчю або голосу) менш розвинені. Вони не настільки надійні за своєю природою (простіше для фальсифікації), а тому їх використання можливе лише в деяких областях.

Актуальність задачі розпізнавання людини по зображенню його особи, а також її перевага в порівнянні з іншими засобами ідентифікації особи (наприклад ідентифікація за відбитками пальців або по сітківці ока) полягає в тому, що немає необхідності безпосереднього контакту системи і людини.

Головні труднощі, які необхідно подолати при ідентифікації людини по обличчю — це забезпечення незалежності роботи системи від таких факторів, як освітленість, ракурс, а також вікові зміни. Багато методів містять у собі великий і витратний етап первинної обробки. Однак без розуміння якоїсь загальної семантики зображення складно зробити це правильно.

Саме тому перспективним виглядає напрямок методів з використанням нейронних мереж. Принцип роботи таких методів заснований на принципі роботи людського мозку. Вони за допомогою навчання дозволяють знаходити взаємозв'язки між окремими ознаками зображення і проводити розпізнавання з достатньою точністю.

Передбачувана наукова новизна


Існуючі системи розпізнавання осіб найчастіше використовують статистичні, геометричні методи, приховані Марківські моделі і т.д. Нейромережевий підхід за допомогою конволюційних нейронних мереж є в даній області новим.

Використання конволюційних нейронних мереж дозволить забезпечити часткову стійкість до змін масштабу, зсувів, поворотів, зміні ракурсу.

Первинна обробка зображень за допомогою карт Кохонена дозволить виділити найбільш характерні риси і підвищити швидкість навчання конволюційної нейромережі за рахунок зменшення розмірності вхідних образів.

Плановані практичні результати

Після закінчення роботи по розробці програмної системи планується отримати працездатний програмний проект, призначений для розпізнавання зображень людських облич з обраної множини.

Також планується проведення комплексного дослідження на програмній моделі конволюційної нейронної мережі на етапі навчання і розпізнавання.

Огляд досліджень і розробок по темі


У світі існують дослідження і розробки, що стосуються розпізнавання людських облич. Хотілося б вказати найбільш цікаві з них, на мою думку:

  • FaceIt, Ibis — розробки корпорації Identix. FaceIt - система сканування осіб, яка ідентифікує людей в режимі реального часу в той час як вони проходять через пункти контролю безпеки. Дана система широко використовується державними службами США. Ibis — програмно-апаратний комплекс для перевірки осіб, що знаходяться на закритій території або на вулиці (у разі застосування в поліції). Система складається з центру обробки інформації та переносних терміналів сканування.
  • Smart Camera розроблена компанією BioIdentity система розпізнавання облич. Це система цифрових камер для розпізнавання по формі обличчя. Фотографує обличчя людей в радіусі до 20 метрів. На якість зображення не впливає освітлення або будь-які інші умови навколишнього середовища.

На національному рівні розробляються системи розпізнавання осіб у Київському Інституті Кібернетики на основі статистичних методів, а також в Інституті Штучного інтелекту в Донецьку.

Представники локального рівня:

  1. Дрига Костянтин Володимирович «Розпізнавання зашумленних і викривлених  образів за допомогою неокогнітрона» [2]. Робота присвячена дослідженню можливостей нейромережевого алгоритму "Неокогнітрон" в області розпізнавання образів, підданих різним викривленням: зрушення, поворотам, змінам форми, зашумленню. Дана робота опису є реалізацію оптимальної моделі неокогнітрона, яка виконує поставлені завданнями, зокрема, з розпізнавання арабських цифр, використовуючи мінімум обчислювальних ресурсів комп'ютера.
  2. Багліков Вадим Геннадійович «Розробка комп'ютеризованої підсистеми біометричної ідентифікації особи за фотопортретом» [3]. Основна відмінність роботи Вадима Геннадійовича від даної полягає в тому, що для розпізнавання використовується принципово інший метод — приховані Марківські моделі.
  3. Евстюнічева Анастасія Вікторівна «Автоматизована система контролю доступу на основі розпізнавання відбитків пальців» [4]. Дана робота присвячена одному з біометричних методів — розпізнаванню відбитків пальців.

 

Нейромережевий підхід до розпізнавання образів


Нейронні мережі успішно застосовують у вирішенні багатьох проблем розпізнавання образів: розпізнавання символів, розпізнавання об'єктів та багатьох інших. Проблема виявлення образу особи дуже важка через велике розмаїття викривлень, таких як різні вирази обличчя, умови зйомки і тому подібне. Перевага використання нейронних мереж для виявлення особи — здатність до навчання системи для виділення ключових характеристик особи з навчальних виборок [8].

В даний час найбільш часто в задачах розпізнавання та ідентифікації зображень використовують класичні нейромережеві архітектури (багатошаровий персептрон, мережі з радіально-базисними функціями та ін.), але, як показує аналіз робіт, застосування класичних нейромережних архітектур для даної задачі є неефективним з наступних причин:

  • для вирішення даної задачі зазвичай застосовується ансамбль нейронних мереж (2-3 нейронні мережі, навчені з різними початковими значеннями синаптичних коефіцієнтів і порядком пред'явлення образів), що негативно позначається на обчислювальній складності розв'язання задачі та відповідно на виконанні;
  • як правило, класичні нейромережеві архітектури використовуються в сукупності з допоміжними методами виділення сюжетної частини зображення (сегментація за кольором шкіри, виділення контурів і т. д.), які вимагають якісної й кропіткої передобробки навчальних і робочих даних, що не є ефективним;
  • нейромережеві архітектури є вкрай чутливими до впливу різних зовнішніх факторів (зміни умов зйомки, присутність індивідуальних особливостей на зображенні, зміна орієнтації). Додатково виникають труднощі застосування традиційних нейронних мереж для реальних завдань розпізнавання і класифікації зображень.

По-перше, як правило, зображення мають велику розмірність, відповідно виростає розмір нейронної мережі (кількість нейронів). Велика кількість параметрів збільшує місткість системи і відповідно вимагає більшої навчальної вибірки, що збільшує час і обчислювальну складність процесу навчання.

По-друге, недолік повнозв'язної архітектури — це те, що топологія введення повністю ігнорується. Вхідні змінні можуть бути представлені в будь-якому порядку, не враховуючи мети навчання. Зображення мають строгу 2-мірну структуру: змінні (пікселі), які є просторово сусідніми, надзвичайно залежні [8].

Від даних недоліків вільні так звані конволюційні нейронні мережі. конволюційні нейронні мережі забезпечують часткову стійкість до змін масштабу, зсувів [6].

Теорія конволюційних  нейронних мереж

Конволюційна нейронна мережа являє собою особливий клас нейронних мереж, який найкращим чином підходить для інтелектуальної обробки візуальних даних. Ідея конволюційних нейронних мереж полягає в чергуванні конволюційних шарів (C-layers), субдискритизуючих шарів (S-layers) і наявності повнозв'язних (F-layers) шарів на виході. Вони поєднують у собі три архітектурні ідеї для досягнення інваріантності до зсуву і викривлення вхідного зображення: локальні поля сприйняття, колективні ваги і просторова субдискретизація [9].

Локальне сприйняття означає те, що на вхід одного нейрона подається не все зображення (або виходи попереднього шару), а лише деяка його область. Такий підхід дозволив зберігати топологію зображення від шару до шару.

Концепція колективних ваг означає, що для великої кількості зв'язків використовується дуже невеликий набір ваг. Суть субдискретизаціі і S-шарів у конволюційних нейронних мережах полягає у зменшенні просторової розмірності зображення.

Чергування шарів дозволяє складати карти ознак з карт ознак, що на практиці означає здатність розпізнавання складних ієрархій ознак.

Зазвичай після проходження декількох шарів карта ознак вироджується у вектор або навіть скаляр, але таких карт ознак стає сотні. У такому вигляді вони подаються на один-два шари повнозв'язної мережі. Вихідний шар такої мережі може мати різні функції активації. У найпростішому випадку це може бути тангенціальна функція, також успішно використовуються радіальні базисні функції [6].

Сверточних нейронна мережа складається з шарів згортки і субдискретизації.  Зображення, що надходитьна вхід піддається згортці з деяким ядром згортки.

Ядро згортки є набором поділюваних вагових коефіцієнтів. Результатом даної операції є також деяке зображення, яке називається картою ознак. Залежно від обраного ядра згортки, карта ознак буде виділяти ті чи інші характеристики вхідного зображення. Для найбільш повного виділення характеристик вхідного зображення використовується декілька різних ядер згортки так, що на виході згортального шару виходить декілька карт ознак.

За конволюційним шаром наявний шар усереднення і субдискретизаціі, який знижує розмірність карти ознак, тим самим знижуючи чутливість виходів до зсувів і поворотів.

Таке чергування конволюційних і субдіскретизуючих шарів приводить до поступового збільшення кількості карт ознак при зменшенні їх розмірності від шару до шару.

Для навчання описаної мережі був використаний алгоритм зворотного поширення помилки [5].

Навчання мережі починається з пред'явлення образу і обчислення відповідної реакції. Порівняння із бажаною реакцією дає можливість змінювати ваги зв'язків таким чином, щоб мережа на наступному кроці могла видавати більш точний результат. Навчальне правило забезпечує налаштування ваг зв'язків. Інформація про виходи мережі є вхідною для нейронів попередніх шарів. Ці нейрони можуть налаштовувати ваги своїх зв'язків для зменшення похибки на наступному кроці.

Коли неналаштованій мережі пред'являється вхідний образ, вона видає деякий випадковий вихід. Функція помилки представляє собою різницю між поточним виходом мережі та ідеальним виходом, який необхідно отримати. Для успішного навчання мережі потрібно наблизити вихід мережі до бажаного виходу, тобто послідовно зменшувати величину функції помилки. Це досягається настройкою міжнейронних зв'язків. Кожен нейрон в мережі має свої ваги, які настроюються, щоб зменшити величину функції помилки [11].

В основі алгоритму зворотного поширення помилки лежить методика, що дозволяє швидко обчислювати вектор приватних похідних[4] складної функції багатьох змінних, якщо структура цієї функції відома [7]. В якості такої функції в алгоритмі розглядається функція помилки мережі і враховується той факт, що структура функції помилки мережі повністю визначається архітектурою нейронної мережі, яка вважається відомою.

Початкова ініціалізація нейронної мережі має величезний вплив на кількість ітерацій навчання. Від того, наскільки вдало вибрані початкові значення ваг залежить, як довго мережа за рахунок навчання і підстроювання буде шукати їх оптимальні величини, і чи знайде вона їх [10].

Ваги повинні бути обрані випадково, але в такий спосіб, щоб активаційна функція насамперед активізувалася у своїй лінійної області. Для досягнення даного ефекту необхідне узгодження між нормалізацією вхідних значень нейронної мережі, вибором активаційної функції і вибором початкових значень вагових коефіцієнтів [11].

Система розпізнавання на основі конволюційної нейронної мережі має кілька модулів. Її структура показана на рисунку 1.

Система, щр використовується для розпiзнавання облич

Рисунок 1— Система, що використовується для розпізнавання облич.

Спочатку відбувається розбиття зображення, потім йде блок скорочення мірності за допомогою карт Кохонена, а завершує процес блок розпізнавання — конволюційна нейронна мережа.

Висновки


На даний момент розроблено структуру системи розпізнавання осіб і частково виконана її програмна реалізація.

Розроблено топологія сверточних нейронної мережі, підібрано навчальне безліч, володіє достатньою репрезентативністю — ORL Database of Faces. Також реалізована перша версія програмної моделі сверточних нейронної мережі і модуля передобробки зображень на основі карт Кохонена.

Надалі планується покращення програмної моделі та дослідження впливу параметрів архітектури сверточних нейронної мережі на процес навчання і розпізнавання.

Список використаної літератури

 

  1. Дзюба В. Г. Анализ методов распознавания лиц / Ю. И. Якименко, В. Г. Дзюба // Электроника и связь. — 2003. — № 20. — С. 149–152.
  2. Дрига К.В. «Распознавание зашумленных и искаженных образов с помощью неокогнитрона». [Электронный ресурс] / Портал магистров ДонНТУ, — http://masters.donntu.ru/2006/fvti/driga/diss/index.htm
  3. Багликов В.Г. «Разработка компьютеризированной подсистемы биометрической идентификации личности по фотопортрету». [Электронный ресурс] / Портал магистров ДонНТУ, — http://masters.donntu.ru/2008/kita/baglikov/diss/index.htm
  4. Евстючева А.В. «Автоматизированная система контроля доступа на основании распознавания отпечатков пальцев» [Электронный ресурс] / Портал магистров ДонНТУ, — http://masters.donntu.ru/2006/kita/yevstyunicheva/diss/index.htm
  5. Moody J., Darken C.J. Fast Learning In Netwoks of Locally TunedProcessing Units // Neural Computation. — 1989. — № 1. — P . 281–284.
  6. LeCun Y. Generalization and network design strategies // Proc. Of the Intern. Conf. Connectionism in Perspective. — University of Zurich, 10–13 October 1988. — P . 143–155.
  7. Царегородцев В.Г. Общая неэффективность использования суммарного градиента выборки при обучении нейронной сети // Нейроинформатика и ее приложения: Матер. XII Всеросс. семинара. — Красноярск, 2004. — С. 145–151.
  8. Макаренко А.А. Сверточные нейронные сети в задаче классификации изображений // Информационные системы. Вып. 4.: Тр. постоянно действующего научно-техн. семинара. — Томск: Изд-во Том. гос. ун-та систем управления и радиоэлектроники. — 2006. — С. 3‑9.
  9. Lawrence S., Giles C. L., Tsoi A. C. and Back A. D. Face recognition:a convolutional neural network approach// IEEE Trans. on Neural Networks. — Special Issue on Neural Networks and Pattern Recognition. — 1997. — P.97-113.
  10. R. Brunelli and T. Poggio. Face recognition: Features versus templates // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 1993. — №15(10). — P.142–152.
  11. Rumelhart D.E., Hinton G.E., Williams R.J. Learning internal representations by error propagation // Parallel distributed processing. — 1986. — V. 1. — P . 318–362.