Реферат по теме магистерской работы

Исследование интерактивных методов идентификации личности в сфере ТЗИ

Дырул А.И.

Введение

  Идентификация личности - это установление тождества личности человека по совокупности признаков путем сравнительного их исследования. В зависимости от объекта идентификации и его особенностей применяют разнообразные методы исследования. Например, используют метод дактилоскопии, основанный на выявлении индивидуальных неизменных особенностей капиллярных узоров кожи ладонных поверхностей ногтевых фаланг пальцев кисти; метод словесного портрета — описание внешности человека и его особенностей специальными стандартными терминами. Словесный портрет включает описание статических признаков (формы и других особенностей лица, глаз, носа, ушных раковин и др.) и динамических признаков (особенности походки, жестикуляции, мимики и т.п.). Особенности походки могут быть установлены и по следам ног (дорожка следов при ходьбе). Важную часть словесного портрета составляют особые приметы. К ним относят родимые пятна, бородавки, рубцы, признаки перенесенных заболеваний и травм, особенности строения зубочелюстного аппарата, татуировки и др. Используют также измерение длины тела, стоп, окружности головы, грудной клетки, ширины плеч и др.[1].
Идентификация личности широко применяется в области защиты информации в виде биометрических алгоритмах, работа которых основывается на сравнении изображения лица, радужной оболочки глаза, отпечатков пальцев, голоса, формы ушей и носа.

Цели исследования

 Целью магистерской работы является усовершенствование работы алгоритмов распознавания лиц и образов. Для достижения поставленной цели необходимо провести:
  • Анализ работы алгоритмов распознавания изображений лица, ушной раковины.
  • Моделирование работы алгоритмов распознавания изображений лица и ушной раковины в различных условиях работы.
  • Проведение экспериментальных исследований и поиск уязвимостей алгоритмов.
  • Предложение идей по внедрению алгоритмов в системах ТЗИ.

Актуальность темы работы

  Для идентификации личности в данной работе используются биометрические данные человека, они являются уникальными для каждого человека. На сегодняшний день реализовано большое количество различных методик и алгоритмов на основе биометрии, но все они имеют различные недостатки такие, как зависимость точности идентификации от освещенности объекта(лица, руки и.т.д), возрастное изменение сетчатки глаза и.т.д., в следствии этого существенно снижается точность работы алгоритмов. Для решения данной проблемы используют несколько методик, которые также не всегда обеспечивают высокую надежность, которая является основополагающим фактором.  
   Актуальность использования биометрии на сегодняшний день велика и может использоваться повсеместно, например для замены паролей доступа к конфиденциальной информации, которые рекомендуется использовать достаточно сложные для подбора их, как правило, сложно запомнить, а хранить такие данные на бумаге или других носителях не безопасно.

Предполагаемая научная новизна

   Комплексное применение алгоритмов распознавания образов и голоса для увеличения надежности системы в целом.
Внедрение исследованных алгоритмов в технические средства защиты информации.
     

Алгоритмы распознавания образов

  Для работы используется два основных алгоритма Фильтр минимальной средней корреляционной энергии(MACE filter)[2] и Локальные Бинарные Шаблоны(LBP)[3].
    Принцип работы MACE фильтра заключается в минимизации средней корреляционной энергии  на основе заранее подготовленных изображений. Эффект минимизации заключается в том что коэффициент корреляции равняется нулю на всем изображении кроме областей, которые совпадают с подготовленными изображениями, то есть в этих областях степень корреляции больше. На рис.1 показан принцип работы МАСЕ фильтра.
Очевидно, что для работы этого алгоритма необходима база данных изображений (заранее подготовленные изображения) с помощью которой будет производиться расчет степени корреляции. Для оптимальной работы желательно, чтобы в базе на заданную личность  находилось сравнительно большое количество изображений лица, в различных условиях освещения и изменения мимики лица. Это обеспечит бόльшую точность.

 Принцип работы МАСЕ фильтра.
Рис.1 Принцип работы МАСЕ фильтра.

    Локальные Бинарные Шаблоны (LBP) являются популярной техникой для распознавания лиц, а также для распознавания изображения в целом. В последнее время LBP был применялся к конкретным проблемам распознавания лиц. LBP имеет непараметрическое ядро, которое обрабатывает пространственную структуру изображений. Кроме того, оно инвариантно к монотонным серо-масштабным преобразованиям, следовательно, реализация LBP менее чувствительна к изменениям освещенности. Это интересное свойство в распознавания лиц. Действительно, одна из основных проблем в системах распознавания лиц является работа с изменением освещенности.
На практике, это очень актуально, условия освещения проверяемого
изображения не соответствуют требованиям из галереи (базы данных) изображений, следовательно, существует необходимость обрабатывать такие изменения.
Рассмотрим некоторые варианты работы LBP алгоритма.

Чистый LBP метод.

    LBP представляет собой описание окрестности пикселя изображения в двоичной форме. Оператор (LBP), который применяется к пикселю изображения, использует восемь пикселей окрестности, принимая центральный пиксель в качестве порога. Пиксели, которые имеют значения больше, чем центральный пиксель (или равное ему), принимают значения "1", те, которые меньше центрального, принимают значения "0". Таким образом получается восьмиразрядный бинарный код, который описывает окрестность пикселя. Рис.2.

 Описание работы LBP

Рис.2 Описание работы LBP

В десятичной форме результирующее восьмиричное слово (LBP код) может быть представлено в следующем виде:

 
Где ic – соответствует центральному пикселю () in – относится к восьми окружающим пикселям. Функция s(x) описывается как

    Каждый бит кода LBP имеет тот же уровень значимости и, что два последовательных значения бит. Код LBP можно интерпретировать как индекс структуры ядра. По определению, оператор LBP не зависит от какого-либо монотонного серо-масштабного преобразования, сохраняющего пиксели порядка интенсивности в местные окрестности (рис. 3).
Работа оператора LBP
 
Рис. 3. Исходное изображение (слева) обрабатываются оператором LBP(справа).

   Благодаря своей текстуре LBP является не сложным в реализации и являетсяс популярным в распознавании образов. В последнее время LBP была применена в работах для обнаружения лиц, распознавания лиц, поиска изображений, обнаружения движений и визуального осмотра[3].

Масштабируемый LBP.

    Ojala и др..  расширили исходный оператора LBP к круговой окрестности различного размера радиуса . Их LBPp,r увеличивает расстояние р равноотстоящих пикселей по окружности на радиус к. Например, работа оператора LBP8, 2  показана на рисунке 4.

 Пример масштабируемого оператора LBP
Рис. 4. Пример масштабируемого оператора LBP

Равномерный LBP.

    В своих работах Ojala и др. отмечают, что большая часть информации содержится в небольшой группе LBP моделей. Эти модели, называются равномерной моделью и содержат не более двух побитовых 0 до 1 или 1 на 0
переходов (циклический двоичный код). 11111111, 00000110 или 10000111предназначеных для равномерных моделей. Они в основном представляют собой примитивные микро-функции, такие как линии, края, углы. LBPu2p,r обозначает расширенный оператор LBP только для равномерных моделей[3].

Улучшенный LBP.

     В последнее время появились новые расширения LBP . Например, Jin и др..  заметили, что теряются особенности локальной структуры  LBP  при некоторых определенных обстоятельствах, таким образом они ввели улучшения в Локально Бинарные Шаблонов (ILBP). Основное различие между ILBP и LBP лежит в сравнение всех пикселей (в том числе центральных пикселей) со средним значением всех пикселей в ядре (рис. 5). В результате 9-битное слово (ILBP код) десятичной форме  может быть выражен следующим образом:
 
 где im - соответствует среднему значению всех пикселей, а функция S(X) определяется как:
 Расчет кода ILBP
Рис. 5. Расчет кода ILBP
[3]

Расширенный LBP.
    Хуанг и др.. отмечают, что LBP отражает только первичную информацию о выводе изображения, но не может отражать скорость местных вариаций. Для решения этой проблемы, они предложили расширенную  версию  локальных бинарных шаблонов (ELBP), которая кодирует изображение градиента величины в дополнение к исходному изображению. Для этой цели применяются ядра LBPu28,1, LBPu28,2 и LBPu2 8,3 как исходное изображение и изображение градиентом. Как следствие, этот метод не может рассматриваться как расширение оператора LBP[3].

Перепись преобразований(Census Transform).
    Этот метод был предложен одновременно с LBP, который был введен Ojala и др. Его особенность, называемая перепись преобразования отличается от LBP только порядком бит строки. Позже переписи преобразования были расширены, но стоит отметить схожесть с расширениями для LBP[3].
  

Алгоритмы распознавания личности по ушной раковине.

    Достаточно новые алгоритмы, которые хорошо себя зарекомендовали. Известно, что ушная раковина(УР) окончательно сформировывается до рождения, а в процессе жизни продолжает расти сохраняя свою форму. Форма ушной раковины у каждого человека индивидуальна. Для работы алгоритма используется метод SIFT, который применяется для сопоставления изображений и сводится к нахождению особых точек.
Детектирование особых точек производится через построение пирамиды гауссианов (Gaussian) и разностей гауссианов (Difference of Gaussian, DoG).
Этот метод имеет недостатки, которые проявляются при плохой освещенности ушной раковины на анализируемой фотографии[4].

Внедрение системы идентификации личности

    Для обеспечения стабильности работы системы, доступности, интерактивности возможна следущая структура внедрения  рис.6.

 Структура системы распознавания изображений
Рис.6 – Структура системы распознавания изображений (анимация: объем – 40,5 КБ, количество кадров – 9, задержка до повторного воспроизведения 0 с., количество циклов повторения –7 , размер – 595x170)

    Источником данных для работы системы является видеокамера установленная на границе контролируемой зоны. В случае появления движения изображение с видеокамеры передаются на портативное устройство при помощи USB кабеля. Портативное устройство проводит распознавание и принимает решение о действии. Принятое решение фиксируется на сервере в виде отчета. В случае не принятия решения портативным устройством сервер производит дозвон используя GSM сеть, тем самым связывая человека у камеры  и доверенное лицо. Доверенное лицо имеет возможность дистанционно управлять решениями портативного устройства.
Для принятия решений портативные устройства оснащаются программным обеспечением с реализациями выше названных алгоритмов. Особенностью данной структуры является масштабируемость, которая зависит от вычислительных возможностей сервера. Стоит отметить, что для реализации алгоритма LBP и МАСЕ фильтра не требуется больших вычислительных мощностей.

Результаты исследований

    В результате исследований было установлено, что использование MACE фильтра и Локальных Бинарных Шаблонов, не является достаточным, но оптимальным. В случае использования МАСЕ фильтра возникает ошибка определения лица (>2%), что является существенным, а также стоит отметить серьезную зависимость работы от освещённости. Для увеличения точности идентификации добавляется использование LBP метода. В итоге в 90% случаев идентификация прошла успешно. Методика идентификации по ушной раковине обеспечивает высокий процент совпадения. В случае совместного использования трех алгоритмов вероятность верного распознавания стабилизируется взаимоисключая неточности работы используемых алгоритмов.
     Возможна компрометация алгоритмов путем использования 3D модели головы созданной с помощью 3D принтера. Вероятность ложного срабатывания алгоритмов близка к 100%, а также во время тестирования программных продуктов было отмечено, что первичные данные о личности хранятся в открытом виде, таким образом возможна подмена данных. 

Заключение

   Распознавание лиц нуждается в надёжном механизме работы, который может обеспечиваться предложенными алгоритмами. Стоит отметить, что не всегда целесообразно использовать большое количество алгоритмов, так как прирост вероятности распознавания будет не существенен. Представленная система реализует важные для практики функции: распознавание выполняется в реальном времени. Возможно автономное принятие решения, а также с помощью доверенного лица, которое осуществляет управление через GSM канал.

Список литературы

[1] [Сетевая энциклопедия] http://dic.academic.ru/dic.nsf/enc_medicine/12320/Идентификация

[2] Face Verification using Correlation Filters
Marios Savvides ,Electrical and Computer Eng. Dept,Carnegie Mellon University Pittsburgh, PA 15213, U.S.A.
B.V.K. Vijaya Kumar Electrical and Computer Eng. Dept, Carnegie Mellon University Pittsburgh, PA 15213, U.S.A.
Pradeep Khosla Electrical and Computer Eng. Dept, Carnegie Mellon University Pittsburgh, PA 15213, U.S.A. // http://www.ece.cmu.edu/~kumar/Biometrics_AutoID.pdf

[3] On the Recent Use of Local Binary Patterns for Face Authentication S ´ bastien Marcel, Yann Rodriguez and Guillaume Heusch // 
http://www.idiap.ch/~marcel/professional/publications/marcel-ijivp-2007.pdf

[4] On guided model-based analysis for ear biometrics. Banafshe Arbab-Zavar, Mark S. Nixon. School of Electronics and Computer Science, University of Southampton, UK. //
http://eprints.ecs.soton.ac.uk/20973/1/arba-zavar-cviu.pdf
 
[5] [Социальная сеть IT специалистов] http://habrahabr.ru/blogs/algorithm/106302/

Важное замечание

    При написании данного автореферата магистерская работа еще не завершена. Окончательное завершение: декабрь 2011. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.