Библиотека – Коношенко Владислав Олегович – Распределенная система идентификации личности посредством портретной экспертизы.

Сравнительный анализ методов распознавания лиц для использования в подсистеме идентификации личности

  • Авторы: В.О. Коношенко, М.В. Привалов

    Описание: Обоснование и выбор методов определения и распознавания лиц. Для дальнейшего выбора и использования одного или комбинации алгоритмов в подсистеме идентификации личности.

    Источник: ИУСМКМ – 2018 http://iuskm.donntu.ru/electronic/iusmkm2018.pdf

  • Донецкий национальный технический университет, г. Донецк кафедра автоматизированных систем управления konoshenko.vl@gmail.com

    Аннотация Коношенко В.О., Привалов М.В. Задача распознавания лиц на изображении является ключевой при решении задач идентификации лиц, автоматического слежения за передвигающимся в поле зрения камеры субъектом. Целью данной работы является сравнение методов определения и распознавания лиц. Проводится сравнение методов различных классов, выявляются их положительные и отрицательные стороны. На основе полученных результатов делаются выводы о возможностях комбинированного использования алгоритма Виола-Джонса и метода главных компонент для решения данной задачи.

    Постановка проблемы.
    При реализации подсистемы идентификации личности одним из основных компонентов является модуль, которым производится распознавание лиц [1] в кадре. При обнаружении лиц в кадре необходимо определить положение детектированного объекта для его дальнейшего отслеживания. Результатом работы такой подсистемы является идентифицированная личность, лицо которой было обнаружено в кадре. Так как на текущий момент существует большое множество методов распознавания и определения лиц, то необходимо провести сравнительный анализ для выбора такого метода, который позволит минимизировать ложные определения и при этом будет минимально нагружать ресурсы системы.

    Цель работы – обоснование и выбор методов определения и распознавания лиц. Для дальнейшего выбора и использования одного или комбинации алгоритмов в подсистеме идентификации личности.

    Задача идентификации личности является достаточно сложной, особенно для задач без ограничений, когда точка обзора, освещение, выражение лиц, заграждения, аксессуары и т.п. могут существенно изменяться. Лицо, как трехмерный объект, должно быть идентифицировано на основе его двумерного изображения. При этом цифровое изображение лиц может изменяться при изменении освещения, позы, выражения и т.д.

    Типичная система распознавания лиц в упрощенном виде состоит из двух основных модулей:

    1. Модуль детектирования лиц в кадре.
    2. Модуль распознавания по ключевым признакам.

    При построении автоматической подсистемы распознавания лиц необходимо учитывать следующие особенности, усложняющие задачу:

    • сильно варьирующийся внешний вид лиц у разных людей;
    • возможное присутствие индивидуальных особенностей;
    • изменение выражения лиц;
    • часть лиц может быть невидима на изображении;

    Обобщённая схема работы такой подсистемы изображена на рис. 1. Входной информацией для неё является видеопоток. Из него выделяется последовательность кадров, к каждому из которых применяется алгоритм детектирования лиц. Получив область кадра с объектом, необходимо произвести сравнение ключевых признаков полученного объекта с имеющимися в БД. В результате будет получен список кандидатов, соответствующих условиям отбора.

    pic1

    Риc. 1. Обобщённая схема работы подсистемы распознавания лиц

    Существует две основных категории алгоритмов, разработанных для решения задачи обнаружения лиц: методы эмпирического распознавания и методы моделирования изображения лиц человека [2,3].

    Эмпирические методы основываются на опыте человека в решении задачи распознавания лиц и пытаются формализовать и алгоритмизировать этот опыт, построив на его основе автоматическую систему распознавания. При этом формируется ряд эвристик, на основе наличия и взаимного соответствия которых автоматическая система может определить факт присутствия лиц на изображении.

    Достоинства эмпирических методов:

    1. Достаточно просто реализуются, не требуют мощных вычислительных ресурсов.
    2. Позволяют построить некоторую модель изображения лиц и свести задачу к выполнению некоторого количества относительно простых проверок.
    3. Возможность гибкой настройки под конкретную задачу путем модификации параметров.

    Анализ методов распознавания лиц. Практически все методы основаны на использовании локальных либо глобальных признаков лиц. При использовании локальных признаков, алгоритм выделяет отдельные части лиц (такие как глаза, нос, рот и др.) и уже по ним выделяет или распознает лицо. При использовании же глобальных признаков, алгоритм оперирует всем лицом в целом.

    К методам, основанным на глобальных признаках, относятся линейный дискриминантный анализ, метод главных компонент, независимый факторный анализ. Основа всех методов базирующихся на анализе глобальных признаков заключается в том, чтобы построить некое разбиение многомерного пространства, разделив области, принадлежащие разным людям. Это позволит определить, к какому из N классов образов принадлежит новое изображение, т.е. который из N человек изображен на нём. К ним относятся:

    pic1

    Сравнение алгоритмов распознавания лиц. [5]

    Учитывая вышеизложенное, представляется, что перспективным может являться создание гибридных методов, использующих преимущества и нивелирующих недостатки рассмотренных выше различных частных подходов. Одним из вариантов такого гибрида является использование метода Виола-Джонса для распознавания присутствующих лиц в кадре, а данный метод относится к классу методов, базирующихся на моделировании изображения лиц. Используя данный алгоритм, подсистема будет получать фрагменты изображения, содержащие исключительно набор лиц. После чего выполняется задача распознавания, для которой целесообразно использовать метод главных компонент.

    Последовательность работы такого решения заключается в пошаговом применении обоих алгоритмов. Перед началом распознавания, алгоритм обучения наполняет базу данных признаками, изъятыми из тестовых изображений. Далее алгоритм распознавания ищет объекты на разных масштабах изображения, используя созданную базы данных. Алгоритм Виолы-Джонса на выходе дает всё множество найденных необъединенных объектов на разных масштабах. Следующая задача – принять решение о том, какие из найденных объектов действительно присутствуют в кадре, а какие – дублируются.

    В качестве признаков для алгоритма используются признаки Хаара Каждая маска характеризируется размером светлой и темной областей, пропорциями, а также минимальным размером. Признаки Хаара дают точечное значение перепада яркости по оси X и Y соответственно. Поэтому общий признак Хаара для распознавания лиц представляет набор двух смежных прямоугольников. Значение признака вычисляется по формуле.

    Для уменьшения времени работы алгоритма, введено понятие каскада классификаторов. Вместо последовательного применение каждой функции к фрагменту изображения, функции группируются в различные стадии классификаторов. Полученные классификаторы будут применены один за другим. Как правило, первые классификаторы содержат меньшее количество функций. Применение классификатора к фрагменту изображения позволяет выявить признаки наличия лиц в кадре, если таковы не обнаружены, то скользящее окно продолжает движение. Если же были выявленные признаки, то применяется последующий классификатор для повышения точности определения. Фрагмент изображения, которой проходит все стадии, будет принят в качестве области, содержащей лицо.

    Как результат захвата лиц мы получаем область изображения, которую можно использовать для решения задачи распознавания. Для хранения в БД ко всем изображениям применяем метод главных компонент после захвата определенных лиц необходимо сравнить его с хранящимися в базе данных изображениями. Для того чтобы не нагружать систему, необходимо уменьшить объём изображения и исключать из них избыточную информацию.

    Метод главных компонент [6] является одним из вариантов решения описанной проблемы. Он позволяет уменьшить объём данных, не теряя при этом необходимую информацию. Он заключается в линейном ортогональном преобразовании входного вектора V размером N в выходной Е размером М, где М < N. Компоненты полученного вектора являются некоррелированными, общая дисперсия после преобразования остаётся неизменной.

    Для изображения с областью лиц вычисляются его главные компоненты. Процесс распознавания заключается в сравнении главных компонент полученного изображения с уже имеющимися. В случае применения классификатора, основанного на вычислении какой-либо метрики расстояния (Евклидово, Махалонобиса [7]), из базы данных выбираются изображения, имеющие наименьшее расстояние от входного изображения. При этом новый набор признаков может быть добавлен в БД для дальнейшего использования. Процесс сохранения признаков в БД состоит из следующих этапов:

    1. Преобразование исходного изображения в полутоновое.
    2. Применение метода Виолы-Джонса.
    3. Извлечение признаков лиц.
    4. Сохранение извлеченных признаков в БД.

    Выводы. Для решения поставленной задачи идентификации личности были проанализированы функции необходимые для работы данной системы, а именно функция определения и функция распознавания лиц. Данные компоненты чрезвычайно важны и являются основополагающими, от скорости и качества которых зависит работа системы в целом. Был выполнен сравнительный анализ существующих методов позволяющие реализовать данные функции. Выявлены положительные и отрицательные стороны каждой группы метод.

    Но основе полученной информации предложено решение, которое комбинирует использование метода Виола-Джонса для определения лиц в кадре, так как этот метод имеет высокую скорость распознавания и низкую вероятность ложного срабатывания. В качестве метода распознавания предлагается использовать метод главных компонент.

    Данное решение основано на том, что для большинства современных систем автоматического распознавания лиц основной задачей является задача сравнения заданного изображения с набором изображений лиц из базы данных. Характеристики систем автоматического распознавания лиц в этом случае оцениваются путем определения вероятностей ошибочного отказа в распознавании и ошибочного распознавания. И предложенный вариант решает эти основные задачи, так как он позволяет хранить в удобном формате информацию (набор признаков), а также имеет возможность быстро и точно определять наличие лиц в кадре при помощи использования каскада признаков.

    Направлением дальнейших исследований является задача выбора наиболее подходящего кадра из видеопотока для последующей его обработки.

    Список литературы

    1. Распознавание лиц [электронный ресурс] Википедия – свободная энциклопедия: [сайт]. [2016]. URL: https://ru.wikipedia.org/wiki/Распознавание_лиц.
    2. Кудряшов П.П. Алгоритмы обнаружения лица человека для решения прикладных задач анализа и обработки изображений: кандидат технических наук. Волгоградский гос. технический университет, Волгоград, 2007.
    3. Мясников В.В. Методы обнаружения и распознавания объектов на цифровых изображениях: учеб. пособие. / В.В. Мясников, Н.И. Глумов, В.В. Сергеев. – Самар.: Изд-во Самар. гос. аэрокосм. ун-та; 2006. – 168 с.:ил.
    4. Алгоритм Виолы-Джонса [электронный ресурс] Википедия – свободная энциклопедия: [сайт]. [2016]. URL: https://ru.wikipedia.org/wiki/Метод_Виолы_—_Джонса.
    5. Забашта А.Ю., Хохлов С.А., Скоритокова С.А. Анализ существующих алгоритмов распознавания лиц. //Серия: Естественные и технические науки №7–8 – август 2017
    6. Метод главных компонентов [электронный ресурс] Википедия – свободная энциклопедия: [сайт]. URL: https://ru.wikipedia.org/wiki/Метод_главных_компонент
    7. Расстояние Махаланобиса [электронный ресурс] // Википедия – свободная энциклопедия: [сайт]. URL: https://ru.wikipedia.org/wiki /Расстояние_Махаланобиса