Реферат по теме выпускной работы

Содержание

Введение

Распознавание лиц - это вид биометрической аутентификации. Она включает в себя обнаружение лица и сравнение его с известной моделью в базе данных по его особенностям. Это можно делать с помощью 2D или 3D сканирования в реальном времени или анализа существующих изображений. Важность этой технологии высока, так как она используется в разных областях, включая банкоматы, системы контроля доступа, поиск людей и авторизацию на смартфонах. Распознавание лиц сейчас особенно актуально из-за предпочтения безконтактных методов аутентификации. Наша работа будет оценивать методы и области применения этой технологии, а также исследовать, как организации уже используют ее и как можно расширить ее применение.

С развитием общества появилась необходимость в идентификации личности по тем или иным причинам. Уже в 1880 г. во Франции ученым Альфонсо Бертильо́н была предложена концепция идентификации преступника по его биометрии, что позволяла точно определить индивида. Это было одним из первых реализаций идентификации личности по особым предметам. В современном мире, идентификация по лицу используется в различных сферах, например: получение доступа к банковскому счету через банкомат с камерой, использование как вторичная авторизация в СКУД, поиск людей или же авторизация в личном смартфоне. Без системы распознавания лица нельзя представить себе ни одну современную систему безопасности. Ранее, в системах безопасности и СКУД в том числе были популярны биометрические считыватели, которые сканировали отпечаток пальцев сотрудников и сопоставляли с базой данных. Но в связи с обостренной ситуацией в мире, вызванной пандемией, современные решения стараются отказаться от контактного датчика, в пользу бесконтактных по гигиеническим причинам. Поэтому тема распознавания лиц сейчас является наиболее актуальной при выборе аутентификации по биометрии.

Существует множество способов идентифицировать человека по фото или видео потоку, от примитивных, до высоконадежных, используя только камеру или же используя дополнительные датчики (инфракрасные излучатели или датчики лидар). В данной работе будет разобраны ключевые алгоритмы распознавания лиц, а также представлена программа определение лица на видеопотоке.

Существующие алгоритмы распознавания лица:

  1. Метод главных компонент
  2. Метод гибкого сравнения на графах
  3. Линейный дискриминантный анализ
  4. Алгоритм Виолы– Джонса
  5. Метод опорных векторов
  6. Нейронные сети
  7. Метод сопоставления с эталоном
  8. Анализ оптических потоков
  9. Алгоритм построения деформируемых 3D моделей лица

1. Актуальность темы

В современном информационном обществе, где технологии играют ключевую роль, тема распознавания лиц человека становится неотъемлемой частью обеспечения безопасности и удобства в различных сферах. В данном реферате рассматривается актуальность и важность применения технологии распознавания лиц в различных областях, таких как безопасность, контроль доступа, медицина и развлекательная индустрия.

Безопасность и Контроль Доступа

Одним из ключевых аспектов, подчеркивающих актуальность темы, является использование систем распознавания лиц для обеспечения безопасности и строгого контроля доступа. Эти технологии успешно применяются в офисах, банках, аэропортах и других местах, где необходимо эффективно управлять доступом персонала.

Технологии Безконтактной Аутентификации

В условиях роста интереса к безконтактным методам аутентификации, распознавание лиц становится предпочтительным и безопасным способом подтверждения личности. Эта тенденция приобретает особенную актуальность в свете современных вызовов, таких как пандемия COVID-19.

Применение в Банковской Сфере

Банки и финансовые учреждения успешно внедряют технологии распознавания лиц для обеспечения безопасного доступа к банковским счетам через банкоматы и мобильные устройства. Это не только повышает безопасность, но и обеспечивает удобство клиентам.

Роль в Медицинской Сфере

Банки и финансовые учреждения успешно внедряют технологии распознавания лиц для обеспечения безопасного доступа к банковским счетам через банкоматы и мобильные устройства. Это не только повышает безопасность, но и обеспечивает удобство клиентам.

Развлекательная Индустрия и Исследования

Технологии распознавания лиц также находят свое применение в развлекательной индустрии, создавая инновационные и интерактивные пользовательские опыты. Кроме того, непрерывные исследования и разработки в этой области способствуют появлению новых методов и технологий.

Таким образом, тема распознавания лиц человека остается актуальной и востребованной, играя ключевую роль в обеспечении безопасности, эффективности и инноваций в различных сферах человеческой деятельности.

2. Цель и задачи исследования:

Цель исследования: Заключается в оценке методов и областей применения технологии распознавания лиц, а также в изучении того, как организации уже используют данную технологию и как можно расширить ее применение.

Задачи исследования:

  1. Анализ методов распознавания лиц:

    • Двухмерное распознавание лиц.
    • 3D-распознавание лиц.
    • Инфракрасное распознавание лиц.
    • Глубокое обучение распознаванию лиц.

  2. Рассмотрение областей применения технологии распознавания лиц:

    • Безопасность, включая пограничный контроль и правоохранительные органы.
    • Контроль доступа в различных системах.
    • Аутентификация на смартфонах и других устройствах.
    • Поиск людей и авторизация.

  3. Рассмотрение реальных примеров применения технологии в современных компаниях:

  4. Исследование возможности использования технологии для предотвращения опасных ситуаций:

Планируемые результаты исследования:

  1. Оценка эффективности различных методов распознавания лиц.
  2. Выявление потенциальных областей применения технологии.
  3. Анализ практического опыта компаний с внедрением технологии распознавания лиц.
  4. Разработка рекомендаций по оптимальному использованию технологии в сочетании с системой контроля доступа.
  5. Выявление перспектив использования технологии для предотвращения опасных ситуаций в различных областях.

3. Методы распознования лиц

Алгоритмы распознавания делятся на две категории, в зависимости от применяемой технологии распознавания – двумерные, [1, 2] в которых распознавание происходит по геометрии лица и трехмерные, в которых распознавание происходит по строению черепа. Также методы делятся на 3 вида:

3.1 Метод главных компонент

Метод главных компонент (МГК) представляет изображения лиц в виде набора главных компонентов, называемых «собственными лицами». Применяется линейное преобразование к исходному массиву, создавая новое направление координат, отражающее наибольший разброс данных. Первые компоненты содержат основную информацию об изображении.

Рисунок 1 – Пример изображений собственных векторов

МГК преобразует исходные переменные изображения в новое множество с меньшим числом переменных, сохраняя практически всю информацию. Расчет главных компонент включает вычисление собственных векторов и значений ковариационной матрицы. Реконструкция изображения выполняется суммой главных компонент, умноженных на соответствующие собственные вектора.

Для распознавания лиц вычисляют главные компоненты изображения, обычно от 5 до 200. Распознавание включает сравнение компонентов неизвестного изображения с известными. Недостатки включают требование к идеальным условиям и ограничения по параметрам, таким как освещение и аксессуары. Трудоемкость метода связана с обработкой большого объема данных.

Достоинства метода включают высокую точность (более 90%).

3.2 Метод гибкого сравнения на графах

Метод гибкого сравнения на графах, представленный в 1993 году в статье «IEEE Transactions on Computers, Vol. 42, No. 3», является методом перебора. Его суть заключается в эластичном сопоставлении графов, представляющих изображения лиц. Используются графы с взвешенными вершинами и ребрами, описывающие лица с использованием фильтров Габора для извлечения признаков. [3]

Основная задача метода – подгонка изменяемого графа к эталонному во время распознавания. Значения признаков вычисляются в вершинах графа после применения фильтра Габора к изображению лица. Расстояния между вершинами графа определяют веса ребер.

Для сравнения графов используется ценовая функция деформации, учитывающая различия в значениях признаков и степени деформации ребер. Деформация графа происходит путем смещения вершин до достижения минимальной разницы с эталонным графом.

Преимущества метода включают устойчивость к эмоциональным выражениям и смене ракурса лица (до 15 градусов) с точностью распознавания 90-95%. Однако метод обладает высокой вычислительной сложностью, что приводит к длительному времени распознавания, особенно при увеличении размера базы данных. Дополнительно, сложность добавления новых эталонов делает его менее эффективным в долгосрочной перспективе по сравнению с другими методами.

3.3 Алгоритм Виолы–Джонса

Хаар-подобные характеристики (Haar wavelet-like features) являются успешным методом извлечения признаков из изображений. Они основаны на сравнении яркостей в двух прямоугольных областях и характеризуются быстротой вычислений. Эти признаки позволяют описать особенности объектов, такие как изменения яркости. Примером использования таких признаков является метод Виолы — Джонса для обнаружения объектов, сначала представленный для распознавания лиц.[4]

Рисунок 2 – Пример хаар подобных характеристик

Хаар-подобные признаки позволяют описать перепады яркости, например, различия между областью глаз и областью носа на лице. Преимущество заключается в высокой скорости вычислений, особенно при использовании интегрального представления изображения, что обеспечивает постоянное время вычислений для каждого признака.[4]

Метод Виолы — Джонса использует Хаар-подобные характеристики для обнаружения объектов в реальном времени, сфокусировавшись изначально на задаче обнаружения лиц. Признаки Виолы и Джонса более сложны, чем базовые Хаар-подобные характеристики, включая несколько прямоугольных областей для описания объектов.

Для вычисления признаков используется интегральное представление изображения, что обеспечивает высокую эффективность и минимизацию ложных срабатываний. Алгоритм AdaBoost применяется для построения сложного классификатора из простых, адаптивно учитывая ошибки предыдущих классификаторов. В конечном итоге, метод Виолы — Джонса демонстрирует высокую точность и скорость обнаружения объектов, особенно лиц на изображениях размером 24 на 24 пикселя.[5, 6]

3.4 Нейронные сети

Системы, основанные на нейронных сетях, также известные как автоассоциативная память, функционируют по принципу воспроизведения наиболее близкой к входным данным сохраненной информации. В случае распознавания лиц, входные данные представляют изображение лица. Нейроны, являющиеся базовыми элементами памяти, связаны между собой, и система настраивается путем изменения весов связей в процессе обучения.[7, 8]

Анимация 3 – Обобщенные этапы процесса распознования лиц (4 кадра, 1 цикл, 81кб)

Процесс работы нейронных сетей включает оцифровку и кодирование изображения, размещение каждой координаты вектора в отдельной ячейке, связанной с другими ячейками, и фильтрацию изображений через нейросеть. На выходе получается ближайшее запомненное изображение.

Сверточные нейронные сети (CNN) представляют собой специальную архитектуру, предназначенную для эффективного распознавания изображений. Они используют особенности зрительной коры, такие как простые и сложные клетки, для обработки изображений чередованием сверточных и субдискретизирующих слоев. Обучение происходит с использованием методов, таких как обратное распространение ошибки, с выбором функции активации для нейронов. [9]

Достоинства CNN включают высокую точность распознавания (более 90%) и устойчивость к шумам во входных данных. Однако недостатки включают сложность реализации и возможность переобучения при добавлении новых данных в базу.[10]

Такие системы успешно применяются в анализе изображений лиц, включая классификацию по полу, распознавание и определение эмоциональных выражений.

Выводы

В результате анализа различных методов распознавания лиц можно сделать вывод, что каждый из них обладает своими особенностями и применяется в зависимости от конкретных задач и требований. Метод главных компонент (МГК) предоставляет высокую точность распознавания, основываясь на геометрических характеристиках лица. Метод гибкого сравнения на графах, хотя и обладает устойчивостью к эмоциональным выражениям и изменению ракурса лица, требует значительных вычислительных ресурсов. Алгоритм Виолы–Джонса благодаря хаар-подобным признакам обеспечивает высокую скорость обнаружения объектов, особенно лиц, и эффективен в реальном времени.

Нейронные сети, в частности, сверточные нейронные сети (CNN), предоставляют возможность высокоточного распознавания изображений лиц и демонстрируют устойчивость к шумам в данных. Однако их сложность в реализации и потенциальная подверженность переобучению при добавлении новых данных требуют особого внимания.

Распознавание лиц – актуальная и востребованная тема в современном обществе, охватывая различные области:

Список литературы

  1. Мищенкова Е. С. Сравнительный анализ алгоритмов распознавания лиц // Вестник Волгоградского государственного университета. Серия 9, Исследования молодых ученых. – 2013. – № 11. – С. 74–76.
  2. Гончаров А. В., Каркищенко А. Н. Влияние освещенности на качество распознавания фронтальных лиц // Известия ЮФУ. Технические науки. – 2008. – № 4 (81). – С. 88–92.
  3. Арсентьев Д. А., Бирюкова Т. С. Метод гибкого сравнения на графах как алгоритм распознавания образов // Вестник МГУП имени Ивана Федорова. – 2015. – № 6. – С. 74–75.
  4. Фан Н. Х., Буй Т. Т. Ч., Спицын В.Г. Распознавание жестов на видеопоследовательности в режиме реального времени на основе применения метода Виолы–Джонса, алгоритма CAMShift, вейвлет-преобразования и метода главных компонент // Вестник Томского государственного университета. – 2013. – Т. 23, № 2. – С. 102–111.
  5. Рогозин О. В., Кладов С.А. Сравнительный анализ алгоритмов распознавания лиц в задаче визуальной идентификации // Инженерный журнал: наука и инновации. – 2013. – № 6 (18). – DOI: 10.18698/2308-6033-2013-6-818.
  6. Буй Т. Т. Ч., Фан Н. Х., Спицын В. Г. Распознавание лиц на основе применения метода Виолы–Джонса, вейвлет-преобразования и метода главных компонент // Известия Томского политехнического университета. – 2012. – Т. 320, № 5. – С. 54–59.
  7. Усилин С. А. Алгоритмическое развитие виола–джонсовских детекторов для решения прикладных задач распознавания изображений: дис. ... канд. техн. наук. – М., 2017. – 149 с.
  8. Самаль Д. И., Фролов И.И. Алгоритм подготовки обучающей выборки с использованием 3D-моделирования лиц // Системный анализ и прикладная информатика. – 2016. – № 4. – С. 17–23.
  9. Тропченко А. А., Тропченко А. Ю. Нейросетевые методы идентификации человека по изображению лица // Известия высших учебных заведений. Приборостроение. – 2012. – Т. 55, № 10. – С. 31–36.
  10. Скопченко А. А., Дорофеев В. А. Анализ методов распознавания лиц // Технологии Microsoft в теории и практике программирования: сборник трудов XIII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых, 22–23 марта 2016 г. – Томск, 2016. – С. 176–178.
  11. Багликов В. Г. Актуальность разработки компьютерной подсистемы биометрической идентификации личности по фотопортрету: автореф. дис. канд. мед. наук. – М.: 2008. – 5 с.