UA   EN

Реферат

  1. Введение
  2. 1. Актуальность темы
  3. 2. Цель и задачи исследования, планируемые результаты
  4. 3. Обзор исследований и разработок
  5. 4. Анализ методов распознавания лиц.
  6. Выводы
  7. Список литературы

Введение

Объектом компьютеризации является система видеонаблюдения. Видеонаблюдение успешно применяется в местах большого скопления людей – в аэропортах, различных супермаркетах, автостоянках. В этом случае системы позволяют производить круглосуточный контроль ситуации и мгновенно информировать о непредвиденных ситуациях. Благодаря такому использованию систем видеонаблюдения, значительно снижается возможность возникновения опасных для жизни человека ситуаций.

В связи с выше сказанным, можно сделать вывод, что это одно из самых эффективных технических средств обеспечения безопасности, позволяющих оперативно зафиксировать факт совершения того или иного противоправного деяния.

1. АКТУАЛЬНОСТЬ ТЕМЫ

На текущий момент существует множество различных методов и алгоритмов, которые позволяют обработать изображение и получить информацию о присутствующих на ней лицах. Для выбора оптимального решения в условиях решаемой задачи распознавание лиц.

Распознавание лиц – задача, которую человек выполняет без особых усилий несколько раз в день. Это одна из ключевых биометрических технологий. Распознавание лиц имеет ряд преимуществ перед другими биометрическими технологиями: это естественность, доступность и простота в использовании. Исходя из этого, вопрос улучшения и модернизации данного типа систем распознавания является актуальным.

2. ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ

Цель данной работы – повысить уровень безопасности путем интеграции идентификации личности посредством портретной экспертизы в системы видеонаблюдения.

Для этого необходимо: исследовать предметную область, проанализировать существующие методы решения подобных задач, выделить их достоинства и недостатки, выбрать наиболее перспективные методы решения для данной задачи, проанализировать результаты их применения и выбрать наилучший из них.

Сформированный ряд задач для достижения поставленной цели:

  1. Обоснование и выбор алгоритмов определения и захвата лица.
  2. Обоснование и выбор методов распознавания лица.
  3. Проектирование системы и средств получения и хранения видеоматериалов.
  4. Реализация системы, апробация и анализ полученных результатов.

Задача идентификации личности является достаточно сложной, особенно для задач без ограничений, когда точку обзора, освещение, выражение лица, заграждения, аксессуары и т.д. могут существенно изменяться. Лицо, как трехмерный объект, должно быть идентифицировано на основе его двумерного изображения. При этом изображение лица может изменяться при изменении освещения, позы, выражения и т.д. Типичная система распознавания лиц состоит из четырех этапов:

  1. Определение и захват лиц.
  2. Выравнивание. Предобработка изображения.
  3. Извлечения признаков. Уменьшение объема данных без потери информации.
  4. Распознавание. Сравнение ключевых признаков.

Результаты задачи распознавания лиц значительно зависят от извлекаемых признаков и методов классификации. Представление в виде таблицы данной задачи.

Задача Исх. данные Результат
Обнаружение Изображение Вынесение решения о наличии (и возможно о количестве) лиц на изображении, определение их положения
Распознавание Фрагмент с одним лицом Кандидаты из имеющейся базы данных, ключевые признаки которых приближены к данным текущего фрагмента.

При построении автоматической системы обнаружения лиц необходимо учитывать следующие особенности, усложняющие задачу:

  1. Сильно варьирующийся внешний вид лица у разных людей.
  2. Небольшое изменение ориентации лица влечет за собой серьезное изменение изображения лица.
  3. Возможное присутствие индивидуальных особенностей существенно осложняет автоматическое распознавание.
  4. Изменение выражения лица.
  5. Часть лица может быть невидима на изображении.
  6. Изменение условий съемки значительной степени влияют на получающееся изображение лица.

3. АНАЛИЗ РАБОТ

Задача распознавания лиц актуальна как в области интеллектуальных сред, так и в системах безопасности. Например, в текущем году система распознавания лиц, разработанная в пекинском университете Циньхуа (Tsinghua University), была сертифицирована китайским Министерством общественной безопасности для использования в общественных местах. Японское отделение компании Omron, специализирующееся на технологиях распознавания, автоматизации и управления, разработало систему распознавания лица человека для мобильных телефонов. Компания Riya, основанная группой специалистов в области алгоритмов распознавания черт лица из Стэнфордского университета, начала открытое тестирование Web сервиса контекстного поиска изображений лиц в цифровых фотоальбомах. Компания A4Vision заявляет о том, что Федеральная служба охраны при Департаменте внутренней безопасности США внедрила её биометрическую технологию трехмерного распознавания лиц [1].

3.1 Глобальный обзор

Ведущие мировые компании области информационных технологий, такие как Google, Microsoft, Facebook Apple, Intel cоздали отделы по разработке библиотек распознавания личностей. В сентябре 2017 г. стало известно, что ученые Индии и Великобритании научили нейронную сеть распознавать преступников с предметами маскировки [5].

Компания FaceBook, разработала алгоритм под названием DeepFace, которая позволит визуально анализировать, сравнивать и идентифицировать человеческие лица с невероятно высокой точностью (до 97,25 %). DeepFace будет использовать технику 3D-моделирования для сканирования объекта, но сам алгоритм строится на основе процесса фронтализации, то есть изменения угла изображения таким образом, чтобы лицо человека смотрело прямо вперед. Затем полученные данные переводятся в числовое значение и обрабатываются для последующего сравнения. На данный момент, DeepFace проходит этапы тестирования, для которого FaceBook уже идентифицировали порядка 4 млн фотографий своих пользователей [3].

Компанией Google была разработана открытая программная библиотека для машинного обучения под названием TensorFlow. Она позволяет решать задачи построения и тренировки нейронной сети с целью автоматического нахождения и классификации образов, достигая качества человеческого восприятия. В то время как эталонная реализация работает на единичных устройствах, TensorFlow может работать на многих параллельных процессорах, как CPU, так и GPU.

Библиотека алгоритмов от Google инструктирует нейронные сети воспринимать информацию и рассуждать подобно человеку, так что новые приложения изначально обладают такими человеческими качествами. Само название TensorFlow происходит от названия операций, которые эти нейросети осуществляют над многомерными массивами данных. Эти многомерные массивы именуются тензорами, как одноимённые математические объекты, линейно преобразующие элементы одного линейного пространства в элементы другого. Задача TensorFlow – учить нейросети обнаруживать и распознавать паттерны и корреляции в массивах данных [6].

OpenCV – библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым кодом. Реализована на C/C++, также разрабатывается для Python, Java, Ruby, Matlab, Lua и других языков. Может свободно использоваться в академических и коммерческих целях – распространяется в условиях лицензии BSD [4]. OpenCV предоставляет различные классификаторы, которые можно использовать для распознавания лиц, глаз, автомобилей, и многих других объектов. Эти классификаторы, однако, достаточно просты, они не обучены с использованием технологий машинного обучения, поэтому, при распознавании лиц точность составит примерно в 80 % [2].

3.2 Национальный обзор

Российские технологии распознавания лиц Алгоритм идентификации лиц, созданный российской компанией Вокорд, признан самым эффективным в мире по версии авторитетной мировой тестовой онлайн-площадка MegaFace.

По итогам тестов алгоритм Vocord DeepVo1 распознал правильно 75,127% лиц, что является лучшим результатом в мире на сегодняшний день.

Алгоритм распознавания образов Vocord DeepVo1 основан на использовании технологий глубоких нейронных сетей. Технология позволяет выделить лица людей в видеопотоке, сравнить выделенные лица с лицами в эталонных базах и распознавать их в реальном времени, предупреждая оператора о совпадении.

pic1

Рисунок 1. Пример работы системы разпознавания Vocord [9]

Технология также позволяет сохранять в архиве все фотографии выделенных лиц, вести поиск в архиве по базе сохраненных лиц и распознавать пол, возраст, частоту посещений и предоставлять отчеты по этим срезам.

Алгоритм Vocord DeepVo1 показал лучшие результаты в мировом тестировании в категории по идентификации лиц. Согласно правилам тестирования, компьютерная программа должна правильно выбрать изображение лица человека из миллиона тестовых фотографий, поставив его лицо на первое место по степени похожести на эталон (базу фотографий людей, заданных для сравнения) [9].

Рейтинг MegaFace позволяет оценивать существующие алгоритмы распознавания лиц на большом количестве изображений. Технология создана в рамках проекта Исследование и разработка программно-аппаратных средств идентификации человека по индивидуальным особенностям с применением стереовидения.

Суть новой технологии на первый взгляд довольно проста: компьютерная программа обнаруживает (детектит, как говорят разработчики) на видеоизображении человеческое лицо. Затем по косвенным признакам распознаёт эмоции, характерные для объекта наблюдения. Отдельный модуль программно-аппаратного макета, разработанного в рамках ФЦП, представляет собой алгоритм идентификации человека по походке.

Главное отличие новой разработки от западных аналогов в том, что для распознавания объекта не требуется помещать его в какую-то определённую зону. Также система может распознать человека, чье лицо частично скрыто (например, террориста в маске, когда видны только его глаза) [10].

Правда детекция в таких случаях срабатывает лишь на некоторых кадрах. Распознать объект видеоизображения на пёстром фоне непросто. Даже видео – и фотоустройства таких гигантов, как Sony и Fuji, не могут похвастаться высоким уровнем детекции, которая определяется балансом между количеством правильно принятых образов и ложными срабатываниями.
Существует видеоролик, в котором колоритный афроамериканец выражат свое недовольство, что IP-камеры одного известного производителя его не распознают,These cameras are racists!. Так вот, данная проблема учтена в новой разработке. Система распознаёт и афроамериканцев, и китайцев, и индусов, и многих других людей с разными типами внешности.

3.3 Локальный обзор

Среди магистерских работ ДонНТУ можно выделить работу Колесник А. В.Распределенная программная система для распознавания изображений [8]. В этой работе описана разработка специализированной компьютерной системы, которая направлена на решение ряда задач, рассмотренных выше. Внешний вид системы приведен на рисунке 2.

pic1

Рисунок 2. Интерфейс приложения [8]

4. Анализ методов распознавания лиц.

Практически все методы основаны на использовании локальных либо глобальных признаков лиц. При использовании локальных признаков, алгоритм выделяет отдельные части лиц (такие как глаза, нос, рот и др.) и уже по ним выделяет или распознает лицо. При использовании же глобальных признаков, алгоритм оперирует всем лицом в целом.

Методы, основанные на локальных признаках, так или иначе, локализуют характерные участки лиц и уже на их основе выполняют дальнейшую обработку. Недостатки данной группы в следующем:

Популярными представителями данных методов являются метод сравнения эластичных графов и нейронные сети.

К методам, основанным на глобальных признаках, относятся линейный дискриминантный анализ, метод главных компонент, независимый факторный анализ. Основа всех методов базирующихся на анализе глобальных признаков заключается в том, чтобы построить некое разбиение многомерного пространства, разделив области, принадлежащие разным людям. Это позволит определить, к какому из N классов образов принадлежит новое изображение, т.е. который из N человек изображен на нём. К ним относятся:

Сравнительный анализ методов распознавания [7].

Метод Точность распознавания Влияние мимики на точность распознавания Время распознавания Вычислительная сложность
Гибкого сравнения на графах ~90% низкое ++ ++
Главных компонент ~90% высокое + +
Нейронные сети >90% низкое + +
Виолы-Джонса >90% низкое + +

Учитывая вышеизложенное, представляется, что перспективным может являться создание гибридных методов, использующих преимущества и нивелирующих недостатки рассмотренных выше различных частных подходов. Одним из вариантов такого гибрида является использование метода Виола-Джонса для распознавания присутствующих лиц в кадре, а данный метод относится к классу методов, базирующихся на моделировании изображения лиц. Используя данный алгоритм, подсистема будет получать фрагменты изображения, содержащие исключительно набор лиц. После чего выполняется задача распознавания, для которой целесообразно использовать метод главных компонент.

ВЫВОДЫ

Но основе полученной информации предложено решение, которое комбинирует использование метода Виола-Джонса для определения лиц в кадре, так как этот метод имеет высокую скорость распознавания и низкую вероятность ложного срабатывания. В качестве метода распознавания предлагается использовать метод главных компонент.

Данное решение основано на том, что для большинства современных систем автоматического распознавания лиц основной задачей является задача сравнения заданного изображения с набором изображений лиц из базы данных. Характеристики систем автоматического распознавания лиц в этом случае оцениваются путем определения вероятностей ошибочного отказа в распознавании и ошибочного распознавания. И предложенный вариант решает эти основные задачи, так как он позволяет хранить в удобном формате информацию (набор признаков), а также имеет возможность быстро и точно определять наличие лиц в кадре при помощи использования каскада признаков.

Направлением дальнейших исследований является задача выбора наиболее подходящего кадра из видеопотока для последующей его обработки.

ЗАМЕЧАНИЯ

На момент написания данного реферата магистерская работа еще не завершена. Предполагаемая дата завершения: май 2019 г. Полный текст работы, а также материалы по теме могут быть получены у автора или его руководителя после указанной даты.

ИСТОЧНИКИ

  1. Елистратов С.А., Козлова Ю.Б. Интеллектуальные системы распознавания образов: современное состояние и проблемы реализации // Решетневские чтения. 2017. №21-2. URL: ttps://cyberleninka.ru/article/n/intellektualnye...
  2. Веб-камера, Node.js и OpenCV: делаем систему распознавания лиц [Электронный ресурс]. URL: https://habrahabr.ru/company/ruvds/blog/335770/
  3. Программа Deepface – определяет лица почти как живой человек [Электронный ресурс]. URL: http://www.sciencedebate2008.com/deepface-defines-a-personas-a-living-person/
  4. Распознаем лица на фото с помощью Python и OpenCV [Электронный ресурс]. URL: https://habrahabr.ru/post/301096/
  5. Распознавание образов [Электронный ресурс]. URL: http://ai-news.ru/raspoznavanieobrazov.html
  6. TensorFlow [Электронный ресурс]. URL: https://www.tensorflow.org/
  7. Забашта А.Ю., Хохлов С.А., Скоритокова С.А. Анализ существующих алгоритмов распознавания лиц. //Серия: Естественные и технические науки №7-8 –август 2017 http://www.vipstd.ru/index.php/
  8. Колесник А. В., Ладыженский Ю. В. Распределенная система распознавания лиц на основе геометрических характеристи//Персональный сайт на портале магистров ДонНТУ, 2010 г. URL: http://masters.donntu.ru/2010/fknt/kolesnik/library/index.htm.
  9. Новостной портал Zoom URL: http://zoom.cnews.ru/soft/news/top/2016-09-05_rossijskaya_tehnologiya_raspoznavaniya_lits_okazalas.
  10. Find Face [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/FindFace.