Назад в библиотеку

УДК 004.93

 

ИССЛЕДОВАНИЕ ТРЕБОВАНИЙ И ТЕХНОЛОГИЙ РАСПОЗНАВАНИЯ ЛИЦ

В РАМКАХ СКУД ДЛЯ АПТЕЧНОГО СКЛАДА

Яковлев М.Ю., Светличная В.А.

Донецкий национальный технический университет

кафедра автоматизированных систем управления

E-mail: mark.yakovlev.02@bk.ru

 

Аннотация:

Яковлев М.Ю., Светличная В.А. Исследование требований и технологий распознавания лиц в рамках СКУД для аптечного склада. Статья посвящена предварительному исследованию технологии распознавания лиц в контексте системы контроля и управления доступом в условиях аптечного склада. Рассмотрены особенности объекта автоматизации, структура системы, а также различные методы и подходы к распознаванию лиц. Определены цели и требования к разрабатываемой системе.

Ключевые слова: система контроля и управления доступом, обеспечение безопасности, распознавание лиц, нейронные сети, биометрия.

Annotation:

Yakovlev M.Yu., Svetlichnaya V.A. Study of requirements and technologies for facial recognition within the framework of access control systems for a pharmacy warehouse. The article is devoted to a preliminary study of facial recognition technology in the context of an access control and management system in a pharmacy warehouse. The features of the automation object, the structure of the system, as well as various methods and approaches to face recognition are considered. The goals and requirements for the system being developed are determined.

Keywords: access control and management system, security, face recognition, neural networks, biometrics.

Введение

В современном мире безопасность и контроль доступа к ресурсам становятся все более важными аспектами в различных сферах деятельности. Использование компьютерного зрения в области обеспечения безопасности даёт огромный толчок к совершенствованию современных систем контроля и управления доступом (СКУД). СКУД на предприятиях позволяют автоматизировать процесс контроля пропуска сотрудников на объекты и анализировать их время нахождения там. Автоматизированный контроль позволяет не только устанавливать индивидуальные правила доступа для каждого отдельного сотрудника, но и также производить мониторинг его деятельности в том или ином помещении. В системе сохраняется информация о том, когда сотрудник пришел или ушел, его должность, уровень доступа, количество времени, проведенное на объекте.

Технология распознавания лиц планомерно внедряется во многие технологические процессы, в том числе и в системы безопасности. Системы управления доступом, основанные на биометрическом распознавании лиц, представляют собой инновационное решение, которое позволяет определять и идентифицировать пользователей на основе их уникальных физиологических характеристик, таких как геометрия лица.

Описание объекта автоматизации

Разрабатываемая автоматизированная система контроля и управления доступом рассматривается в контексте аптечного склада.

Аптечный склад представляет собой ключевое звено в инфраструктуре медицинских учреждений, где осуществляется хранение, обработка, распределение и отпуск лекарственных препаратов и медицинских товаров. Подобные склады обладают рядом особенностей, делающих их уязвимыми для различных видов рисков.

На складах хранится значительное количество медицинских препаратов, чья стоимость может быть высока, а сроки годности - ограниченными. Лекарства могут подвергаться риску порчи или утраты эффективности при нарушении температурного режима или неправильном хранении. В случае доступа несанкционированных лиц к данным препаратам, это может привести к серьезным последствиям для пациентов и ущербу для медицинской организации. Также склады содержат значительные запасы лекарственных препаратов, включающие в свой состав наркотические и психотропные вещества, которые являются объектами повышенного интереса для несанкционированных лиц.

Кроме непосредственно фармацевтических товаров, аптечные склады часто содержат данные о лекарствах, пациентах и другой конфиденциальной информации, требующей защиты от несанкционированного доступа. Утечка таких данных может повлечь за собой серьезные юридические и репутационные последствия для медицинской организации.

В свете этих факторов становится очевидной необходимость внедрения системы контроля доступа, учитывающей специфику организации функционирования аптечных складов и обеспечивающей высокий уровень безопасности на них. На сегодняшний день в СКУД существует множество разнообразных методов и подходов, каждый из которых предоставляет свои уникальные преимущества и решает конкретные задачи. Наиболее распространённым вариантом СКУД является пропускная система на основе ключ-карт с RFID-метками. Однако, практика показывает, что такой вид контроля имеет ряд недостатков, которые могут провоцировать уязвимости, связанные с несанкционированным доступом к ресурсам охраняемого объекта. Основным недостатком является возможность утери или кражи карт и следующий за этим проход по чужой карте.

Для повышения уровня безопасности и эффективности контроля доступа может потребоваться использование дополнительных мер защиты, включая более надежные методы аутентификации, такие как технология распознавания лиц.

Помимо вышеперечисленных рисков, существуют характерные особенности аптечных складов, которые накладывают дополнительные требования к организации системы безопасности для таких объектов.

Прежде всего, объект разделен на зоны хранения. Другими словами, на раздельные помещения для хранения разных типов лекарственных средств, таких как рецептурные, безрецептурные, наркотические, психотропные препараты и прочие Второй особенностью является деление всего персонала на отдельные группы, доступ которых разрешен или запрещен в соответствующие зоны хранения. Также для различных сотрудников, имеющих доступ в определенные зоны хранения, могут быть определены временные промежутки. Кроме этого, специфика работы на рассматриваемом объекте такова, что персонал за время смены несколько раз может входить и выходить из зоны хранения для передвижения лекарственных средств в пределах всего склада или даже вне его.

С учетом всех особенностей, которые необходимо учитывать при разработке СКУД, система управления доступом на основе технологии распознавания лиц представляется наиболее эффективным решением в силу своей точности, надежности и возможности быстрой идентификации персонала без необходимости физического контакта.

Целью разработки является создание безопасной и эффективной системы контроля и управления доступом на основе технологии распознавания лиц, соответствующей высоким стандартам функциональности и безопасности.

Приведём в соответствие основные классические требования СКУД с использованием идентификации лиц и требования, вытекающие из особенностей аптечного склада. 

-       Идентификация личности. Система должна быть способна точно идентифицировать личность сотрудников на основе их лицевых характеристик. Обычно это включает распознавание лиц с различными углами обзора, при изменении освещения и в различных условиях окружающей среды. При использовании в условиях аптечного склада эти требования значительно упрощаются, т.к. сотрудник для идентификации становится на определенное освещенное место.

-       Быстродействие. Система должна работать быстро и эффективно, обеспечивая моментальный доступ сотрудников к необходимым помещениям без задержек. Учитывая тот факт, что в определенные зоны входит ограниченное количество сотрудников, требование к быстродействию также значительно уменьшается.

-       Высокая точность. Точность распознавания лиц должна быть на высоком уровне, чтобы исключить возможность ошибок и несанкционированного доступа, это требование остается востребованным в рассматриваемой системе.

Технология распознавания лиц

Тенденции развития рынка и науки в области обеспечения безопасности показывают, что интерес к системам управления доступом на основе технологии распознавания лиц продолжает расти. С появлением новых алгоритмов машинного обучения и развитием компьютерного зрения, эти системы становятся все более точными, быстрыми и доступными для широкого круга пользователей.

Технология распознавания лиц в области обеспечения безопасности представляет собой метод идентификации личности человека на основе его уникальных лицевых характеристик. Эта технология использует специальные алгоритмы и программное обеспечение для сбора, анализа и сравнения данных о лице человека с заранее сохраненными образцами в базе данных.

Основные компоненты системы:

1.                  Источник изображений (камеры). IP-камеры, веб-камеры или другие устройства, захватывающие изображения лиц для дальнейшей обработки.

2.                  Программное обеспечение:

·         Детектор. Обнаруживает лица на изображениях или видеопотоке.

·         Нормализатор. Проводит предварительную обработку изображений для стандартизации их формата и размеров.

·         Экстрактор лицевых признаков. Извлекает характеристики из лицевых изображений для дальнейшего сравнения [2].

3.                  Модуль анализа и сравнения. Анализирует изображения лиц и сравнивает их с эталонными данными в базе данных, определяет сходство лиц.

4.                  Модуль принятия решений. Принимает решения на основе результатов анализа, определяет, разрешить ли доступ человеку или нет.

5.                  База данных лиц эталонов. Хранит изображения лиц и связанную с ними информацию, такую как имена, идентификаторы и другие данные.

По типу используемой информации о лице системы распознавания лиц подразделяются на две основные категории: 2D и 3D.

2D-распознавание лиц. В основе технологии 2D (двумерного) распознавания лиц, лежат плоские двухмерные изображения. Алгоритмы распознавания лиц используют: антропометрические параметры лица, графы-модели лиц или эластичные 2D-модели лиц, а также изображения с лицами, представленные некоторым набором физических или математических признаков. Распознавание 2D изображений одна из наиболее востребованных технологий на данный момент. Так как основные базы данных идентифицированных лиц, накопленные в мире - именно двухмерные, и основное оборудование, уже установленное, по всему миру тоже 2D. Наличие готовых баз данных лиц эталонов, и готовой инфраструктуры и является основным преимуществом 2D распознавания лиц. А вот недостатком являются более высокие коэффициенты ошибок FAR и FRR по сравнению с 3D распознаванием лиц.

3D-распознавание лиц. 3D распознавание производится как правило по реконструированным трехмерным образам. Технология 3D распознавания лиц имеет более высокие качественные характеристики, однако тоже не является идеальным решением. Существует несколько разнообразных технологий 3D сканирования. Это могут быть лазерные сканеры с оценкой дальности от сканера до элементов поверхности объекта, специальные сканеры со структурированной подсветкой поверхности объекта и математической обработкой изгибов полос, сканеры, обрабатывающие фотограмметрическим методом синхронные стереопары изображений лиц. Одним из наиболее исследованных потребителями и экспертами 3D сканеров является знаменитый Face ID, от компании Apple. Опыт использования Face ID крайне интересен и показателен, потому что, по сути, это единственное устройство с технологией 3D распознавания лиц выпущенное на масс-маркет. Преимуществами данного распознавания являются большая точность и меньшее количество ошибок пока недостижимое для 2D систем. Недостатки это: возможность подделки, необходимость в дорогостоящих специальных камерах для сканирования, отсутствие готовых баз данных идентифицированных лиц (по сравнению с 2D распознаванием).

По структурной реализации системы распознавания лиц разделяют на 3 схемы:

1.      Анализ видеопотока на сервере.

Наиболее распространенная схема реализации — IP-камера передает видеопоток на сервер, где специализированное ПО выполняет анализ и сравнение полученных из видеопотока изображений лиц, с базой лиц эталонов.

Схема реализации представлена на рисунке 1.

 


 
Рисунок 1 – Схема анализа видеопотока на сервере

 

Недостатками такой схемы будут высокая нагрузка на сеть, высокая стоимость сервера и ограниченное количество IP-камер, которые можно подключить к серверу. Преимуществом является возможность использования существующей системы видеонаблюдения.

2.      Анализ видеопотока на IP-камере.

В данном варианте анализ изображения производится непосредственно на самой камере, а на сервер передаются обработанные метаданные полученного изображения.

Схема реализации представлена на рисунке 2.

 

 Рисунок 2 – Схема анализа видеопотока на IP-камере

 

Недостатками такой схемы являются необходимость специальных камер и их высокая стоимость. Преимуществом является возможность подключения практически неограниченного количества камер к одному серверу.

3.      Анализ видеопотока на устройстве контроля доступа

В такой схеме камера встроена в устройство контроля доступа, которое кроме распознавания лица, происходящего на устройстве, выполняет также функции управления доступом, как правило, через турникет или электрозамок, установленный на дверь. База данных лиц эталонов хранится на устройстве, уже не в виде фотоизображений.

Схема реализации представлена на рисунке 3.

Рисунок 3 – Схема анализа видеопотока на устройстве контроля доступа

 

Недостатками такой схемы является то, что устройства обычно предназначены для использования в помещениях. Преимуществом является их низкая стоимость по сравнению с системами видеонаблюдения [3].

Анализ подходов распознавания лиц

Несмотря на разнообразие существующих подходов, можно определить общий алгоритм распознавания лиц, который представлен на рисунке 4.

Рисунок 4 – Общий процесс обработки изображения лица при распознавании

 

На первом этапе производится детектирование и локализация лица на изображении. Далее производится предобработка изображения – выравнивание лица (геометрическое и яркостное) и нормализация (размер, поза, масштаб, ориентация).   После этого происходит вычисление признаков и непосредственно распознавание – сравнение вычисленных признаков с заложенными в базу данных эталонами. Основным отличием всех алгоритмов будет вычисление признаков и сравнение их совокупностей между собой. Рассмотрим несколько основных подходов распознаванию.

Метод гибкого сравнения на графах. Этот метод представляет лица в виде графов с взвешенными вершинами и ребрами. В процессе распознавания один граф (эталонный) остается неизменным, в то время как другой граф деформируется для наилучшего совпадения с первым. Вершины графа представляются значениями признаков, обычно вычисленными с использованием фильтров Габора или Габоровских вейвлетов. Ребра графа взвешиваются расстояниями между смежными вершинами. Для сопоставления двух графов происходит деформация графа путем смещения вершин на определенное расстояние с учетом их исходного местоположения. Затем вычисляется мера различия между значениями признаков вершин деформированного и эталонного графов. Эта операция повторяется для всех вершин до получения наименьшего различия между графами. Преимущества метода включают высокую эффективность распознавания даже при наличии эмоциональных выражений и изменении ракурса лица. Однако его недостатками являются высокая вычислительная сложность и линейная зависимость времени работы от размера базы данных лиц.

Скрытые Марковские модели. Скрытые Марковские модели (СММ) с дискретным временем представляют собой один из статистических методов распознавания лиц. Они используют статистические свойства сигналов, учитывая их пространственные характеристики. Модель состоит из множества скрытых состояний, множества наблюдаемых состояний, матрицы переходных вероятностей и начальной вероятности состояний. Для каждого объекта существует своя Марковская модель, и при распознавании объекта проверяется максимальная вероятность того, что последовательность наблюдений для данного объекта сгенерирована соответствующей моделью. Однако на сегодняшний день не удалось обнаружить примеры коммерческого применения СММ для распознавания лиц. Среди недостатков этого метода можно выделить необходимость подбора параметров модели для каждой базы данных и отсутствие различающей способности. Это означает, что алгоритм обучения лишь максимизирует отклик каждого изображения на свою модель, но не минимизирует отклик на другие модели.

Нейронные сети. На сегодняшний день существует множество разновидностей нейронных сетей (НС), однако одной из наиболее широко используемых является сеть, построенная на многослойном перцептроне, которая позволяет классифицировать поданное на вход изображение в соответствии с предварительной настройкой/обучением сети. Обучение нейронных сетей происходит на наборе обучающих примеров, где настраиваются веса межнейронных связей методом градиентного спуска. В процессе обучения автоматически извлекаются ключевые признаки и устанавливаются взаимосвязи между ними. После обучения сеть способна применить полученный опыт к новым данным за счет своих обобщающих способностей.

Наилучшие результаты в области распознавания лиц показала Convolutional Neural Network или сверточная нейронная сеть (СНС), которая является логическим развитием идей таких архитектур НС как когнитрона и неокогнитрона. Успех обусловлен возможностью учета двумерной топологии изображения, в отличие от многослойного перцептрона. Она обладает локальными рецепторными полями, общими весами и иерархической организацией с пространственным сэмплингом. Благодаря этим особенностям СНС обеспечивает частичную устойчивость к различным искажениям и достигает высокой точности распознавания [4].

В настоящее время существует целый ряд нейронных сетей для распознавания лиц, которые находятся в открытом доступе. Эти модели разработаны различными ведущими исследовательскими группами и компаниями и предлагают разнообразные алгоритмы и архитектуры, оптимизированные для точного и быстрого распознавания лиц. Они широко используются в различных приложениях, начиная от систем безопасности и заканчивая социальными сетями и мобильными устройствами. Доступность таких сетей позволяет исследователям и разработчикам интегрировать передовые технологии распознавания лиц в свои проекты без необходимости создания моделей с нуля. Изучение и анализ подобных моделей открывает перспективы для будущих исследований в области распознавания лиц и развития более эффективных систем управления доступом. В дальнейшем планируется исследовать и проанализировать некоторые из этих моделей более тщательно, чтобы определить их преимущества и недостатки, а также адаптировать их для использования в системе управления доступом на аптечном складе. Рассмотрим наиболее популярные и эффективные нейросети для распознавания лиц, которые находятся в открытом доступе.

ArcFace - разработан Alibaba Group. Эта модель для распознавания лиц использует концепцию арки косинуса, что позволяет улучшить точность идентификации путем создания пространства признаков, где различия между лицами становятся более выразительными. ArcFace широко применяется в коммерческих системах видеонаблюдения и аутентификации.

FaceNet, созданный Google, известен своей способностью создавать векторные представления для лиц, что делает его эффективным инструментом для распознавания лиц. Эта модель обучается с использованием триплетных потерь, что позволяет ей эффективно изучать пространственные признаки лиц. FaceNet показывает хорошие результаты в условиях различных изменений, таких как изменения освещения, масштаба и поворотов.

VGGFace, разработанный Visual Geometry Group (VGG) при Университете Оксфорд, представляет собой набор моделей глубокого обучения, созданных для распознавания и классификации лиц. Эти модели известны своей простой архитектурой и высокой точностью. VGGFace широко применяется в научных и коммерческих проектах, требующих точного распознавания лиц.

DeepFace – это технология распознавания лиц, разработанная Facebook. Она использует сверточные нейронные сети для распознавания лиц на изображениях. DeepFace может распознавать лица с высокой точностью, даже при изменениях в угле обзора или освещении.

MTCNN (Multi-task Cascaded Convolutional Networks), модель для обнаружения лиц, разработанная для одновременного выполнения нескольких задач, таких как обнаружение лиц, обнаружение ключевых точек лица и оценка ограничивающих рамок для лиц. MTCNN широко применяется в системах видеонаблюдения и безопасности.

Каждая из моделей имеет свои плюсы и минусы, а также уникальные характеристики и особенности. Возникает задача выбора подходящей нейронной сети, такой, чтобы она удовлетворяла всем поставленным требованиям проекта. Важно учитывать такие критерии, как точность распознавания, скорость работы, доступность ресурсов и поддержка сообщества разработчиков.  

Несмотря на свою эффективность, нейронные сети имеют свои недостатки. Например, добавление нового лица в базу данных требует полного переобучения сети на всем наборе данных, что может быть длительным процессом. Также существуют проблемы математического характера, такие как попадание в локальные оптимумы, выбор оптимального шага оптимизации и переобучение. Кроме того, следует помнить, что этап выбора архитектуры сети (количество нейронов, слоев, характер связей) трудно формализуемый.

Заключение

В ходе исследований, предшествующих разработке системы управления доступом на основе распознавания лиц для аптечного склада, была рассмотрена специфика объекта, возможные подходы, методы и технологии решения задачи.

Определены требования к аспектам системы, которые отличаются от классических требований при распознавании образов. Результаты исследований позволят использовать полученные выводы при дальнейшей разработке системы управления доступом.

Литература

 

1.      Марьенков А.Н. Применение технологий распознавания лиц в системах контроля и управления доступом / Марьенков А.Н., Кузнецова В.Ю., Гелагаев Т.М. // Прикаспийский журнал: управление и высокие технологии – 2021 – № 1– С. 83–90.

2.      Как на самом деле работает распознавание лиц [Электронный ресурс] URL: https://habr.com/ru/companies/ntechlab/articles/586770/ (дата обращения: 03.05.2024).

3.      Технология распознавания лиц «А» до Я» [Электронный ресурс] URL: https://securityrussia.com/blog/face-recognition.html#6 (дата обращения: 05.05.2024).

4.      Анализ существующих подходов к распознаванию лиц [Электронный ресурс] URL: https://habr.com/ru/companies/synesis/articles/238129/ (дата обращения: 09.05.2024).