УДК. 004.8
РАСПОЗНАВАНИЕ ОБРАЗОВ НА ОСНОВЕ СВЁРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ
Костецкая Г.Ю, Федяев О.И.
Донецкий национальный технический университет
Сб. трудов Международной студенческой научно-технической конференции «Информационные управляющие системы и компьютерный мониторинг» — Донецк: ДонНТУ, 2009. — с. 157-178.
В этой работе рассматривается возможность применения сверточной нейронной сети (СНС) для автоматической идентификации образов[1]. В качестве образов рассматриваются изображения лиц.
Автоматическая идентификация личности человека по его изображению имеет широкое коммерческое и научное применение. Актуальность этой задачи, а также ее предпочтительность по сравнению с другими средствами идентификации личности (например идентификация по отпечаткам пальцев или по сетчатке глаза) заключается в том, что нет необходимости непосредственного контакта системы и человека.
В общем случае задача идентификации личности состоит из двух этапов. Вначале определяется месторасположения лица на изображении, а после этого начинается идентификация лица. Реализация этих этапов во многом зависит от области применения системы распознавания. Например, есть системы для нахождения личности в большой базе данных с последующим выводом списка наиболее похожих людей. Также существует класс систем для идентификации определённого человека в режиме реального времени (охранные системы, системы разграничения доступа).
Для последних систем, которые представляют наибольшую сложность в реализации, появился наиболее перспективный подход к распознаванию лиц с использованием свёрточной нейронной сети (СНС) [1]. Цель данной работы состоит в разработке структуры и организации процесса распознавания на основе СНС. Предложена следующая схема организации процесса распознавания, изображенная на рис.1.
Рис. 1. Система, использующаяся для распознавания лиц.
Представленная система состоит из нескольких основных модулей: сначала происходит разбиение входных изображений, далее модуль самоорганизующейся карты Кохонена обрабатывает полученные разбиения, которые классифицируются свёрточной нейросетью.
Наиболее важной частью рассматриваемой системы является свёрточная нейросеть. СНС использует три основных идеи: локальные рецепторные поля, разделяемые веса, пространственная подвыборка. Эта сеть эффективно может использоваться не только для распознавания лиц, но также и для распознавания символов и речи.
Типичная СНС представлена на рис.2. Эта сеть состоит из набора слоев, каждый из которых содержит одну или более плоскостей.
Рис. 2. Сверточная нейронная сеть
Центрированное и нормированное изображение поступает на входной слой. Каждый нейрон в плоскости получает входной сигнал из области, которая находится “по соседству” на плоскости предыдущего слоя. Веса нейронов устанавливаются одинаковыми. Каждая плоскость может рассматриваться как карта особенностей или карта значений.
Множество плоскостей всегда присутствует в каждом слое, поэтому слои называются сверточными. Следовательно, сверточные слои – это такие слои, которые следуют один за другим, при этом используются операторы усреднения и подвыборки. Обучается сеть стандартным градиентным методом обучения. В зависимости от выбора стратегии соединений возможна вариация количества весов СНС. Стратегия соединения определяется человеком вручную.
В последующей работе будет составлена программная модель, на которой будет исследована эффективность предложенной системы распознавания.
Литература
[1] Lawrence S., Giles C. L., Tsoi A. C. and Back A. D. Face recognition:a convolutional neural network approach// IEEE Trans. on Neural Networks.- Special Issue on Neural Networks and Pattern Recognition.- 1997.- P.97-113.