Распознавание человека по изображению лица

Старовойтов В.В.


Источник: Сайт NeuroFace для свободного скачивания книги "Распознавание человека по изображению лица и нейросетевые методы".
http://neuroface.narod.ru



Нейросетевые методы, основанные на применении различных типов искусственных нейронных сетей (ИНС, в дальнейшем просто нейронные сети, НС), в последнее время получили широкое распространение.
Основные задачи, решаемые при помощи нейронных сетей следующие:

  • Разбиение пространства признаков на области, соответствующие классам (классификация, распознавание, кластеризация).

  • Извлечение ключевых характеристик, сжатие и реконструкция образов.

  • Аппроксимация функции многих переменных с любой заданной точностью.

  • Прогнозирование временных рядов.

  • Ассоциативная память.

  • Решение оптимизационно-комбинаторных задач.

  • Топологически упорядоченное преобразование пространства.

  • Распознавание с учётом топологии пространства.

Большинство из этих задач прямо или косвенно связаны с распознаванием изображений.
Основные преимущества, которыми обладают нейронные сети следующие.
Настройка нейронной сети для решения определённой задачи производиться в процессе обучения на наборе тренировочных примеров. Таким образом не требуется вручную определять параметры модели (выбирать ключевые признаки, учитывать их взаимоотношение и т.п.) – НС извлекает параметры модели автоматически наилучшим образом в процессе обучения. Остаётся только построить тренировочную выборку. В задачах классификации при этом происходит неявное выделение ключевых признаков внутри сети, определение их значимости и системы взаимоотношений между признаками. В настоящее время разработаны мощные, гибкие и универсальные механизмы обучения различных типов НС [1, 2, 3, 4]. Кроме того архитектура НС и процедуры обучения позволяет гибкую настройку на конкретную решаемую задачу. Для большинства НС процедура обучения является эвристическим алгоритмом, что с одной стороны обеспечивает приемлемость получаемых решений, а с другой стороны не требует непомерных вычислительных ресурсов.
Нейронные сети обладают хорошей обобщающей способностью (одной из лучших среди существующих методов, например, много лучшей чем у решающих деревьев [6]). Это значит, что опыт, полученный в процессе обучения на конечном наборе образов, НС может успешно применять на всё множество образов. Кроме интерполяционных обобщающих способностей, НС (многослойные персептроны, например), могут хорошо экстраполировать, т.е. применять свой опыт на качественно иные образы, чем те, которые встречались в обобщающей выборке.
Нейронные сети не требуют ни наложения каких-либо ограничений на тренировочную выборку, ни полагаются на то, что она обладает какими-либо априорными свойствами, в отличие, например, от статистических методов [2]. Не требуется никакого предварительного изучения характера данных. НС принимает тренировочный набор «как есть» и учится производить правдоподобное решение, не претендуя на абсолютную истину. Т.е. строится наилучшая нефизическая модель [3], которая не является максимально точным соответствием реального процесса, но даёт приемлемую его аппроксимацию. Имеется ряд примеров, когда нейронные сети показывали себя лучше статистических методов [2]. Кроме того, в статистике не имеется аналогов некоторых нейросетевых методов [3], таких, например как карты Кохонена, машина Больцмана, и, что важно для распознавания изображений, когнитроны.
Естественным образом архитектура НС реализуется на параллельных вычислительных средствах: специализированных микросхемах, оптических и квантовых компьютерах. Это открывает широкие перспективы применения НС в будущем. НС характеризуется нечётким и распределённым хранением информации. Т.е. нет отдельного нейрона, отвечающего за какое-либо понятие или признак, и удаление или искажение работы этого нейрона не приведёт к фатальным последствиям.
Но несмотря на все достоинства, применение НС к изображениям требует специальных усилий. Это связано в первую очередь со сложным характером изображений, особенно изображений трёхмерных объектов реального мира, какими и являются лица людей. Изображение должно быть предобработано – приведено к некоторым стандартным условиям. Кроме того, выбор начального представления изображения (частотные коэффициенты, главные компоненты, вейвлеты, моменты и т.п.) является отдельной обширной темой. Двумерный характер изображения, изменение условий освещённости, топологические искажения изображения при смене ракурса и прочих воздействиях не позволяют ограничиться простейшими архитектурами НС для достижения оптимального результата.
Кроме различных способов применения нейронных сетей к распознаванию человека по изображению лица, существует множество работ, посвящённых применению нейронных сетей к распознаванию и обработке изображений других видов объектов.

    Литература:

  1. Головко В.А. Нейроинтеллект: Теория и применения. Книга 1. Организация и обучение нейронных сетей с прямыми и обратными связями - Брест:БПИ, 1999, - 260с.

  2. Ежов А.А., Шумский С.А. – Нейрокомпьютинг и его применения в экономике и бизнесе. – Москва, 1998.

  3. Вороновский Г.К., Махотило К.В., Петрашев С.Н., Сергеев С.А. – Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. – Харьков:Основа, 1997.

  4. Нейроинформатика / А.Н. Горбань, В.Л. Дунин-Барковский, А.Н. Кирдин и др. – Новосибирск: Наука. Сибирское предприятие РАН, 1998.

  5. Jacobsen X., Zscherpel U. and Perner P. A Comparison between Neural Networks and Decision Trees. Lecture Notes in Artificial Intelligence - Machine Learning and Data Mining in Pattern Recognition, 1999, pp. 144-158.