Назад в библиотеку

УДК. 004.8
КОДИРОВАНИЕ ИЗОБРАЖЕНИЙ ЧЕЛОВЕЧЕСКИХ ЛИЦ С ПОМОЩЬЮ САМООРГАНИЗУЮЩЕЙСЯ КАРТЫ КОХОНЕНА

Костецкая Г.Ю, Федяев О.И.
Донецкий национальный технический университет

Сб. трудов Международной студенческой научно-практической конференции «Информатика и компьютерные технологии» — Донецк: ДонНТУ, 2009. — с. 265-268.

Эффективность распознавания человеческих лиц во многом зависит от кодирования исходных изображений.  В этой работе рассматривается кодирование изображений человеческих лиц с помощью самоорганизующейся карты Кохонена [2]. Самоорганизующиеся карты Кохонена (SOM) заимствованы из биологических нейронных систем обработки информации (например, ретинотопические карты зрительной коры головного мозга и т. д).

Самоорганизующаяся карта Кохонена  - это соревновательная нейронная сеть с обучением без учителя, решающая задачу визуализации и кластеризации. Самоорганизующаяся карта используется для проекции представления изображения в менее мерное пространство. В частности, она является хорошим средством преобразования многомерного изображения лица  в двумерное.

Алгоритм функционирования SOM представляет собой один из вариантов кластеризации многомерных векторов. Все нейроны сети упорядочены в некоторую структуру (в данной работе используется трёхмерная сетка). Элемент? проецируется из входного множества на позицию в карте (информация кодируется как позиции активированного узла). В ходе обучения модифицируется не только нейрон-победитель, но и его соседи, но в меньшей степени. За счёт этого SOM относят к классу методов проецирования многомерного пространства в пространство с более низкой размерностью. При использовании этого алгоритма вектора, схожие в исходном пространстве, располагаются рядом и на полученной карте.

На наш взгляд для кодирования изображений человеческих лиц целесообразно использовать трёхмерную структуру SOM. Такая SOM квантифицирует 25-мерные входящие вектора в 125 топологически обусловленных значений. Три измерения SOM могут рассматриваться, как три черты. Использование сетки с большей или меньшей мерностью не представляется целесообразным, так как двумерная структура, например, будет приводить к чрезмерной потере данных (будут выделены только две черты).

Рисунок 1 – Трёхмерная самоорганизующаяся карта Кохонена.

Самоорганизующаяся карта Кохонена проецирует вектора из входного множества Rn на топологически определенный набор узлов  в пространстве, имеющем меньше измерений. Каждый из узлов описывается двумя векторами, первый - вектор веса mi, имеющий такую же размерность, что и входные данные. Второй - координаты узла на карте.

Во время обучения каждый входной вектор x сравнивается со всеми mi в поиске размещения наиболее сходного mc (заданного ). Узлы в SOM пересчитываются по формуле   В данной формуле t это время, в течении которого происходит обучение; hсi(t) - сглаживающая функция,  максимум которой находится в mc. Обычно   , где rc и ri представляют положение узлов в выходном пространстве SOM;  rc  это узел с наиболее близким весовым вектором к входному шаблону;  ri – пробегает по всем узлам; hсi(t) приближается к 0, когда  возрастает и  t стремится к бесконечности.

В данной работе кодирование изображения человеческого лица происходит в соответствии со следующим алгоритмом:


Рисунок 2 — Выделение «черт» с помощью самоорганизующейся карты Кохонена.

Таким образом организовано кодирование исходного изображения и на выходе мы получаем три измерения самоорганизующейся карты Кохонена, т.е. три выделенные характерные  черты человеческого лица.


Литература

  1. Lawrence S., Giles C. L., Tsoi A. C. and Back A. D. Face recognition:a convolutional neural network approach// IEEE Trans. on Neural Networks.- Special Issue on Neural Networks and Pattern Recognition.- 1997.- P.97-113.
  2. T. Kohonen, Self-Organizing Maps. -1995.-Springer- 459 р.