Назад в библиотеку


УДК. 004.8

 

КОДИРОВАНИЕ ИЗОБРАЖЕНИЙ ЧЕЛОВЕЧЕСКИХ ЛИЦ С ПОМОЩЬЮ САМООРГАНИЗУЮЩЕЙСЯ КАРТЫ КОХОНЕНА

 

Костецкая Г.Ю, Федяев О.И.

Донецкий национальный технический университет

 

Распознавание человеческих лиц во многом зависит от кодирования исходных изображений.  В этой работе рассматривается кодирование изображений человеческих лиц с помощью самоорганизующейся карты кохонена. Самоорганизующаяся карта (SOM) используется для проекции представления изображения в менее мерное пространство.

Самоорганизующиеся карты Кохонена заимствованы из биологических нейронных систем обработки информации (например, ретинотопические карты зрительной коры головного мозга и т.д).

Самоорганизующаяся карта Кохонена (SOM) – это соревновательная нейронная сеть с обучением без учителя, выполняющая задачу визуализации и кластеризации[2]. Является методом проецирования многомерного пространства в пространство с более низкой размерностью (чаще всего, двумерное).

Алгоритм функционирования SOM представляет собой один из вриантов кластеризации многомерных векторов. Все нейроны сети упорядочены в некоторую структуру (в данной работе используется трехмерная сетка). Элемент проецируется из входного множества на позицию в карте – информация кодируется как позиции активированного узла. В ходе обучения модифицируется не только нейрон-победитель, но и его соседи, но в меньшей степени. За счет этого SOM можно считать одним из методов проецирования многомерного пространства в пространство с более низкой размерностью. При использовании этого алгоритма вектора, схожие в исходном пространстве, оказываются рядом и на полученной карте.

На наш взгляд для кодирования изображений человеческих лиц целесообразно использовать трехмерную структуру SOM. SOM квантифицирует 25-мерные входящие вектора в 125 топологически обусловленных значений. Три измерения SOM могут рассматриваться, как три черты. Использование сетки с большей или меньшей мерностью не представляется целесообразным, так как двумерная структура, например, будет приводить к чрезмерной потере данных (будут выделены две черты).

Рисунок 1 – Трехмерная самоорганизующаяся карта Кохонена.

SOM проецирует вектора из входного множества Rn на топологически определенный набор узлов  в пространстве, имеющем меньше измерений. Каждый из узлов описывается двумя векторами, первый – вектор веса mi, имеющий такую же размерность, что и входные данные. Второй – координаты узла на карте.

Во время обучения каждый входной вектор x сравнивается со всеми mi в поиске размещения наиболее сходного mc (заданного ). Узлы в SOM пересчитываются согласно:

Где t это время, в течении которого уже происходит обучение, hic(t) - сглаживающая функция,  максимум которой находится в mc. Обычно   , где rc и ri представляют положение узлов в выходном пространстве SOM. Rc – это узел с наиболее близким весовым вектором к входному шаблону,а ri – пробегает по всем узлам. hic(t) приближается к 0, когда  возрастает и также t стремится к бесконечности.

В данной работе кодирование изображения человеческого лица происходит в соответствии со следующим алгоритмом:

1.    Для изображений в обучающем наборе окно фиксированного размера (5x5) передвигается по исходному изображению (112x92 пикселя) из базы ORL Database (ORL Database of Faces), которая содержит набор лиц, сфотографированных в исследовательской лаборатории Кембриджа, как показано на рисунке 3 и локальные наблюдения извлекаются на каждом шаге. Шаг составляет 4 пикселя.

2.    Самоорганизующаяся карта (с тремя измерениями и пятью узлами для каждого измерения, 53 = 125 узлов) обучается на векторах, полученных на предыдущем шаге. SOM квантифицирует 25-мерные входящие вектора в 125 топологически обусловленных значений.

Рисунок 2 – Выделение «черт» с помощью самоорганизующейся карты Кохонена.

Таким образом происходит кодирование исходного изображения человеческого лица и на выходе мы имеет три измерения самоорганизующейся карты Кохонена – три выделенные черты.

Литература

[1] Lawrence S., Giles C. L., Tsoi A. C. and Back A. D. Face recognition:a convolutional neural network approach// IEEE Trans. on Neural Networks.- Special Issue on Neural Networks and Pattern Recognition.- 1997.- P.97-113.

[2] T. Kohonen, Self-Organizing Maps. -1995.-Springer- 459 р.