УДК. 004.8
КОДИРОВАНИЕ ИЗОБРАЖЕНИЙ ЧЕЛОВЕЧЕСКИХ ЛИЦ С ПОМОЩЬЮ САМООРГАНИЗУЮЩЕЙСЯ КАРТЫ КОХОНЕНА
Костецкая Г.Ю, Федяев О.И.
Донецкий национальный технический университет
Распознавание человеческих лиц во многом зависит от кодирования исходных изображений. В этой работе рассматривается кодирование изображений человеческих лиц с помощью самоорганизующейся карты кохонена. Самоорганизующаяся карта (SOM) используется для проекции представления изображения в менее мерное пространство.
Самоорганизующиеся карты Кохонена заимствованы из биологических нейронных систем обработки информации (например, ретинотопические карты зрительной коры головного мозга и т.д).
Самоорганизующаяся карта Кохонена (SOM) – это соревновательная нейронная сеть с обучением без учителя, выполняющая задачу визуализации и кластеризации[2]. Является методом проецирования многомерного пространства в пространство с более низкой размерностью (чаще всего, двумерное).
Алгоритм функционирования SOM представляет собой один из вриантов кластеризации многомерных векторов. Все нейроны сети упорядочены в некоторую структуру (в данной работе используется трехмерная сетка). Элемент проецируется из входного множества на позицию в карте – информация кодируется как позиции активированного узла. В ходе обучения модифицируется не только нейрон-победитель, но и его соседи, но в меньшей степени. За счет этого SOM можно считать одним из методов проецирования многомерного пространства в пространство с более низкой размерностью. При использовании этого алгоритма вектора, схожие в исходном пространстве, оказываются рядом и на полученной карте.
На наш взгляд для кодирования изображений человеческих лиц целесообразно использовать трехмерную структуру SOM. SOM квантифицирует 25-мерные входящие вектора в 125 топологически обусловленных значений. Три измерения SOM могут рассматриваться, как три черты. Использование сетки с большей или меньшей мерностью не представляется целесообразным, так как двумерная структура, например, будет приводить к чрезмерной потере данных (будут выделены две черты).
Рисунок 1 – Трехмерная самоорганизующаяся карта Кохонена.
SOM проецирует вектора из входного множества Rn на топологически определенный набор узлов в пространстве, имеющем меньше измерений. Каждый из узлов описывается двумя векторами, первый – вектор веса mi, имеющий такую же размерность, что и входные данные. Второй – координаты узла на карте.
Во время обучения каждый входной вектор x сравнивается со всеми mi в поиске размещения наиболее сходного mc (заданного ). Узлы в SOM пересчитываются согласно:
Где t это время, в течении которого уже происходит обучение, hic(t) - сглаживающая функция, максимум которой находится в mc. Обычно , где rc и ri представляют положение узлов в выходном пространстве SOM. Rc – это узел с наиболее близким весовым вектором к входному шаблону,а ri – пробегает по всем узлам. hic(t) приближается к 0, когда возрастает и также t стремится к бесконечности.
В данной работе кодирование изображения человеческого лица происходит в соответствии со следующим алгоритмом:
1. Для изображений в обучающем наборе окно фиксированного размера (5x5) передвигается по исходному изображению (112x92 пикселя) из базы ORL Database (ORL Database of Faces), которая содержит набор лиц, сфотографированных в исследовательской лаборатории Кембриджа, как показано на рисунке 3 и локальные наблюдения извлекаются на каждом шаге. Шаг составляет 4 пикселя.
2. Самоорганизующаяся карта (с тремя измерениями и пятью узлами для каждого измерения, 53 = 125 узлов) обучается на векторах, полученных на предыдущем шаге. SOM квантифицирует 25-мерные входящие вектора в 125 топологически обусловленных значений.
Рисунок 2 – Выделение «черт» с помощью самоорганизующейся карты Кохонена.
Таким образом происходит кодирование исходного изображения человеческого лица и на выходе мы имеет три измерения самоорганизующейся карты Кохонена – три выделенные черты.
Литература
[1] Lawrence S., Giles C. L., Tsoi A. C. and Back A. D. Face recognition:a convolutional neural network approach// IEEE Trans. on Neural Networks.- Special Issue on Neural Networks and Pattern Recognition.- 1997.- P.97-113.
[2] T. Kohonen, Self-Organizing Maps. -1995.-Springer- 459 р.