УДК. 004.8
КОДИРОВАНИЕ ИЗОБРАЖЕНИЙ ЧЕЛОВЕЧЕСКИХ ЛИЦ С ПОМОЩЬЮ САМООРГАНИЗУЮЩЕЙСЯ КАРТЫ КОХОНЕНА
Костецкая Г.Ю, Федяев О.И.
Донецкий национальный технический университет
Сб. трудов Международной студенческой научно-практической конференции «Информатика и компьютерные технологии» — Донецк: ДонНТУ, 2009. — с. 265-268.
Эффективность распознавания человеческих лиц во многом зависит от кодирования исходных изображений. В этой работе рассматривается кодирование изображений человеческих лиц с помощью самоорганизующейся карты Кохонена [2]. Самоорганизующиеся карты Кохонена (SOM) заимствованы из биологических нейронных систем обработки информации (например, ретинотопические карты зрительной коры головного мозга и т. д).
Самоорганизующаяся карта Кохонена - это соревновательная нейронная сеть с обучением без учителя, решающая задачу визуализации и кластеризации. Самоорганизующаяся карта используется для проекции представления изображения в менее мерное пространство. В частности, она является хорошим средством преобразования многомерного изображения лица в двумерное.
Алгоритм функционирования SOM представляет собой один из вариантов кластеризации многомерных векторов. Все нейроны сети упорядочены в некоторую структуру (в данной работе используется трёхмерная сетка). Элемент? проецируется из входного множества на позицию в карте (информация кодируется как позиции активированного узла). В ходе обучения модифицируется не только нейрон-победитель, но и его соседи, но в меньшей степени. За счёт этого SOM относят к классу методов проецирования многомерного пространства в пространство с более низкой размерностью. При использовании этого алгоритма вектора, схожие в исходном пространстве, располагаются рядом и на полученной карте.
На наш взгляд для кодирования изображений человеческих лиц целесообразно использовать трёхмерную структуру SOM. Такая SOM квантифицирует 25-мерные входящие вектора в 125 топологически обусловленных значений. Три измерения SOM могут рассматриваться, как три черты. Использование сетки с большей или меньшей мерностью не представляется целесообразным, так как двумерная структура, например, будет приводить к чрезмерной потере данных (будут выделены только две черты).
Рисунок 1 – Трёхмерная самоорганизующаяся карта Кохонена.
Самоорганизующаяся карта Кохонена проецирует вектора из входного множества Rn на топологически определенный набор узлов в пространстве, имеющем меньше измерений. Каждый из узлов описывается двумя векторами, первый - вектор веса mi, имеющий такую же размерность, что и входные данные. Второй - координаты узла на карте.
Во время обучения каждый входной вектор x сравнивается со всеми mi в поиске размещения наиболее сходного mc (заданного ). Узлы в SOM пересчитываются по формуле В данной формуле t это время, в течении которого происходит обучение; hсi(t) - сглаживающая функция, максимум которой находится в mc. Обычно , где rc и ri представляют положение узлов в выходном пространстве SOM; rc это узел с наиболее близким весовым вектором к входному шаблону; ri – пробегает по всем узлам; hсi(t) приближается к 0, когда возрастает и t стремится к бесконечности.
В данной работе кодирование изображения человеческого лица происходит в соответствии со следующим алгоритмом:
Рисунок 2 — Выделение «черт» с помощью самоорганизующейся карты Кохонена.
Таким образом организовано кодирование исходного изображения и на выходе мы получаем три измерения самоорганизующейся карты Кохонена, т.е. три выделенные характерные черты человеческого лица.