МОДЕЛЬ НЕОКОГНИТРОНА ДЛЯ РАСПОЗНАВАНИЯ ОБРАЗОВ

Ю.С. Махно
Донецкий национальный технический университет

Тезисы доклада на III международную научно-техническую конференцию молодых учёных и студентов «Компьютерный мониторинг и информационные технологии». В докладе рассмотрены основные особенности в архитектуре неокогнитрона и проведен некоторый анализ зависимости скорости обучения от выбранного ускоряющего параметра.

На сегодняшний день основным фактором применяемым для улучшения производства является его автоматизация. В системах автоматизации задача распознавания образов применяется для оценки качества продукции, оценки износа оборудования и т.д. Конечно, задача распознавания образов неограниченна только производственной сферой и может применяется в бытовых условиях, например при переносе текстовой информации из бумажного в электронный вид.

Неокогнитрон – это нейронная сеть, созданная для распознавания образов. Основным достоинством неокогнитрона, является то, что в его архитектуру заложены возможности распознавания одних и тех же образов в различных ракурсах и даже различном их представлении.

С технической точки зрения неокогнитрон является иерархической сетью состоящей из достаточно большого числа слоев идущих друг за другом и имеющий неполные (можно даже сказать достаточно редкие) связи между собой. Входной образ подается на входной слой и далее передается каждому последующему. Слоевая структура неокогнитрона показана на рис. 1.

Структура неокогнитрона
Рисунок 1 – Структура неокогнитрона

Каждый слой неокогнитрона состоит из матриц определенной размерности. При этом размерность матриц уменьшается от слоя к слою. Элементами матриц являются отдельные нейроны. Кроме того, в одном слое находятся простые матрицы (распознают входную информацию) и комплексные матрицы (обобщают распознанную информацию). Нейроны простых матриц связаны только с некоторыми нейронами комплексных матриц. В свою очередь нейроны комплексных матриц связаны с нейронами простых матриц следующего слоя.

Входной слой обычно представляется как нулевой комплексный слой. Концептуально, комплексные матрицы созданы для того, чтобы объединить однотипные результаты распознавания простых матриц. Например, пусть первая ПМ распознает – g, а вторая – g, тогда эти результаты в комплексной матрице следует объединить, т.к. это одна и та же английская буква. Видно, что, подобрав хороший базис распознаваемых образов, можно добиться очень хороших результатов.

Каждый нейрон как простого, так и комплексного слоя получает сигналы не от всех нейронов, а лишь от некоторых, с которыми он связан. Такие нейроны называются «областью видимости». Размерность областей видимости может быть различна, индекс центрального элемента области видимости соответствует индексу рассматриваемого нейрона в своей матрице.

В модель неокогнитрона для каждого простого нейрона вводится дополнительный тормозящий нейрон, на который возлагается функция подавления выходного сигнала нейрона при несоответствии входного образа образу, на распознавание которого настроен нейрон. Подавляющий нейрон связан с нейроном простого слоя, и с теми же нейронами комплексного слоя, с которыми связан сам простой нейрон.

Функция активации для простого нейрона представлена формулой:

, где

Функция активации для комплекного нейрона: .

Обучение неокогнитрона достаточно просто с точки зрения математики, но не так понятно концептуально. Настраиваемыми коэффициентами в неокогнитроне являются коэффициенты от нейронов комплексного слоя к нейронам простого слоя и коэффициент от тормозящего нейрона к нейрону простого слоя. Коэффициенты от комплексных нейронов к тормозящему нейрону и от простых нейронов к комплексным являются фиксированными. В связи с этим возникает проблема выбора фиксированыых коэффициентов. Изначально, предполагается лишь, что значения коэффициентов должно уменьшаться при удалении от центра области видимости.

При настройке весовых коэффициентов используется простая формула расчета ?, которая зависит от величины входных сигналов.

Процесс настройки всегда заканчивается, благодаря тормозящему нейрону (Его выход стоит в знаменателе при расчете х). График настройки коэффициентов представлен на рисунке 2.


График настройки коэффициентов
Рисунок 2 – График настройки коэффициентов

Таким образом, неокогнитрон универсальная сеть, которая может решать любые задачи связанные с распознаванием образов. То есть такие нейронные сети, как неокогнитрон способны облегчить работу человека в этой области и уберечь от последствий возможной невнимательности.

Литература

  1. Fukushima K., Miyake S. 1982. Neocognitron: A new algorithm for pattern recognition tolerant of deformations and shifts in position. Pattern recognition 15(6): 455 – 69.
  2. Ф. Уоссермен. Нейрокомпьютерная техника. Теория и практика. М.: Мир, 1992 – 260 с.