Дрига К.В.
Донецкий национальный технический университет
В этом докладе рассматривается проблема распознавания искаженных и зашумленных образов с помощью неокогнитрона. Основной целью является рассмотрение принципов действия неокогнитрона, его структуры и возможностей в сфере решения задач по распознаванию образов.
На протяжении многих лет развития кибернетики большое внимание уделялось изучению удивительной способности человека быстро и безошибочно классифицировать и выделять отдельные образы окружающего мира, идентифицировать объекты вне зависимости от их положения в пространстве, освещения и других условий. Перспектива реализации компьютерного аналога такой системы очень заманчива, ведь она бы позволила заменить человека во многих областях его деятельности, где работа является опасной, монотонной или скучной.
Медицинские исследования человеческого мозга побудили ученых вести разработки распознающих моделей, опираясь на структуру зрительной коры. К. Фукушима в 1975 году разработал когнитрон - гипотетическую модель биологической системы восприятия и распознавания, инвариантную к поворотам, перемещениям, изменениям масштабов образов [1].
Рисунок 1 - Структура неокогнитрона
Подобно зрительной коре человеческого мозга, когнитрон состоит из нескольких слоев нейронов (рис.1). Каждый отдельный слой реализует различные уровни обобщения. Например, первый слой может распознавать отдельные линии, а последующие способны к более сложному обобщению.
Нейрон каждого слоя связан с некоторым набором нейронов предыдущего слоя, что позволяет каждому нейрону выходного слоя реагировать на все входное поле. Каждый слой когнитрона обладает нейронами двух типов - возбуждающих и тормозящих [2]. Возбуждающие нейроны стремятся активизировать соединенный с ними нейрон следующего слоя. Тормозящие нейроны соответствуют тем же областям связи, что и возбуждающие нейроны, и препятствуют этому возбуждению. Кроме того, каждому нейрону соответствует область конкуренции из соседних нейронов того же слоя. Они оказывают латеральное торможение на этот нейрон. Каждый тормозящий нейрон суммирует выходы всех нейронов из этой области и вырабатывает сигнал, тормозящий воздействие на целевой нейрон.
Процесс обучения когнитрона представляет собой обучение без учителя, т.е. сеть при подаче входных образов самоорганизуется путем изменения весовых коэффициентов [2]. В процессе обучения в некоторой области слоя возбуждается только один нейрон, который будет оказывать тормозящее воздействие на соседние нейроны из области конкуренции. Синапсы такого нейрона будут усиливаться за счет повышения весовых коэффициентов.
Развитием когнитрона является неокогнитрон, который представляет собой многоуровневую иерархическую сеть. Организация и принципы ее функционирования наиболее соответствуют модели зрительной коры головного мозга. Неокогнитрон достаточно универсален и может быть использован в качестве обобщенной системы распознавания образов. Он имеет иерархическую структуру, и состоит из нескольких слоев нейронов [1]. Входной образ подается на первый слой, и распространяется далее, подвергаясь различным уровням обобщения.
Каждый слой состоит из двух плоскостей нейронов, представляющих собой двумерный массив. Первая плоскость, включающая в себя набор простых нейронов, получает сигналы с выходов сложных нейронов предыдущего слоя, выделяет определенные образы и передает их во вторую плоскость слоя, содержащую сложные нейроны, где уменьшается их позиционная значимость [2].
Один массив плоскости простых нейронов реагирует на один специфический входной образ. Это происходит, если часть образа, на которую он настроен, встретилась во входном образе и попала в его рецептивную область. Другие массивы могут быть настроены на изменение положения образа. Простые нейроны настраивают веса связей в процессе обучения, чтобы выработать максимальную реакцию на определенные образы.
Сложные нейроны выполняют функцию уменьшения позиционной значимости входного образа. Для этого на входы каждого сложного нейрона подаются выходные сигналы с набора простых нейронов того же слоя [2]. Для активизации сложного нейрона достаточно, чтобы активизировался хотя бы один простой нейрон из соответствующего множества.
Обучение неокогнитрона происходит по тому же принципу, что и в когнитроне.
На данный момент неокогнитрон является системой, по своей организации максимально приближенной к структуре зрительной коры человеческого мозга. Его устройство позволяет достаточно успешно справляться с задачей распознавания образов вне зависимости от их смещения и углов поворота. Однако его программные модели требуют больших вычислительных затрат, и, как следствие, низкой скорости работы.