K.J. Ray Liu Pattern_recognition_&_image_processing (2002)(719 p)
Перевод Веселовой Т.Н.
9.1 CЕТИ С РАДИАЛЬНЫМИ БАЗИСНЫМИ ФУНКЦИЯМИ Использование многослойного персептрона с целью решения проблемы нелинейной классификации
достаточно эффективно. Однако, многослойный персептрон часто имеет много слоев с весами и обобщенный
образец связности. Вмешательство и перекрестное сцепление среди скрытых узлов приводит к высоко нелинейному
обучению сети с плоскими областями функциональной ошибки, которая возникает возле аннулирований различного
веса. Это может привести к очень медленной конвергенции процедуры обучения. Поэтому пробуждается интерес
для исследования других путей для без потери важных особенностей аппроксимации произвольных нелинейных
функциональных отображений между многомерными пространствами. В то же время появляется новая точка зрения
на интерпретацию функции классификации образов с целью рассмотреть классификацию образов как задачу
интерполяции данных в гиперпространстве, где, обучающие множества для поиска гиперповерхностей, будут
лучше всего соответствовать обучающим данным. Ковер (1965), установил в своей теореме на разделимость
образов, что задача классификации образов, приводимая нелинейно в многомерном пространстве, имеет
большую вероятность быть линейно разделимой, чем в маломерном пространстве. Оттуда можно сделать
заключение, что, как только эти образы были преобразованы в своих взаимозаменяемых частях, которые
могут быть линейно разделимыми, задача классификации стала относительно легка для решения.
Это обуславливает метод радиальных базисных функций, который может быть существенно быстрее,
чем методы, использованные для обучения многослойных персептронных сети.
Отметим, что нелинейная соответствие
использовано для того, чтобы преобразовать нелинейно разделимая задачу классификации в линейно разделимую.
Как показано на рисунке 9.1, процедура обучения может быть осуществлена двумя стадиями.
Первая стадия - нелинейное преобразование. На этой стадии нелинейной функции отображения должно быть найдено
такое соответсвие, что мы будем иметь линейную отделимость пространства. Это подобно тому, что обсуждалось
в Главе 3, где не линейная квадратная дискриминантная функция преобразовывается в линейную функцию fi(x), i = 1,..,M,
представленной соответственно , и линейно независимы от (веса).
Вернемся к задаче радиальных базисных функций. Базисные функции, использованные в этой схеме - целиком
локализованные функции. Параметры, управляющие базисной функцией (соответствие скрытым узлам) могут быть
определены, используя относительно быстрые методы обучения без учителя. В некоторых из этих методов обсуждалось
Вторая стадия сети с радиальными базисными функциями - линейное преобразование, которое определяет вес для
выходного слоя. Это – линейная задача и поэтому также быстрая. 9.4 СРАВНЕНИЕ СЕТЕЙ С РАДИАЛЬНЫМИ БАЗИСНЫМИ ФУНКЦИЯМИ И МНОГОСЛОЙНОГО ПЕРСЕПТРОНА Как сети с радиальными базисными функциями (RBF), так и многослойный персептрон (MLP) беспечивают методы для приближения нелинейных функциональных отображений между многомерными пространствами. Однако, структуры этих двух сетей весьма отличаются друг от друга. Ниже перечислены важных отличия между сетями RBF и сетями MLP.
|