Введение в предмет Computational Neuroscience (вычислительная
нейронаука). Истоки нейронауки: достижения биологии и физиологии,
психологии, дискретная математики, кибернетики, статистической физики и
синергетики. Роль компьютерного моделирования. Философские основания
нейронауки. Исторический обзор. Структура курса. Учебная и
ознакомительная литература.
"Подмигните компьютеру - он поймет". В начале 90-х под таким заголовком
в старейшей уважаемой газете Нью-Йорк Таймс появилась статья,
рассказывающая о современных достижениях и направлениях в области
интеллектуальных компьютерных систем. Среди магистральных путей
развития данной отрасли эксперты издания выделили
- Компьютеры с высокой степенью
параллелизма обработки информации, которые могут разделить ту или иную
задачу на части и обрабатывать их одновременно, тем самым значительно
сокращая общее время вычислений;
- Компьютеры, в которых вместо электронных
сигналов для передачи информации используется оптика. Оптические
сигналы уже начали использоваться для передачи данных между
компьютерами;
- Компьютеры с нейронными сетями,
представляющие собой машины, работающие аналогично тому, как по нашим
современным представлениям, функционирует мозг.
Последнее, третье, направление, которое существенно опирается на первые
два, и составляет основную тему предлагаемого курса Лекций. При этом
курс сфокусирован
лишь на одном из разделов направления искусственных нейронных сетей,
а именно, на нейроинформатике, как науке, изучающей нейроподобные
способы обработки информации при помощи компьютеров.
Разнообразие, большой об'ем и
противоречивость различной диагностической информации выводят на
передний план проблему поиска физических систем, способных к ее
переработке. Решение этой комплексной задачи тесно связано с новыми
информационными технологиями, важное место среди которых занимают
методы распознавания и категоризации образов. Нейронные сети - мощный и
на сегодня, пожалуй, наилучший метод для решения задач распознавания
образов в ситуациях, когда в экспериментальных данных отсутствуют
значительные фрагменты информации, а имеющаяся информация предельно
зашумлена. Высокая степень параллельности, допускаемая при реализации
нейросистем, обеспечивает обработку недоступных оператору об'емов
информации за времена, меньшие или сравнимые с допустимыми временами
измерений.
К рубежу 80-х годов были достигнуты
значительные результаты в совсем молодой
синергетике, науке о самоорганизации в неравновесных системах;
систематизированы факты
и проведены многочисленные новые эксперименты в нейрофизиологии, в
частности, подробно
изучено строение и механизм действия отдельных нейронов; сформулирован
принцип работы и
создана первая ЭВМ с параллельной архитектурой. Эти обстоятельства,
по-видимому,
стимулировали начало интенсивных исследований нейронных сетей, как
моделей
ассоциативной памяти.
Широкий интерес к нейронным сетям был
инициирован после появления
работы Хопфилда (Hopfield J.J., 1982), который показал, что задача с
изинговскими
нейронами
может быть сведена к обобщениям ряда моделей, разработанных к тому
моменту в физике
неупорядоченных систем. Работа сети Хопфилда (наиболее подробно
обсуждаемая в физической литературе)
состоит в релаксации начального "спинового портрета" матрицы двоичных
кодов к одному из стационарных состояний, определяемых
правилом обучения (правилом Хебба). Таким образом, данная сеть может
применяться для
задач распознавания.
В 1986 году появилась работа Румельхарта,
Хинтона и Вильямса (Rumelhart D.E., Hinton G.E., Williams R.J., 1986),
содержавшая ответ на вопрос,
долгое время сдерживавший развитие нейроинформатики - как обучаются
иерархические
слоистые нейронные сети, для которых "классиками" еще в 40-50 х годах
была доказана
универсальнось для широкого класса задач. В последующие годы
предложенный
Хинтоном алгоритм обратного распространения ошибок претерпел
бесчисленное множество вариаций и модификаций.
Многообразие предлагаемых алгоритмов,
характеризующихся различной степенью детальности
проработки, возможностями их параллельной реализации, а также наличием
аппаратной
реализации, приводит к особой актуальности исследования по
сравнительным характеристикам
различных методик.
Нейронаука в современный момент переживает
период перехода от юного состояния к зрелости. Развитие в области
теории и приложений
нейронных сетей идет в самых разных направлениях: идут поиски новых
нелинейных
элементов, которые могли бы реализовывать сложное коллективное
поведение в ансамбле
нейронов, предлагаются новые архитектуры нейронных сетей, идет поиск
областей приложения
нейронных сетей в системах обработки изображений, распознавания образов
и речи,
робототехники и др. Значительное место в данных исследованиях
традиционно занимает
математическое моделирование.
Необходимость написания систематического
курса по теории нейронных сетей и
вычислительным системам на их основе во многом определяется отсутствием
отечественных
учебных монографий по этой теме. Кроме того, сама эта тема пока не
заняла свое место в
традиционных курсах университетов и ВУЗов. И хотя промышленные эксперты
американского
Управления перспективных исследований DARPA ожидают начало массового
распространения новой
нейросетевой технологии в конце 90-х годов, уже сегодняшний уровень
теоретического
понимания и практического использования нейронных сетей в мировой
информационной индустрии
все явственнее требует профессиональных знаний в этой области.
Главной задачей предлагаемого курса является
практическое введение в современные методы
и системы обработки информации, об'единенные в научной литературе
термином Computational
Neuroscience (вычислительная нейро-наука), а также введение в
перспективные подходы
построения вычислительных и информационных систем новых поколений.
Особенностью рассматриваемой нами темы является ее междисциплинарный
характер. Свой
вклад в становление нейронауки внесли биологияи физиология высшей
нервной деятельности,
психология восприятия, дискретная математика, статистическая физика и
синергетика, и,
конечно, кибернетика и, конечно, компьютерное моделирование.
Лекции содержат основную информацию о
принципах организации естественных (биологических)
нейронных сетей и их математических моделей - искусственных нейронных
сетей, необходимую
для синтеза нейросетевых алгоритмов для практических задач. Для этой
цели в книгу включены
две вводные темы - математическое введение (Лекция 2) и вводные
биологические сведения
(Лекция 3). Формальное математическое наполнение курса сведено к
минимуму и опирается на
базовые знания по курсам линейной алгебры и дифференциальных уравнений.
Поэтому он может
быть рекомендован и, в основном, предназначен для струдентов инженерных
специальностей, а
также математиков-прикладников и программистов.
Основные разделы курса
-
Введение, сведения из биологии, физиологии
высшей нервной деятельности, психологии, кибернетики, статистической
физики и дискретной
математики;
- Биологический нейрон и его математическая
модель;
- ПЕРСЕПТРОН, линейная разделимость и
теорема Розенблатта об обучении;
- Обучение нейронной сети, как задача
комбинаторной оптимизации;
- Правило Хебба, модель Хопфилда и ее
обобщения;
- Иерархические нейронные сети;
- Алгоритм обратного распространения
ошибок;
- Модели Липпмана-Хемминга, Хехт-Нильсена,
Коско;
- Способы представления информации в
нейронных сетях;
- Современные нейросетевые архитектуры,
КОГНИТРОН и НЕОКОГНИТРОН Фукушимы;
- Теория адаптивного резонанса;
- Алгоритмы генетического поиска для
построения топологии и обучениия нейронных сетей;
- Адаптивный кластерный анализ и карта
самоорганизации Кохонена;
- Конечные автоматы и нейронные сети;
- Заключение - современные день нейронауки,
нейро-ЭВМ шестого поколения, нейропроцессоры, математическое
обеспечение, научные и
коммерческие приложения.
Литература
А. Основная
- Ф. Уоссермен. Нейрокомпьютерная техника.
Москва: Мир, 1992.
- А.Н. Горбань, Д.А. Россиев. Нейронные
сети на персональном компьютере. Новосибирск: Наука, 1996.
- Информатика. Справочник. Под. Ред.
Д.А.Поспелова. Москва: Педагогика, 1996.
Б. Дополнительная
- Т. Кохонен. Ассоциативная память. Москва:
Мир, 1980.
- Ф. Розенблатт. Принципы нейродинамики.
Москва: Мир, 1965.
- Автоматы. Под. ред. К.Э. Шеннона и Дж.
Маккарти. Москва: Издательство Иностранной
Литературы, 1956.
- Д. Марр. Зрение. Москва: Радио и Связь,
1987.
- М. Минский, С. Пейперт. Персептроны.
Москва: Мир, 1971.
- Н. Винер. Кибернетика. Москва: Советское
радио, 1968.
- А.А. Веденов. Моделирование элементов
мышления. Москва: Наука, 1988.
- А.Ю. Лоскутов, А.С. Михайлов. Введение в
синергетику. Москва: Наука, 1990.
- С.О. Мкртчян. Нейроны и нейронные сети.
Москва: Энергия, 1971.
- А.Н. Горбань. Обучение нейронных сетей.
Москва: СП "Параграф", 1990.
- А.И. Галушкин. Синтез многослойных схем
распознавания образов. Москва: Энергия, 1974.
- Ф.Г. Гантмахер. Теория матриц. Москва:
Наука, 1988.
- Н. Грин, У. Стаут, Д. Тейлор. Биология.
Под.ред. Р.Сопера. Т.1-3, Москва: Мир, 1990.
- Г. Шеперд. Нейробиология. Тт. 1-2,
Москва: Мир, 1987.
- Ф. Блум, А. Лейзерсон, Л. Хофстедтер.
Мозг, разум и поведение. Москва: Мир, 1988.
- Б. Банди. Методы оптимизации. М. Радио и
связь, 1988
Замечание к электронному
варианту 1998 г.
За прошедшие 5 лет с момента написания Лекций в Российской
нейроинформатике
произошли значительные изменения. Разнообразные курсы по нейронным
сетям начали
повсеместно входить в программы высшей школы для различных технических
специальностей.
Появились и, немногочисленные пока, учебники, среди которых в первую
очередь
следует отметить книгу А.Н. Горбаня и Д.А. Россиева (1996). Увы, тираж
в 500 экземпляров
не позволяет рассматривать это превосходное (хотя и относительно
сложное) издание
в качестве базового учебника.
|