В моменты принятия сложных решений человек старается «заглянуть в себя» и постичь, каким образом он справляется с трудными и порой не решаемыми формальной логикой задачами. Естественное беспокойство и жажда познания обуревают его наряду со смутным сознанием того, что математический, алгоритмический подход к построению сложных кибернетических систем искусственно абсолютизирован. Все должно быть к месту, все должно быть взвешено, И обращаясь к себе, он раз за разом проводит мозговую атаку на то таинственное, созданное природой на собственный мозг...
Итак, мы вступаем в самую сокровенную область искусственного интеллекта.
Мы смелы и безапелляционны. Долго и систематически насаждаемая духовная нищета заставила нас позабыть о превалирующем духовном начале в человеке. Все больше людей понимают, что мозг — лишь инструмент духа, души. И как любой инструмент, он производится, тупится и приходит в негодность — умирает. Бессмертной остается душа — продукт тонкого мира, мира сверхвысоких частот и, по мнению некоторых философов, настойчиво проявляющейся психической энергии.
А раз мозг — инструмент, его надо тренировать, заполнять, совершенствовать. В природе царит принцип целесообразности, полезности в борьбе за главную установку — установку на развитие. Нужное существует и утверждается, ненужное отмирает, как отмирают неиспользованные, «лишние» нейроны, порождая склеротическую ткань и разъедающую интоксикацию. И человека ленивого, праздного, недеятельного охватывает преждевременное старческое слабоумие. «Душа обязана трудиться», — сказал поэт Н. Заболоцкий. Эту истину мы открываем вновь, с другой, неожиданной стороны...
Мы принимаем сказанное и успокаиваемся. Не вторгаемся мы в то, что для нас сейчас непостижимо, что пока нам не дано. Но кто знает? И на всякий случай мы вооружаемся иронией, преодолевая «сопротивление материала». Ирония позволяет и сказать, и не сказать, предположить, но тотчас, прикрываясь шуткой, трусливо отступить. Только иронией можно защитить себя от мистических страхов, возникающих на трудном пути познания.
Внимание ученых к логическому моделированию процессов головного мозга [1—6] обусловили следующие причины: • высокая скорость выполнения сложных логических конструкций — предикатов с высоким параллелизмом действий; • простота алгоритмов логических действий мозга, основанная не на численном манипулировании, а на принципах ассоциативного мышления; • возможность решения трудно формализуемых задач, в которых совместно используются данные логически несовместимой природы, противоречивые, неполные, «зашумленные», некорректные; • устойчивость работы, совместимая с расширением, трансформированием и совершенствованием знаний; • надежность, обеспечиваемая наличием многих путей логического вывода и способностью восстановления утраченных данных; • возможность построения самообучающихся и самонастраивающихся систем; • прекрасная сочетаемость с традиционными «вычислительными» алгоритмами обработки информации, позволяющая стро- ить сложные системы управления, - с максимальной надежностью, адаптивностью и с минимумом расходуемых ресурсов; • отсутствие требований к «традиционно» развиваемым вычислительным средствам. Единственный стимулируемый прин- цип — параллелизм. Для реализации параллельной системы нейросети — необходима параллельная вычислительная система. Ведь для выявления параллелизма, в частности, мы и обращаемся к модели мозга! Наряду с разработкой параллельных вычислительных устройств — нейрокомпьютеров — стимул к развитию получают сети ЭВМ для реализации в них «больших» нейросетей.
Особый интерес ученых и разработчиков сложных управляющих систем к нейросетевым технологиям, как и к другим технологиям искусственного интеллекта, возник в начале 1980-х годов (известный «японский вызов» [7]), когда остро встала проблема сверхвысокой производительности вычислительных средств.
Приняв этот вызов, многие исследователи обратили внимание на принцип самообучения. Следует отметить краткое, но полное рассмотрение этой проблемы В.В. Игнатущенко [8].
Благотворное влияние на развитие нейросетевых технологий оказало создание методов параллельной обработки информации[9].
Необходимо выразить признательность замечательному хирургу, философу и кибернетику Н.М. Амосову [10], вместе с учениками систематизировавшему подход к созданию средств искусственного интеллекта (ИИ). Этот подход заключается в следующем.
В основе стратегий ИИ лежит понятие парадигмы — взгляда (концептуального представления) на суть проблемы или задачи и принцип ее решения. Рассматривают две парадигмы искусственного интеллекта.
1. Парадигма эксперта предполагает следующие объекты, а
также этапы разработки и функционирования системы ИИ:
• формализация знаний — преобразование экспертом проблемного знания в форму, предписанную выбранной моделью
представления знаний;
• формирование базы знаний (БЗ) - вложение формализованных знаний в программную систему;
• дедукция — решение задачи логического вывода на основе БЗ.
Эта парадигма лежит в основе применения экспертных систем, систем логического вывода, в том числе на языке логического программирования ПРОЛОГ. Считается, что системы на основе этой парадигмы более изучены.
2. Парадигма ученика, включающая следующие положения и последовательность действий:
• обработка наблюдений, изучение опыта частных примеров
— формирование базы данных (БД) системы ИИ;
• индуктивное обучение — превращение БД в БЗ на основе обобщения знаний, накопленных в БД, и обоснование процеду-
ры извлечения знаний из БЗ. Это означает, что на основе данных делается вывод об общности той зависимости между объектами, которую мы наблюдаем. Основное внимание здесь уделяется изучению аппроксимирующих, вероятностных и логических механизмов получения общих выводов из частных утверждений. Затем мы можем обосновать, например, достаточность процедуры обобщенной интерполяции (экстраполяции), или процедуры ассоциативного поиска, с помощью которой будем удовлетворять запросы к БЗ;
• дедукция — по обоснованной или предполагаемой процедуре мы выбираем информацию из БЗ по запросу (например, опти-
мальную стратегию управления по вектору, характеризующему сложившуюся ситуацию).
Исследования в рамках этой парадигмы и ее разработка проведены пока слабо, хотя они лежат в основе построения самообучающихся систем управления (ниже будет приведен замечательный пример самообучающейся системы управления — правила стрельбы в артиллерии).
Чем база знаний, общий и обязательный элемент системы ИИ, отличается от базы данных? Возможностью логического вывода!
Теперь обратимся к «естественному» интеллекту. Природа не создала ничего лучшего, чем человеческий мозг. Значит, мозг является и носителем базы знаний, и средством логического вывода на ее основе независимо от того, по какой парадигме мы организовали свое мышление, т. е. каким способом заполняем базу знаний, — учимся!
Д.А. Поспелов в замечательной, единственной в своем роде, работе [11] освещает высшие сферы искусственного интеллекта — логику мышления. Цель данной книги — хотя бы частично препарировать нейросеть как средство мышления, тем самым привлекая внимание к низшему, начальному звену всей цепи методов искусственного интеллекта.
Отбросив мистику, мы признаем, что мозг представляет собой нейронную сеть, нейросеть, - нейроны, соединенные между собой, со многими входами и единственным выходом каждый. Нейрон реализует достаточно простую передаточную функцию, позволяющую преобразовать возбуждения на входах, с учетом весов входов, в значение возбуждения на выходе нейрона. Функционально законченный фрагмент мозга имеет входной слой нейронов — рецепторов, возбуждаемых извне, и выходной слой, нейроны которого возбуждаются в зависимости от конфигурации и величины возбуждения нейронов входного слоя. Предполагается, что нейросеть, имитирующая работу мозга, обрабатывает не сами данные, а их достоверность, или, в общепринятом смысле, вес, оценку этих данных. Для большинства непрерывных или дискретных данных их задание сводится к указанию вероятности диапазонов, которым принадлежат их значения. Для большого класса дискретных данных — элементов множеств — целесообразно жесткое закрепление нейронов входного слоя.
Распределение величин возбуждения нейронов выходного
слоя, а чаще всего нейрон, обладающий максимальной величиной возбуждения, позволяют установить соответствие между
комбинацией и величинами возбуждений на входном слое (изображение на сетчатке глаза) и получаемым ответом (что это). Таким образом, эта зависимость и определяет возможность логического вывода вида «если — то». Управление, формирование данной зависимости осуществляются весами синапсических связей нейронов, которые влияют на направления распространения возбуждения нейронов в сети, приводящие на этапе обучения к «нужным» нейронам выходного слоя, т.е. служат связыванию и запоминанию отношений «посылка — следствие». Связь подструктур нейросети позволяет получать «длинные» логические цепочки на основе подобных отношений.
Отсюда следует, что сеть работает в двух режимах: в режиме обучения и в режиме распознавания (рабочем режиме).
Считается, что в человеческом мозге до 100 млрд нейронов. Но сейчас нас не интересует, как устроен нейрон, в котором насчитывают до 240 химических реакций. Нас интересует, как работает нейрон на логическом уровне, как выполняет он логические функции. Реализация лишь этих функций должна стать основой и средством искусственного интеллекта. Воплощая эти логические функции, мы готовы нарушить основные законы физики, например закон сохранения энергии. Ведь мы рассчитываем нена физическое моделирование, а на доступное, универсальное компьютерное.
Итак, мы сосредоточиваем внимание на «прямом» использовании нейросетей в задачах искусственного интеллекта. Однако их применение распространяется на решение и других задач. Для этого строят нейросетевые модели со структурой, ориентированной на данную задачу, используют специальную систему связей нейроподобных элементов, определенный вид передаточной функции (часто используют так называемые сигмоидные связи, основанные на участии экспоненты при формировании передаточной функции), специально подобранные и динамически уточняемые веса. При этом используют свойства сходимости величин возбуждения нейронов, самооптимизации. При подаче входного вектора возбуждений через определенное число тактов работы нейросети значения возбуждения нейронов выходного слоя (в некоторых моделях все нейроны входного слоя являются нейронами выходного слоя и других нет) сходятся к неким величинам. Они могут указывать, например, на то, какой эталон в большей степени похож на «зашумленный», недостоверный входной образ, или на то, как найти решение некоторой задачи. Например, известная сеть Хопфилда [12], хоть и с ограничениями, может решать задачу коммивояжера - задачу экспоненциальной сложности. Сеть Хемминга [5] успешно реализует ассоциативную память. Сети Кохонена (карты Кохонена) [3] эффективно используют принцип кластеризации и широко применяются в экономике, финансах, бизнесе и т.д. Эффективно применяются нейросети для аппроксимации функций многих переменных в виде рекурсивного разложения в базисе передаточной функции.
В указанном выше применении нейросети выступают в роли спецпроцессоров для «быстрого» решения частных задач или классов задач. Это можно сравнить с применением аналоговых ЭВМ для решения систем дифференциальных уравнений, где программирование заключается в формировании электрической цепи из элементов заданного набора в соответствии с системой уравнений, а установившийся процесс позволяет на выходе снимать значения функций — решений.
Когда хотят подчеркнуть такие «вычислительные» применения нейросетей, то говорят о нейроподобных задачах, и это не должно отвлекать нас от действий в рамках ИИ, направленных на решение трудно формализуемых задач, на простоту и универсальность, свойственные мозгу.