Источник: «Известия Таганрогского государственного радиотехнического университета», 18 том, 2000 г.
НЕЙРО-НЕЧЕТКИЙ КОНТРОЛЛЕР СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ
Захаревич В.Г., Божич В.И., Горбатюк Н.В., Кононенко Р.Н., Шницер Ю.Л.
Таганрогский государственный радиотехнический университет, г. Таганрог,
(8634) 312015, факс(86344) 60707, Е-mail: fib@tsure.ru
Достоинством "мягких вычислений" на основе нейро-нечетких систем (ННС) является возможность решать проблему "большой размерности" в условиях отсутствия полной достоверной информации.
В данном докладе рассматривается технология проектирования ННС, которая позволяет учесть субъективные (экспертные) знания о человеке для оптимизации параметров ННС на основе объективных данных, определяющих эффективность работы данной системы.
Субъективные знания определяются набором лингвистических правил функционирования искусственной нейронной сети, параметрами связности и параметрами настройки элементов этой сети. Другими словами, структура ННС задает некоторую стратегию, посредством которой будет достигаться цель системы - управление человеко-машинным комплексом.
При этом предварительно заданные параметры нейросети (заложенная субъективность) уточняются в процессе обучения нейронной сети на реальных (объективных) данных. В результате объективная оценка эффективности функционирования ННС является оптимизационным критерием. Эффективность ННС определяется выбором обучающего алгоритма ННС. Многомерная оптимизация ННС может быть решена с помощью генетического алгоритма, который является эффективным классом эволюционных алгоритмов и позволяет осуществить поиск оптимального решения.
В работе предлагается архитектура нейро-нечеткого контроллера (ННК), с помощью которого ведется оптимизация (обучение) ННС в соответствии с заложенной целевой функцией решения задачи управление человеко-машинным комплексом. Как следует из рисунка ННК, представляет собой систему автоматического управления, которая состоит из четырех блоков.
Рис 1. Общая структура модели оптимизации управления
Модель содержит следующие блоки:
ГА — генетический алгоритм;
ННК — нейро-нечеткий контроллер;
ОУ — объект управления;
ВКУ — вычислитель критерия управления.
На вход ННК в каждый момент времени ti поступает текущее состояние объекта управления Si, на основе которого ННК вырабатывает управляющее воздействие Fi. При этом задачей ННК является приведение ОУ из текущего состояния Si в целевое состояние Star посредством управляющего воздействия Fi. Управление, осуществляемое ННК, зависит от его логической структуры, а так же значений, принимаемых имеющимся в ННК множеством настраиваемых параметров. Если логическая структура ННК может быть полностью предопределена на основе знаний эксперта по управлению ОУ, то значения настраиваемых параметров определяются экспертом лишь приблизительно.
Таким образом, появляется возможность улучшения работы ННК за счет нахождения набора значений параметров ННК, оптимизирующего некоторый критерий качества К управления ОУ. Задача поиска оптимальных значений для набора настраиваемых параметров ННК (в дальнейшем обозначаемом символом P) и есть искомая задача оптимизации ННК. Для решения этой задачи используется генетический алгоритм (ГА). В предлагаемой модели ГА представляет собой эффективную процедуру автоматического поиска значений для набора параметров P, оптимизирующего критерий качества управления K. Поиск осуществляется без использования априорных знаний о характере критерия K, а лишь на основе его значений Kj, получаемых выдвигаемыми самим ГА пробными наборами значений параметров Pj.
Вычисление оценки качества управления производимого ННК реализует блок — вычислитель критерия управления (ВКУ). Данный блок имеет возможность инициировать последовательность из N испытаний работы ННК. В начале каждого испытания ВКУ инициализирует ОУ некоторым начальным состоянием S0k, после чего моделируется функционирование ОУ под управлением ННК, в процессе которого ННК стремится привести систему из исходного состояния S0k к целевому состоянию Star. При этом, ВКУ ведет наблюдение за состоянием ОУ Sik в каждый момент дискретного времени ti. На основе этих наблюдений ВКУ вычисляет оценку качества работы ННК в испытании (учитывается успешность, скорость и точность стремления Sik к Star). Значение критерия Kj, соответствующее тестируемому набору параметров Pj в ННК, вычисляется как результирующая оценка относительно оценок, сделанных в отдельных испытаниях.
Общее описание процесса оптимизации работы ННК состоит в следующем. Весь процесс разбивается на циклы, в каждом из которых производится оценка одного варианта решения задачи оптимизации, определяемого некоторым набором значений параметров ННК Pj. В каждом цикле ГА выдает очередной оцениваемый набор значений параметров Pj, который инициализирует ННК.
ВКУ проводит последовательность из N испытаний, в процессе которых вычисляется значение критерия Kj, соответствующее набору Pj; Значение Kj передается ГА, где оно используется как мера качества очередного предложенного ГА решения. На основе полученной информации о качестве предложенного решения, ГА предлагает новые варианты решений, которые будут испытаны в последующих циклах оптимизации.
Реализуемая ГА поисковая процедура имеет тенденцию находить и выдвигать все более качественные решения в циклах оптимизации. Таким образом, после определенного числа циклов оптимизации может быть получен оптимальный набор значений Popt, максимизирующий K. При этом управление, осуществляемое ННК, инициализированным набором значений Popt, будет оптимальным в смысле введенного критерия качества управления K .
При создании человеко-машинных комплексов приведенные выше рассуждения должны быть ориентированы и расширены на методы ситуационного управления, учитывающие «человеческий фактор». При этом возникает необходимость учета двух требований:
1. Все сведения об объекте управления, целях и критериях его функционирования, множестве возможных решений по управлению и критериях их выбора могут быть сообщены управляющей системе в виде набора фраз естественного языка.
2. Модель управления принципиально открыта и процесс её обучения (формирования) никогда не завершается созданием окончательной формализованной системы.
Данные требования могут быть учтены путем включения в ситуационную модель управления М-сети, являющейся нейрокомпьютером, который предварительно обучен на лингвистические отношения в виде семантической нейрокомпьютерной сети и является открытой системой. Другими словами, такой М-НК в сочетании с классическим нейрокомпьютером является нейро-нечетким контроллером системы поддержки принятий решений (ННК СППР) и позволяет осуществить управляющие воздействия с учетом «человеческого фактора» и технических особенностей системы.
В докладе рассматриваются особенности синтеза ННК СППР, направленные на формирование базовых микроописаний ситуаций, классификацию ситуаций и выявление классов возможных решений, прогнозирование последствий принятия допустимых решений. Особое внимание уделяется вопросу организации структуры ННК СППР для случая совместного действия лиц принимающих решения и операторов. С целью сокращения времени решения в циклах оптимизации предлагается организация на базе М-нейрокомпьютера ННК СППР встроенных подсистем обучения "совместной деятельности". Такие подсистемы должны входить в состав каждого автоматизированного рабочего места и отражать три модели.
1. Модель изучаемого объекта необходима для описания, представления и поддержки текущего состояния объекта. Действия обучаемого являются причиной для изменения состояния модели, а это ведет к изменению ее поведения. Модель копирует характеристики реального объекта. Поведение модели описывается через поведение отдельных компонент и с учетом взаимосвязи между компонентами.
2. Модель актуального состояния содержит информацию о знаниях ЛПР и/или оператора, а именно: знания об отдельных компонентах, знания о работе объекта и о связях между компонентами в объекте, знания о методах решения проблемных ситуаций. Заключение о том, что знает служащий, делается на основе его действий, которые анализируются с помощью правил. Данные модели актуального состояния обучаемого указывают, в какой из этих областей у служащего имеются проблемы.
3. Модель тьютора представляет собой оценки знаний служащего и выдает необходимые указания служащему и управляет процессом его профессиональной деятельности. Для управления обратной связью в модели тьютора используется таблица результатов. Она использует информацию в модели актуального состояния обучаемого для определения, будет ли осуществляться обратная связь и если да, то, какого уровня обратная связь должна быть предъявлена системой.
Уровень сложности этих моделей может варьироваться и определяться развитием информационных систем в ориентации на современные информационные технологии представления и обработки информации. Такие технологии позволяют создавать не только статическую, но и активную информацию в форме приложений. Использование методов гипермедиа позволяет учитывать индивидуальные особенности служащего и добавляют эмоциональный элемент к процессу обучения. Мульти и гиперсредства информации могут изменять способы передачи и восприятия информации. Диалоговое использование фотоизображений, объединенных с динамическими средствами информации типа звукового и видео, позволяет преодолеть проблемы восприятия большого объема информации по сравнению с традиционными способами, ориентированными на привычный простой акт чтения или наблюдения статических средств информации типа текста или графики.
В целом, сложность решаемых задач "совместной деятельности" выдвигает повышенные требования к техническим средствам систем поддержки принятия решений. Создание автоматизированных рабочих мест на основе ННК СППР должно усилить эффективность действий ЛПР при его оперативной работе в нештатных ситуациях, характеризующихся той или иной долей неопределенности и отразить субъективность каждой личности, работающей с такой системой. При этом требуется введение дополнительных мер в методологию организации человеко-машинных процедур принятия решений. Рабочая деятельность ЛПР в составе человеко-машинного комплекса должна сочетаться с его непрерывным обучением принятию решений с помощью СППР в нештатных ситуациях. Иными словами, СППР должна выполнять функции «интеллектуального учителя», обучающего ЛПР действиям в проблемных ситуациях и учитывающего индивидуальные особенности человеческого фактора ЛПР. Такой подход отражает имеющиеся тенденции по синтезу деловой информационной сферы инфраструктур современных предприятий.