Бова В.В., Дуккардт А.Н. – Применение искусственных нейронных сетей для коллективного решения интеллектуальных задач

В библиотеку

УДК 002.53:004.89

Бова В.В., Дуккардт А.Н.

ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ КОЛЛЕКТИВНОГО РЕШЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ

Изложены возможности интеллектуальных информационных технологий основанных на искусственных нейронных сетях. Выявлены особенности применения нейросетевых систем поддержки принятия решений для различных предметных областей. Рассмотрена возможность применения искусственных нейронных сетей для коллективного решения интеллектуальных задач. Предложен подход, в основе которого лежит одновременное использование нескольких нейронных сетей для получения коллективного решения задачи. Определены тенденции и направления развития нейросетевых технологий.

Интеллектуальные технологии; искусственные нейронные сети; нейросетевые модели; задачи поддержки принятия решений; коллективное решение.

V.V. Bova, A.N. Duckardt

APPLICATION OF ARTIFICIAL NEURAL NETWORKS FOR COLLECTIVE DECISION OF COMPLEX INTELLIGENT PROBLEMS

The paper shows intelligent information technology capabilities which are based on artificial neural networks. Also it has been released of aspects of artificial neural networks applying for decision-making system of variety subject areas. In this paper the artificial neural networks applying for making collective decision for complex problem is shown. The approach which is based on the using of multiple neural networks for solving the problem has been released for getting the effective decision of complex intelligent problem.

Intelligent technology; artificial neural networks; neural networks models; decision-making problem; collective decision.

Введение. Информационные технологии на основе искусственного интеллекта и нейронных сетей активным образом проникают во все сферы жизни общества и становятся тем инструментом, с помощью которого успешно решаются вопросы эффективного применения интеллектуальных информационных технологий (ИИТ) и возможностей компьютерных систем при решении сложных прикладных задач.

В работах [1–3] отмечаются характерные особенности задач, решаемых на основе ИИТ: неполнота и неточность исходных данных о решаемой задаче; наличие недетерминизма в процессе поиска решения; высокая вычислительная сложность получения результатов. Перечисленные особенности не позволяют использовать для решения таких задач строгие алгоритмические методы и модели.

В настоящее время активно ведутся исследования в области создания методов, моделей, технологий, систем и средств интеллектуальной поддержки принятия решений (ИППР), основными тенденциями развития которых, являются следующие:

усиливается их ориентация на решение слабо структурируемых и неструктурируемых проблем, характеризующихся невозможностью использования типовых подходов, основанных на точном описании проблемных ситуаций;
парадигму систем и средств ИППР включаются методы и модели, основанные на представлении и обработке разнокачественных (в т.ч. и экспертных) данных, знаний;
смещается акцент в сторону «активной» поддержки принятия решений;
все более широкое использование находят принципы модульности, гибридности, адаптивности, «реального времени»;
широко используются методы и технологии интеллектуального анализа данных и знаний.

Помимо методов, моделей и технологий, которые традиционно используются для решения сложных, трудно формализуемых, интеллектуальных задач (например, имитационного моделирования, исследования операций, кластеризации, «классического» искусственного интеллекта), так же ведутся интенсивные исследования в области разработки интеллектуальных технологий, к которым, в первую очередь, относятся нейросетевые технологии.

Особенно важным в этих исследованиях представляется изучение и использование на практике новых подходов и методов для решения сложных задач управления, информационного мониторинга, диагностики, автоматизированного проектирования, распознавания образов, классификации на основе технологий искусственных нейронных сетей (ИНС), эволюционного моделирования и генетических алгоритмов, нечеткой логики, а также различных гибридных технологий (нейро-нечетких, нейро-генетических).

Повышение эффективности реализации в ИППР механизмов обучения, самообучения и адаптации к особенностям проблемной среды определяют актуальность построения гибридных моделей, формирующихся на основе интеграции нейросетевых, мультиагентных и когнитивных технологий.

1. Особенности применения нейронных сетей. Ввиду высокой сложности, а иногда и невозможности, получения формализованного математического описания интеллектуальных задач, наиболее перспективными ИИТ являются быстро развивающиеся технологии ИНС. Однако, проведенный анализ работ [2−5] показал, что ряд задач, связанных с эффективным использованием технологии ИНС, остается нерешенным. К ним относятся: небольшой выбор алгоритмов обучения многослойного персептрона, альтернативных методу обратного распространения ошибки; отсутствие методов автоматической подстройки параметров алгоритма обучения во время процедуры обучения; недостаточно гибкие настройки автоматического останова процедуры обучения; отсутствие методов автоматического формирования топологии нейронной сети; методов интерпретации результатов работы сети.

ИНС обладают следующими неоспоримыми и важными для практического использования преимуществами:

нейросети являются адаптивными самообучающимися системами, извлекающими на примерах информацию из реальных процессов, которые динамически промоделировать достаточно трудно, а зачастую, просто невозможно, т.к. они часто содержат значительный массив скрытых, неконтролируемых, неполных и зашумленных параметров и взаимных связей между ними;
их применение позволяет решать задачи, которые трудно или невозможно решить традиционными методами в силу отсутствия формализованных математических описаний процессов функционирования;
обладают ассоциативной памятью и в процессе работы накапливают и обобщают информацию, от чего эффективность их со временем возрастает;
их использование базируется на обучении нейросети для извлечения информации из опытных данных, что обеспечивает объективность результатов и повышает их надежность и достоверность;
предоставляют возможность распараллеливания вычислений и могут использоваться в реальном масштабе времени.

Главной отличительной чертой ИНС от других методов интеллектуального анализа является глобальность связей. Базовые элементы ИНС − формальные нейроны, изначально нацелены на работу с векторной информацией. Каждый нейрон, как правило, связан со всеми нейронами предыдущего слоя обработки данных. Специализация же связей между нейронами происходит лишь на этапе обучения на конкретных данных.

Aрхитектура ИНС представляет собой иерархическую последовательность нескольких слоёв (непересекающихся подмножеств). В различных слоях ИНС могут использоваться разные нейроны, но каждый слой ИНС состоит из нейронов одного типа. При этом обработка информации в каждом слое ИНС осуществляется параллельно. Каналы связи между предыдущим и последующим слоями ИНС, чаще всего, являются однонаправленными и имеют регулируемые веса (синаптические параметры). Эти веса связей настраиваются в процессе обучения и самоорганизации архитектуры ИНС по имеющимся экспериментальным данным или прецедентам.

Архитектура ИНС в процессе обучения может меняться за счет изменения связей между нейронами. Каждый формальный нейрон производит простейшую операцию − взвешивает значения своих входов со своими же локально хранимыми синаптическими весами и производит над их суммой нелинейное преобразование. Нелинейность выходной функции активации нейронов сети принципиальна. Если бы нейроны были линейными элементами, то любая последовательность нейронов также производила бы линейное преобразование, и вся ИНС была бы эквивалентна одному слою нейронов. Нелинейность разрушает линейную суперпозицию и приводит к тому, что возможности ИНС существенно выше возможностей отдельных нейронов.

Традиционно ИНС используются для автономного принятия решений в задачах распознавания образов, диагностики состояний, классификации данных и т.п. По существу эти ИНС являются обучаемыми интеллектуальными агентами, которые настраиваются на индивидуальное решение конкретных задач. Главной задачей ИНС является распознавание сенсорной информации и выработка адекватной реакции на внешние воздействия. При этом они не выполняют внешних алгоритмов, а вырабатывают собственные в процессе обучения, которое представляет собой процесс самоорганизации распределенной вычислительной среды - нейронных ансамблей. В распределенных нейронных сетях происходит параллельная обработка информации, сопровождающаяся постоянным обучением, направляемым результатами этой обработки. ИНС в процессе своего обучения не решают формализованных задач, они отбраковывают неверные решения. Таким образом, элиминация ошибок является основой любого обучения.

2. Двухуровневая процедура коллективного решения интеллектуальных задач. При построении моделей ИППР существует большой класс интеллектуальных задач, требующих не только индивидуальных, но и коллективных решений. При решении таких интеллектуальных задач ИНС можно рассматривать, как на коллектив индивидуумов. Каждый нейрон ИНС является членом данного коллектива. То есть ИНС выступает как механизм оптимизации работы отдельных нейронов при коллективных решениях и является способом согласования индивидуальных мнений, при котором коллективное решение является правильной реакцией на вход. Идея такого подхода состоит в том, что в процессе обучения все нейроны приобретают веса, в соответствии с которыми они участвуют в коллективном решении. Особенность каждого элемента состоит в том, что он действует в некотором подпространстве исходного пространства, характер которого определяется связями между нейронами. Решение, получаемое на выходе сети, можно интерпретировать как средневзвешенное решение коллектива.

Рассмотрим функционирование ИНС с точки зрения теории коллективных решений [6]. Пусть для некоторого входного воздействия Х принимается решение S. Тогда S=R(X), где R – некоторый алгоритм принятия решения для входа X. Предположим, что существует L различных алгоритмов решения задачи, т.е. Sl=Rl(X), l=1, 2,.., L, где Sl – решение, полученное алгоритмом Rl. Будем называть множество алгоритмов {R}={R1, R2, ..., Ri.} коллективом алгоритмов решения задачи (коллективом решающих правил), если на множестве решений Sl в любой ситуации Х определено решающее правило F, т. е. S=F(S1, S2, ..., SL, X). Алгоритмы Rl принято называть членами коллектива, Sl – решением l-го члена коллектива, а S – коллективным решением. Функция F определяет способ обобщения индивидуальных решений в решения коллектива S.

Поэтому синтез функции F, или способ обобщения, является центральным моментом в организации коллектива. Наиболее интересными коллективами алгоритмов являются такие, в которых существует зависимость веса каждого решающего правила Rl. Например, вес решающего правила Rl может определяться соотношением:

Формула 1 (1)

где Bl – область компетентности решающего правила Rl. Веса решающих правил выбираются так, что

Формула 2 (2)

для всех возможных значений X. Соотношение (1) означает, что решение коллектива определяется решением того решающего правила Ri, области компетентности которого принадлежит частное решение X. Такой подход представляет собой двухуровневую процедуру решения. На первом уровне определяется принадлежность решения той или иной области компетентности, а уже на втором – вступает в силу решающее правило, компетентность которого максимальна в найденной области. Решение этого правила отождествляется с решением всего коллектива.

3. Комплексный подход к решению задачи с помощью коллектива ИНС. Другим примером сложных задач, требующих принятия коллективных решений, являются глобальные задачи, допускающие естественную (например, иерархическую или мультифрактальную) декомпозицию на множество локальных задач. Для решения таких задач прибегают к коллективу нейронных сетей − это подход, в основе которого лежит одновременное использование конечного числа предварительно обученных нейронных сетей. Этот подход впервые был предложен в работе [6], в которой было показано, что способность к обобщению системы на основе нейронных сетей может быть значительно повышена за счет их объединения в коллектив. Суть такого подхода состоит в том, что решение сложной (глобальной) задачи может быть распределено между интеллектуальными ИНС-агентами, специализирующимися на решении M частных (локальных) задач. Параллельная работа M таких ИНС-агентов может значительно ускорить обработку информации и повысить надежность решения исходной задачи. При решении такого рода задач вводятся специальные агенты-координаторы, которые могут принимать коллективные решения на основе локальных решений остальных N ИНС-агентов с помощью принципов теории принятия решения или различных процедур голосования [6–8]. При этом все локальные решения принимаются параллельно, что ускоряет принятие коллективного решения в N раз.

В ряде случаев глобальная самоорганизация ИНС-агентов обеспечивается иерархической, фрактальной или мультифрактальной декомпозицией общей задачи на N подзадач. При этом степень внешнего параллелизма в мультиагентной нейросетевой системе определяется параметром N, характеризующим одновременную работу N локальных ИНС-агентов.

К настоящему времени такой метод решения интеллектуальных задач был значительно развит и успешно применен в различных сферах, таких как распознавание лиц, распознавание символов, предсказание землетрясений и т.п. В общем случае решение задачи с помощью коллектива нейронных сетей предполагает формирование и обучение конечного множества нейронных сетей, претендующих на то, чтобы их решение было учтено в общем решении, а затем определение такого способа согласования индивидуальных решений, чтобы общее итоговое решение было наилучшим. Например, наиболее распространенными вариантами комбинирования решений отдельных нейронных сетей являются равноправное или неравноправное голосование для задач классификации и простое или взвешенное усреднение для задач регрессии [8]. Наиболее разработаны варианты с взвешенным усреднением или неравноправным голосованием. Например, в работе [7] для оценки весовых коэффициентов вклада отдельных нейронных сетей в общее решение используется оценка качества их индивидуальных решений, а так же для определения весовых коэффициентов принятых решений может использоваться генетический алгоритм [9, 10].

В общем случае комплексный подход к решению задачи с помощью коллектива нейронных сетей включает в себя два этапа. Для использования в системах анализа данных желательно, чтобы оба эти этапа были автоматизированы. Первый этап предполагает формирование структуры и обучение нейронных сетей, которые будут включены в коллектив или предварительный пул.

Второй важнейший этап включает в себя отбор тех сетей, с помощью решений которых будет сформировано итоговое решение, а так же определение способа и параметров формирования общего решения. Для повышения эффективности выполнения этого этапа предлагается подход, позволяющий автоматически выбирать из сформированного предварительно пула нейронные сети, участвующие в принятии коллективного решения, сформированного в виде различных преобразований и комбинаций (линейных и нелинейных) отдельных участников коллектива нейронных сетей. Предполагается, что, используя коллектив ИНС, возможно найти более эффективное решение задачи с помощью формирования более сложных комбинаций решений отдельных нейронных сетей, чем простое или взвешенное усреднение и равноправное или неравноправное голосование.

Общее коллективное решение, сформированное с помощью коллектива ИНС, представляет собой некоторую функцию, входными параметрами которой являются частные решения нейронных сетей, включенных в коллектив:

Формула 3 (3)

где Q – общее решение, Qi – индивидуальное решение i -й сети, n – число сетей в коллективе. Такой подход позволяет расширить гибкость системы, за счет отсутствия твердо закрепленной структуры взаимодействия между индивидуальными сетями, формирующими коллектив. При этом формируется не только структура взаимодействия между членами коллектива, но и косвенно (т.е. за счет включения или не включения соответствующих аргументов в формулу общего решения) отбирает те нейронные сети, решения которых будут наиболее полезны в плане эффективности решения интеллектуальной задачи.

Как было отмечено выше, для интеграции решений частных ИНС, как правило, применяется принцип взвешенного голосования [8].

При синтезе коллективного классификатора основной задачей является построение областей компетенции частных классификаторов. Под областью компетенции понимается подмножество объектов признакового пространства, в пределах которого определена сфера действия частного классификатора с заданным подмножеством распознаваемых образов. В данной работе предлагается определять области компетенции частных нейросетевых классификаторов из условия статистической однородности взаимного поведении признаков.

Для формализации схемы взвешенного голосования введем коэффициент надежности классификации μlj≤1 образа ИНС частным классификатором. Определим этот коэффициент как долю объектов с заданным значением образа, попадающих в область компетенции l-го классификатора

Формула 4 (4)

где F(j) – накопленная частота решения j в исходной базе данных, Fl(j) – накопленная частота решения для частной ИНС в его собственной области компетенции. Голосующая функция j-го класса определяется выражением:

Формула 5 (5)

здесь суммирование производится по всем ИНС. В данной сумме значение μlj берется равным нулю, если решение X не принадлежит области компетенции частной ИНС. Решение о принадлежности решения X некоторой области компетентности А принимается по следующему правилу:

Формула 6 (6)

Заключение. Коллективное использование ИНС в качестве нейросетевых агентов позволяет дополнительно распараллелить и распределить между локальными ИНС-агентами процессы решения сложных, трудноформализуемых интеллектуальных задач, таких как задачи распознавания образов, анализа изображений и сцен, векторной диагностики состояний и адаптивной маршрутизации и классификации информационных потоков [11].

Однако применение одной ИНС при решении сложных задач, не всегда приводит к получению качественных решений, поэтому наиболее перспективным является направление объединения различных моделей ИНС, предназначенных для решения конкретных задач и выработки некоторого коллективного решения, являющегося наиболее оптимальным.

В результате проведенного исследования авторы выделяют основные направления развития нейросетевых технологий при решении сложных интеллектуальных задач:

разработка новых разновидностей нейроподобных элементов ИНС;
комплексирование нейросетевых моделей различных типов;
создание новых и совершенствование существующих алгоритмов обучения ИНС;
разработка способов и методик построения и использования ИНС для решения задач в различных предметных областях.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

Бова В.В., Курейчик В.В., Нужнов Е.В. Проблемы представления знаний в интегрированных системах поддержки управленческих решений // Известия ЮФУ. Технические науки. − 2010. − № 7 (108). − С. 107-113.
Бова В.В. Модели предметных знаний на основе системно-когнитивного анализа // Известия ЮФУ. Технические науки. − 2010. − № 7 (108). − С. 146-153.
Тимофеев А.В. Мульти-агентные робототехнические системы и нейросетевые технологии // Известия ЮФУ. Технические науки. − 2010. − № 3 (104). − С. 20-23.
Нагоев З.В., Бозиев А.О. Классификация изображений на основе модели онтонейроморфогенеза // Известия Кабардино-Балкарского НЦ РАН. − 2011. − № 1. − С. 196-200.
Осовский С. Нейронные сети для обработки информации / пер. с польск. – М.: Финансы и статистика, 2002. – 344 с.
Zhou Z.H., Wu J., Tang W. Ensembling neural networks // Many could be better than all, Artif. Intell. – 2002. – Vol. 137, № 1-2. – Р. 239-263.
Ляхов А.Л., Алешин С.П. Искусственная нейронная сеть как измерительный инструмент адекватности модели с адаптивным классом точности // 4-я МНПК «Математическое и имитационное моделирование систем»: Тезисы докладов. – Киев: ИПММС НАН Украины, 2009. – С. 116-119.
Воеводин Ю.Ю., Комарцова Л.Г. Применение генетического алгоритма для оптимизации параметров нейронной сети в задачах классификации // Информатика: проблемы, методология, технологии. – М.: Изд-во МГТУ им Баумана, 2005. − С 42-46.
Курейчик В.М. Проблем, обзор и параллельные генетические алгоритмы: состояние // Известия РАН. Теория и системы управления. – М., 2010. – № 4. – С. 72-82.
Дуккардт А.Н., Лебедев Б.K. Комплексный гибридный генетический алгоритм // Известия ЮФУ. Технические науки. – 2008. – № 4 (81). – С. 26-32.
Кравченко Ю.А. Метод создания математических моделей принятия решений в многоагентных подсистемах // Известия ЮФУ. Технические науки. − 2011. − № 7 (1120). − С. 141-145.

В библиотеку