ОПЫТ ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТЕЙ В ЭКОНОМИЧЕСКИХ ЗАДАЧАХ

Авторы: Кенин А. М., Мазуров Вл. Д., Первушин Д. Р.


Источник: http://www.uralstars.com/Docs/Editor/Neuro.htm


С помощью нейронных сетей нами решается задача разработки алгоритмов нахождения аналитического описания закономерностей функционирования экономических объектов (предприятие, отрасль, регион).. Эти алгоритмы применяются к прогнозированию некоторых «выходных» показателей объектов. Решается задача нейросетевой реализации алгоритмов. Применение методов распознавания образов или соответствующих нейросетевых методов позволяет решить некоторые назревшие проблемы экономико – статистического моделирования, повысить адекватность математических моделей, приблизить их к экономической реальности. Использование распознавания образов в комбинации с регрессионным анализом привело к новым типам моделей – классификационным и кусочно – линейным. Нахождение скрытых зависимостей в базах данных – это основа задач моделирования и обработки знаний, в том числе для объекта с трудно формализуемыми закономерностями.
Выбор наиболее предпочтительной модели из некоторого их множества можно понимать либо как задачу ранжирования, либо как задачу выбора на основе набора правил.. Практика показала, что методы, основанные на использовании априорных весов факторов и поиске модели, отвечающего максимальной взвешенной сумме факторов, приводит к необъективным результатам. Веса – это то, что надо определить, в этом и состоит задача. Причем наборы весов локальны – каждый из них годится только для данной конкретной задачи и данного объекта (группы объектов).
Рассмотрим задачу выбора искомой модели подробнее. Предположим, что имеется некоторое множество объектов М, деятельность которых направлена на достижение некоторой цели. Функционирование каждого объекта характеризуется значениями n признаков, то есть существует отображение ф: М -> Rn. Следовательно, наш исходный пункт – вектор состояния экономического объекта: x = [x1,…,xn]. Показатели качества функционирования экономического объекта: f0(x), f1(x),…,fm(x). Эти показатели должны находиться в определенных пределах, а некоторые из них мы стремимся сделать либо минимальными, либо максимальными.
Такая общая постановка может быть противоречивой, и необходимо применять аппарат развязки противоречий и приведения постановки задачи к корректной форме, согласованной с экономическим смыслом.
Мы упорядочиваем объекты с точки зрения некоторой критериальной функции, но критерий как правило плохо определен, размыт и возможно противоречив.
Рассмотрим задачу моделирования эмпирических закономерностей по ограниченному числу экспериментальных и наблюдаемых данных. Математическая модель может быть уравнением регрессии или диагностическим правилом, или правилом прогнозирования. При малой выборке эффективнее метолы распознавания. При этом влияние управления факторами учитывается с помощью вариации значений факторов при их подстановке в уравнение закономерности или в решающее правило диагностики и прогнозирования. Кроме того, мы применяем отбор существенных признаков и генерирование полезных признаков (вторичных параметров). Этот математический аппарат нужен для прогнозирования и диагностики состояний экономических объектов.
Рассмотрим нейронную сеть с точки зрения теории комитетных конструкций, как на коллектив нейронов (индивидуумов. Нейронная сеть как механизм оптимизации работы нейронов при коллективных решениях это способ согласования индивидуальных мнений, при котором коллективное мнение является правильной реакцией на вход. то есть нужной эмпирической зависимостью.
Отсюда следует оправданность применения комитетных конструкций в задачах выбора и диагностики. Идея состоит в том, чтобы вместо одного решающего правила искать коллектив решающих правил, этот коллектив вырабатывает коллективное решение в силу процедуры, обрабатывающей индивидуальные решения членов коллектива. Модели выбора и диагностики как правило приводят к несовместным системам неравенств, для которых вместо решений надо искать обобщения понятия решения. Таким обобщением является коллективное решение.
Так, например, комитет системы неравенств – это такой набор элементов, что каждому неравенству удовлетворяет большинство злементов этого набора. Комитетные конструкции – некоторый класс обобщений понятия решения для задач, которые могут быть как совместными, так и несовместными. Это класс дискретных аппроксимаций для противоречивых задач, их можно также соотнести с размытыми решениями. Метод комитетов в настоящее время определяет одно из направлений анализа и решения задач эффективного выбора вариантов, оптимизации, диагностики и классификации. Приведём для примера определение одной из основных комитетных конструкций, а именно: для 0 < p < 1: p – комитетом системы включений называется такой набор элементов, что каждому включению удовлетворяет более чем р – я часть этого набора.
Комитетные конструкции можно рассматривать и как некоторый класс обобщений понятия решения на случай несовместных систем уравнений, неравенств и включений, и как средство распараллеливания в решении задач выбора, диагностики и прогнозирования. Как обобщение понятия решения задачи комитетные конструкции представляют собой наборы элементов, обладающие некоторыми ( но, как правило, не всеми) свойствами решения, это вид размытых решений.
Как средство распараллеливания комитетные конструкции непосредственно выступают в многослойных нейронных сетях. Нами показано, что для обучения нейронной сети точному решению задачи классификации можно применить метод построения комитета некоторой системы аффинных неравенств.
Исходя из сказанного, можно заключить, что метод комитетов связан с одним из важных направлений исследования и численного решения как задач диагностики и выбора вариантов, так и задач настройки нейронных сетей с целью получения требуемого их реагирования на входную информацию по той или иной проблеме лица, принимающего решения.
В процессе эксплуатации метода комитетов выявились такие его важные для прикладных задач свойства как эвристичность, интерпретируемость, гибкость – возможность дообучения и перенастройки, возможность использования наиболее естественного класса функций – кусочно – аффинных, причем для постановки задачи классификации, диагностики и прогнозирования требуется лишь корректность, то есть чтобы один и тот же объект не был отнесен к разным классам.
Другая сторона вопроса о комитетных конструкциях связана с понятием коалиций при выработке коллективных решений, при этом ситуации резко различаются в случае коллективных предпочтений ( здесь много подводных камней) и в случае правил коллективной классификации, в этом случае процедуры можно строго обосновать и они имеют более широкие возможности. Поэтому важно уметь сводить задачи принятия решений и задачи прогнозирования к классификационным задачам.
При диагностике и прогнозировании экономических объектов часто используются веса факторов, которые даются экспертами, а далее проводится голосование мнений экспертов. Однако такие процедуры могут быть некорректными, и существующий аппарат построения корректных процедур достаточно трудно использовать для получения практически значимых решений. Поясним это. Рассмотрим задачу диагностики объектов коллективами экспертов, используя коалиции в задаче коллективного предпочтения. Пусть Х – множество вариантов, из которых нам надо выбрать – по некоторым критериям – определённый вариант х. Пусть проблемой такого выбора занимается набор экспертов или лиц, принимающих решения, набор С. В случае, когда выбор осуществляется на основе предпочтений, каждый член f набора С – это фактически бинарное отношение предпочтения r(f). Это значит, что для некоторых х,у из Х может иметь место утверждение х r(f) y, это значит: для f будет х предпочтительнее, чем у. Коллективное предпочтение r = r ( C ) можно считать некоторой функцией от индивидуальных предпочтений : r = ф( r(f): f пробегает набор С). На первый взгляд такое предположение кажется естественным, но именно оно является источником дальнейших противоречий. Оказалось, что коллективное предпочтение не может быть универсальным правилом, оно зависит от конкретных вариантов х,у и от предпочтений r(f). Иными словами, правило ф не может быть универсальным , оно должно быть локальным.
Нами показано, что при сведении задачи к классификационной можно строить коллективы экспертов ( комитеты), корректно решающие задачу диагностики методы обучения нейросетей в двух слоях, а затем метод комитетов позволил получить точные результаты и обоснованные процедуры обучения, которые позволяют решать широкий класс задач , сводимых к разделению конечных множеств с единственным требованием непустоты их пересечения.
Одно важное направление связано с процедурами голосования при оценке состояний объектов. В сфере голосования ситуация крайне сложна, и здесь на каждом шагу встречаются парадоксы. Нами показано, что противоречий удаётся избежать в случае, когда решение задачи выбора сведено к серии задач классификации, и в этом случае метод комитетов даёт хорошие результаты. Методу комитетов отвечает трёхслойная нейронная сеть, и из теорем существования комитетов следует, что такую сеть можно обучить по прецедентам решению любой задачи, решение которой выражается словом в каком – либо конечном алфавите.
Приведём аргументы в пользу сведения принятия решений к сериям задач классификации. Близкая многокритериальной оптимизации процедура коллективных решений является важнейшей в задачах выбора вариантов. Проблема принятия согласованных решений коллективом людей или коллективом решающих правил возникает постоянно в задачах прогнозирования. Однако оказалось , что нельзя априори предложить наиболее эффективную процедуру голосования. Она всегда зависит от конкретной ситуации и фактически при грамотном подходе превращается в процесс согласования интересов сторон – процесс, требующий большой аккуратности, чтобы не попасть в одну из многочисленных формальных ловушек. Это важно для диагностики коллективами экспертов. Фактически, это игра нескольких лиц, где выигрывает тот, кто хорошо считает и использует малейшие просчёты партнёров. Изучение задачи согласования индивидуальных мнений экспертов и лиц, принимающих решения (ЛПР) сегодня перешло на качественно новый математический уровень.
Решение почти любой задачи можно представить в виде схемы:
Задача Z -> параметризатор S -> x = [x1,…,xn] -> решатель -> arg Z = f(x). Решатель – это компьютер того или иного вида. Вместо того, чтобы говорить об алгоритме решения задачи Z из класса З, будем говорить об алгоритме, позволяющем с помощью программы П восстанавливать по последовательности (коду) х из Х последовательность ( код) y = argZ, y – из Y.
Собственно говоря, этот круг вопросов связан с идеей расщепления сложной задачи в сеть простых задач. Эта идея реализована в разных разделах математики под разными названиями: модульный принцип в пакетах программ (Н.Н. Яненко), принцип расщепления в математической физике (Г. И. Марчук), метод декомпозициии в оптимизации, метод конечных элементов в вычислительной физике и т.д. Спрашивается, можно ли синтезировать решение большой сложной задачи из множества решений подзадач?
Итак, мы решаем следующую конкретную задачу.
Требуется по данным наблюдений ( таблица объект\признак) выявить закономерности вида y = f(x), где у – целевой показатель, х – вектор входных признаков (факторов). На основании этой информации провести прогноз параметров деятельности экономических объектов. Зависимость требуется получить в нейросетевой форме.
С этим подходом связана задача управления признаками. Эта задача распадается на ряд этапов: селекция признаков, преобразование признаков (построение спрямляющего пространства), оценка отдельных признаков и их совокупностей, оценка влияния вариаций признаков на результат классификации.
Настройка нейронной сети на моделирование зависимости y = f(x) сводится к дискриминантному анализу.
Итак, для моделирования эмпирических закономерностей мы рассматриваем задачу дискриминантного анализа – задачу построения функции f из функционального класса F, разделяющую прецедентные множества А и В. Эту задачу обозначим DA(A,B,F): найти f из F: f(x)>0 для х из А, f(x)<0 для х из В.
Разделяющий комитет: C = [ f1,…,fq], причем каждому неравенству нашей задачи удовлетворяет более половины элементов из С.
Эти задачи решаются на основе накопленных наблюдений по динамике показателей. Распознавание образов и регрессионный анализ используются для нахождения эмпирических зависимостей между показателями. Далее на этой основе рассматриваются оценки признаков и систем признаков, отбор полезных признаков и их отбор. А именно, пусть f = arg DA(A,B,F), то есть f - разделяющая функция для множеств А и В. Если имеется вектор состояния объекта: x = [x1,…,xn], который мы хотим перевести в класс А, то мы решаем задачу управления признаками: найти y = [y1,…,yn], чтобы f(x+y) > 0. В более общей модели u – оператор управления, действующий на вектор состояния х так, чтобы в результате х можно было перевести в нужный класс.
Это связано с оценкой факторов: ценность фактора ( входного показателя) xi –это эластичность критериальных (целевых) функций f1,…,fp по отношению к фактору xi, val(x) = матрица, составленная из векторов gradfj(x).
Для детализации содержательной схемы моделирования работы экономического объекта мы должны учесть тот факт. что построение адекватной математической модели экономических показателей требует разработки содержательной концепции экономического и производственного процесса на промышленном объекте и его формализации. Результат – выделение входных и выходных показателей.

ЛИТЕРАТУРА:

Вл. Д. Мазуров. Комитетные решения задач планирования – в кн.: - Методы аппроксимации несобственных задач математического программирования – Свердловск – УНЦ АН СССР – 1984, с. 21 – 25.
Вл. Д. Мазуров. Метод комитетов в задачах оптимизации и классификации – М. – « Наука» - 1990.
В. И. Васильев Распознающие системы. Справочник. – Киев – « Наукова думка» – 1983.
А. Г. Ивахненко. Непрерывность и дискретность. Переборные методы моделирования и кластеризации. – Киев – Наукова думка – 1990.
Выпуски журнала « Автоматика» за 1970– 1980 годы.
А. В, Лапко, С. В. Ченцов и др. Обучающиеся системы обработки информации и принятия решений – Новосибирск – « Наука» – 1996.
Вл. Д. Мазуров, В.В. Попков и др. О применении обучающихся алгоритмов при решении задачи сравнительной оценки деятельности предприятий – Труды ИММ УрО РАН - 1998.
Д. Р. Первушин. Магистерская диссертация.
А. Н. Горбань, Д. А. Россиев. Нейронные сети на персональных компьютерах – Красноярск – «Наука» – 1997.
Б.Г. Миркин. Проблема группового выбора – М. – «Наука» – 1976.