Что во все большей и большей степени определяет деятельность человека, как в быту, так и в производстве? Конечно же, это стандартизация. Речь может идти о стандартизации речи, стандартизации одежды и т.д. Но автор, в силу своей профессиональной принадлежности, предлагает рассмотреть развитие стандартизации в области систем поддержки принятия решений (Decision Support Systems — DSS).
Почему такое внимание именно стандартизации? Да прежде всего потому, что нас интересует коммерческое применение прикладных систем, а масштабный бизнес в данной области, как и в любой другой, лежит в области стандартизации. Пылесос, автомобиль и т.п. стали массовыми товарами только после унификации требований к ним, пусть даже с учетом некоторых функциональных групп в рамках единого продуктового типа, скажем: семейный автомобиль, спортивный, внедорожник и т.д. Когда мы видим или слышим эти слова, то у нас возникают совершенно определенные ассоциации, и мы редко бываем обмануты в своих ожиданиях.
Термины и определения
Когда современный специалист, не только в области информационных технологий, но и просто эрудированный производственник, слышит аббревиатуру ERP, то можно в большинстве случаев ожидать вполне адекватного представления, о чем идет речь. Хотя еще лет десять назад это было не так. До сих пор это «не так» и с системами поддержки принятия решений.
С одной стороны, ERP, GIS и многие другие прикладные программные средства можно отнести по функциональному назначению к системам поддержки принятия решений — как минимум на 50% они для этого и создавались. Однако когда мы имеем дело с прикладным программированием, мы вынуждены следовать сложившимся стандартам, которые приписывают любому понятию в данной области определенный смысл. Некоторые отклонения, конечно, возможны, но только вокруг некоторой базовой спецификации.
Так же что такое DSS-система?
Можем найти следующее ее определение:
Decision Support Systems (DSS) является классом компьютеризированных информационных систем, которые поддерживают деятельность по принятию решений.
Это определение, по мнению автора, мало что проясняет и абсолютно не дает возможности идентификации в широком перечне классов информационных систем. Иногда в данного типа определениях присутствует фразы: «система должна облегчать принятие решений», «… анализировать данные и представлять их в удобной для принятия решений форме» и т.п.
Дэниель Пауэр (Daniel Power) в 2002 году идентифицировал пять типов DSS-систем как систем, оперирующих связями, данными, документами, знаниями и моделями.
Вот его определение:
DSS-система — это интерактивная компьютерная система, предназначенная для помощи лицу, принимающему решения, в использовании связей, данных, документов, знаний и моделей для идентификации и решения проблем и формирования решений.
Это уже, по крайней мере, конструктивно, хотя под данное определение попадают опять очень многие классы систем: ERP, GIS, DocFlow, Business Modeller, SCADA/ DCE, Project Management и др.
А вот еще одно определение (Bonczek, Holsapple & Whinston, 1981):
DSS-система должна помогать лицу, принимающему решение, в решении непрограммируемых, неструктурированных (или полуструктурированных) проблем; DSS-система должна предлагать возможности формирования интерактивных запросов в естественном языке, близком к предметному и легко изучаемому.
Это определение, безусловно, сужает область идентификации.
И наконец, еще одно:
DSS-система помогает менеджеру или лицу, принимающему решение, использовать и манипулировать данными, использовать проверки и эвристики, а также строить и использовать математические модели.
В данном определении ссылка на «математические модели» — наиболее сильное место, но это противоречит высказанному ранее требованию легкости формирования языка запросов.
В некоторых определениях упоминается возможность: включения в состав DSS-системы функциональных возможностей искусственного интеллекта.
Ну, в искусственный интеллект, наверное, так сразу лучше не лезть — как минимум, интуитивно понятного языка, близкого к естественному, там нет или нет в большинстве задач.
Упоминаются также как необходимые возможности графического представления данных.
Мало чему помогает в смысле той же идентификации.
Существует связное понятие — Business Intelligence Tools (инструментальные средства бизнес-интеллекта) — программное обеспечение, которое дает возможность пользователям наблюдать и использовать большие объемы сложных данных.
Выделяют три типа таких инструментальных средств:
Средства многомерного анализа — также известные как OLАР (On-Line Analytical Processing) — программное обеспечение, которое дает пользователю возможность наблюдать данные в различных измерениях, направлениях или сечениях.
Инструментальные средства запросов (Query Tools) — программное обеспечение, позволяющее формировать запросы к данным по содержанию или образцу.
Инструментальные средства поиска данных (Data Mining Tools) — программное обеспечение, которое осуществляет автоматический поиск важных образцов (моделей), или зависимостей в данных.
Под приведенное определение Пауэра это попадает и, наверное, к рассматриваемой теме относится. Но давайте пока отвлечемся от прикладной лингвистики. К ней мы вернемся позже — после рассмотрения целей, назначения и конкретных реализаций, которые должны прояснить дело.
Цели, назначение, практика
Что можно считать предметом для систем класса DSS? В качестве такого предмета на основании анализа уже сложившейся практики можно назвать:
финансовый анализ и прогнозирование;
маркетинг реализации и закупок;
анализ стереотипов клиентского поведения и выявление скрытых закономерностей;
анализ рисков;
управление активами.
Каким образом данные задачи соотносятся с общей задачей информационного обслуживания бизнеса? К информационному обслуживанию бизнеса можно отнести:
увязку стратегических задач бизнеса и ИТ;
распределение и контроль прикладного программного обеспечения;
оперативную поддержку пользователей;
а также управление:
проектами;
производственными мощностями;
изменениями;
проблемами;
издержками;
непредвиденными ситуациями;
вспомогательными службами;
взаимоотношениями с клиентами;
взаимоотношениями с поставщиками.
Более укрупненно можно говорить о том, что информационные технологии сосредоточены на обслуживании процессов, связанных с:
людьми;
процессами;
стратегиями;
технологиями.
Как можно видеть, в сферу приложения систем DSS попадает почти половина структурных задач, возлагаемых на ИТ-службы. Это находит подтверждение при анализе рынка прикладных информационных систем. Так, мировой рынок, например, ERP-систем оценивается в настоящее время оборотами порядка 25 млрд. долларов. Рынок DSS-cистем, который возник только в середине 90-х годов, сейчас оценивается суммой порядка 10 млрд. долларов и растет существенно большими темпами, чем рынок корпоративных систем управления. Его рост порядка 30% в год против 10-15% роста ERP-рынка, и можно предположить, что в течение ближайших пяти лет можно ожидать достижения паритета. С другой стороны, если рынок систем DSS в настоящее время в основном связан с финансовым сектором, крупноформатной торговлей и телекоммуникациями, то можно ожидать постепенной ассимиляции функциональных возможностей DSS-систем в существующие системы ERP-класса, что, по-видимому, приведет к оживлению процессов обновления версий ERP-систем в корпоративном секторе.
Анализируя тенденции развития функциональности ERP-систем, можно уверенно говорить о том, что этот процесс уже идет. Так, практически во всех ведущих ERP-системах уже имплементированы функциональные возможности прогнозирования с использованием разнообразных статистических методов. Представляется очень перспективным развитие подходов DSS-систем в управлении активами, в частности, в организации эксплуатации и ремонтов оборудования. Это связано с постепенной миграцией подходов, а именно, от управления ремонтами по состоянию, к управлению на основе прогнозирования будущего состояния производственных мощностей. В Украине в данной сфере еще превалируют календарные подходы и управление эксплуатацией на основе учета наработки. Эти подходы были присущи промышленности развитых стран мира в 80-е годы и являются избыточными по издержкам содержания производственных мощностей.
Рассматривая деятельность корпораций в конкурентном окружении, Майкл Портер, например, выделяет следующую шестифакторную модель (см. рис.).
Диаграмма сравнительной конкурентоспособности по Майклу Портеру
Можно быть уверенным, что в усилении данных конкурентных позиций и лежит основной предмет DSS-систем. Существенным фактором их развития является то, что к настоящему времени в транзакционных системах управления оперативной деятельностью компаний накоплен огромный объем данных, значение которых в настоящее время во многом не осознано и не используется.
Крупноформатная торговля
Крупноформатная торговля и компании электронной коммерции (B2C, B2B) явились первыми институциональными заказчиками на DSS-системы. Основными задачами, решаемыми в данном секторе, являются:
анализ ассортимента (селективный маргинальный доход, оборачиваемость запасов, статистическое управление запасами, фондоотдача);
распределение площадей, раскладка;
анализ эффективности деятельности менеджеров и мотивация персонала;
планирование и анализ эффективности рекламы, акций, распродаж и т.п.;
управление ценообразованием.
В части управления раскладкой можно привести известный пример с корреляцией покупок пива и памперсов. Или так называемая «ловушка на кассе» — это мелкие товары, которые выкладываются непосредственно в кассовой зоне. Площадь этой зоны ограничена. Что туда положить? Опять «нет ничего практичнее хорошей теории» — нужен анализ потребительских предпочтений, который, в частности, дает многомерный статистический анализ чеков.
В мелкооптовой торговле ситуация попроще, т.к. там потребитель идентифицирован и учтен в базе данных торговой компании, что позволяет непосредственно анализировать клиентское поведение. В розничной торговле покупатель анонимный, хотя многие компании изначально это исключают, например, METRO Cash & Carry.
Вообще основная тенденция развития прикладных информационных систем в последние пять лет — это ассимиляция систем управления взаимоотношениями с клиентами, возникших в качестве самостоятельных, в контур ERP, причем обе при этом только выигрывают.
Банки и финансовые компании
Рынок DSS-систем в финансовых институтах сейчас самый емкий. Сфера применения DSS-систем в банках касается прежде всего:
банковского ритейла (платежные пластиковые карты и чеки);
анализа рисков;
предотвращения мошенничества (прежде всего с пластиковыми картами);
анализа потребительского поведения и проектирования новых финансовых услуг.
Последнее, прежде всего, основано на анализе и формировании потребительских групп, которые характеризуются сходным поведением. Результатом этой работы являются проекты, например, молодежных жилищных кредитов, условия овердрафтов, VIP-программы клиентского обслуживания. При этом надо отвечать на вопросы: что такое «молодежь»?, кто такой VIP-клиент? и т.д.
Предотвращение мошенничества — это перспективная зона использования методов искусственного интеллекта, которая никогда не будет исчерпана, как никогда не будет исчерпано воображение у мошенников.
В страховых компаниях DSS-системы еще не имеют такого широкого распространения, но это только подчеркивает потенциальную перспективность данного рынка.
Телекоммуникации
В телекоммуникационных компаниях, прежде всего мобильной связи, роль DSS-систем связана с проектированием новых услуг, которое основано на выявлении устойчивых клиентских групп и преимущественного клиентского поведения. Этот рынок по времени жизни можно считать неисчерпаемым.
Промышленность
В промышленности к сферам применения DSS-систем можно отнести:
управление взаимоотношениями с клиентами;
статистическое управление запасами;
финансовое и бюджетное планирование и управление;
анализ и управление рисками.
Какие изменения в парадигме управления промышленностью произошли за последние 50 лет? До 60-х годов промышленное производство развивалось главным образом за счет развития технологии, что выражалось тезисом: «производить и продавать». В тот период, безусловно, предложение явно формировало спрос. При этом основные производственные фонды были преимущественно материальными: здания, сооружения, оборудование, за которым стояли патентованные технологии.
К концу 20-го века признанным тезисом, выражающим рациональное рыночное поведение, стала парадигма «воспринимать и реагировать». Темп появления новых революционных технологий замедлился, технологии в основном находятся на этапе эволюции. А фронт конкурентной борьбы переместился в область проектирования новых продуктов и услуг. При этом превалирующим стали намерения и пожелания клиентов: явно или неявно выраженные. В качестве примеров можно привести практически полный переход на заказное конфигурирование автомобильной промышленности, постоянно возрастающий спектр предложений услуг в сфере телекоммуникаций при том же самом оборудовании и т.д.
Все большее и большее значение приобретает информация и методы работы с ней. Это тем более актуально в развитых странах мира на фоне сохраняющейся тенденции переноса непосредственно материального производства в развивающиеся страны с низкой стоимостью рабочей силы, энергетических и сырьевых ресурсов. Концепция DSS-систем прямо соответствует задаче информационного обеспечения данной парадигмы.
Каковы сегодня основные промышленные тенденции? Это:
глобализация;
укрупнение;
специализация (для средних компаний);
интеграция в поставочные сети;
фокусировка на разработке новых продуктов и услуг;
необходимость одновременно конкурировать как по качеству, так и по цене.
Промышленность сегодня фокусируется на:
разработке новых продуктов;
коммерциализации;
использовании преимуществ консолидации и интеграции в поставочные сети;
управлении людскими ресурсами.
Анализируя причины отставания США в промышленном развитии, Комиссия Министерства внешней торговли США считает, что для подъема конкурентоспособности, в частности, необходимо (автор приводит только те пункты рекомендаций, которые имеют отношение к предмету рассмотрения, сам исходный перечень немного шире):
уделять больше внимания стратегическому планированию и больше инвестировать в исследования и разработки;
изучать стратегию иностранных конкурентов и совершенствовать собственную;
уделять больше внимания производственной функции и больше инвестировать в оборудование и кадры;
устранить коммуникативные барьеры в пределах организации;
признать ценность развития информационных связей с поставщиками и потребителями.
Информационная поддержка реализации вышеперечисленных рекомендаций со стороны DSS-систем может выглядеть следующим образом:
«уделять … внимание стратегическому планированию…» — анализировать исторические данные по структуре себестоимости, динамике цен;
«изучать стратегию иностранных конкурентов» — анализировать динамику рынков;
«уделять больше внимания производственной функции» — анализировать затраты по управлению активами, динамику тарифов, эффективность использования оборудования и фондоотдачу;
«устранить коммуникативные барьеры» — анализировать исторические данные по параметрам реализации внутренних бизнес-процессов и эффективность результатов;
«признать ценность развития информационных связей» — анализировать исторические данные взаимоотношений с клиентами и поставщиками.
Эффективное решение данных задач требует углубленного анализа как рыночного окружения, так и динамики использования всех внутренних ресурсов.
Особое значение в конкурентной борьбе при практически равной ситуации по возможности доступа к технологиям приобретает персонал и подходы к управлению. В развитых странах мира персонал, по крайней мере, ведущий в стратегическом планировании, переместился из категории «Затраты» (Cost) в категорию «Фонды» — первые надо неуклонно сокращать, а вторые надо развивать и инвестировать.
Также следует отметить, что в настоящее время в мире действует общая глобальная тенденция преимущественного развития рынка услуг по сравнению со сферой непосредственно производства. Экономика все более и более становится информационной, а не материальной.
Рассматривая корпоративный рынок, очень показательным является анализ того, что могут и чего не могут наследуемые системы, прежде всего типов ERP и Project Management.
Оборона
В оборонной области аналитические системы класса DSS развиваются в решении задач:
планирования и управления операциями;
планирования и управления эксплуатацией.
Так, по результатам первой войны в Ираке экономический эффект от использования систем искусственного интеллекта был оценен в сумму порядка 100 млн. долларов. Это привело приблизительно к трехкратному увеличению ассигнований на развитие данных информационных технологий в интересах Министерства обороны США. Сегодня в данной области ассигнования уже оцениваются суммами в миллиарды долларов.
Государство
В области государственного строительства роль DSS-систем пока невелика. Потенциально их область использования связана с оценкой эффективности государственных и муниципальных программ. Это связано, прежде всего, с тем, что государственные и муниципальные программы не сводятся к экономическому эффекту как таковому. Развитие информационных систем в данной сфере в большой мере зависят от философского осмысления роли и места государства в будущем мире, т.е. основополагающую роль в данном процессе имеет выработка критериев и подходов к их оценке.
Предложения
Обобщенный портрет DSS-систем можно составить на основе краткого анализа предложений компаний Cognos, SAS, Hyperion, Oracle. Так как данная статья носит вводный характер, автор не ставил перед собой целью сравнительный анализ продуктов — это тема других работ.
Прежде всего, следует обратить внимание на то, что перечень ключевых игроков на рынке DSS-систем не совпадает с лидирующим списком производителей систем ERP. Присутствие компании Oracle в приведенном списке отражает явно выраженное намерение компании Oracle развивать данное направление, наличие действительно развитого инструментального набора для выполнения подобных проектов, последние приобретения компании в данной области. С этой точки зрения в анализируемый список можно было бы добавить и IBM с Microsoft, но эти производители все-таки больше относятся к инструментальной области и платформам, чем к прикладной.
В основной функциональный набор DSS-систем входят:
финансовое планирование и бюджетирование;
формирование консолидированной отчетности (до 200 преднастроенных отчетов);
создание информационной системы стратегического управления на основе ключевых показателей деятельности (Balance Scorecards) с преднастроенными библиотеками показателей (до 500);
анализ взаимоотношений с клиентами и поставщиками;
анализ рыночных тенденций;
функционально-стоимостный анализ (ABC-Costing);
функционально-стоимостное управление (Activity Based Management, ABM);
система постоянных улучшений (Kiezen Costing);
многомерный анализ данных (OLAP);
выявление скрытых закономерностей (Data Mining);
выявление моделей (структур) данных;
статистический анализ и прогнозирование временных рядов;
событийное управление бизнесом (Event-driven BI);
анализ рисков;
формирование преднастроенных запросов (до 500-600);
интеллектуальный поиск (по неполным данным и неформальным запросам);
бизнес-моделирование и анализ эффективности выполнения бизнес-процессов;
референтные отраслевые модели.
Количество преднастроенных областей анализа достигает 30-40.
Событийное управление бизнесом связано с обнаружением преднастроенных событий вида:
уведомления об определенном состоянии;
исполнение;
операционные события.
Информационной платформой являются хранилища данных (Data Warehouse).
Инструментальная среда — интеграционные системы, основанные на открытых стандартах. Эти системы соответствуют требованиям:
информационной безопасности;
масштабируемости;
открытости;
многомерного и многовариантного представления данных;
интеллектуального интерфейса;
интегрируемости с основными платформами и бизнес-приложениями, интеграция данных из разнообразных источников, сетевая интеграция (прежде всего web);
обеспечивают сервис по «очистке» данных при их загрузке в хранилища.
Техническое обеспечение связано с:
обработкой данных;
надежным хранением данных и обеспечением целостности;
архивацией и восстановлением данных;
сетевым и телекоммуникационным обеспечением;
криптографическим обеспечением;
управлением доступом пользователей;
загрузкой данных, в том числе с использованием средств интеллектуального интерфейса (распознавание образов: текста, речи, изображений).
Отличительной особенностью рассматриваемых продуктов является значительная большая, чем в случае с ERP-системами, готовность к немедленной работе (значительно меньшие циклы внедрения при наличии наследуемых баз данных).
Целевые результаты
Результаты выполнения проектов целевым образом соответствуют предоставлению возможности получения ответов на вопросы:
здоров ли бизнес?
кто мой лучший клиент?
какой мой лучший продукт или услуга?
какого поставщика мне выгодно выбрать и почему?
где мы типично не укладываемся в сроки и почему?
какова эффективность деятельности нашего персонала?
какая дочерняя компания внесла наибольший (наименьший) вклад в результат?
что показывает анализ фондоотдачи оборудования?
какой сценарий и подход выбрать при слиянии (реструктуризации) компаний?
Классификация типовых задач анализа и статистических методов их решения
В настоящем разделе будет приведена возможная классификация аналитических задач, возникающих в сфере бизнеса, финансов и управления и решаемых статистическими методами. Будет рассмотрена также классификация статистических методов, представленных в DSS-системах перечисленных выше компаний, и их применимость для решения различных классов аналитических задач.
Выделим следующие классы аналитических задач в области финансов, бизнеса и управления, требующих для своего решения использования различных статистических методов:
горизонтального (временного) анализа;
вертикального (структурного) анализа;
трендового анализа и прогноза;
анализа относительных показателей;
сравнительного (пространственного) анализа;
факторного анализа.
Далеко не все аналитические задачи из перечисленных выше являются в настоящий момент одинаково важными для каждой конкретной компании. В их повседневной деятельности еще велика доля рутинных бухгалтерских операций и много такого, что пока вовсе не требует никакого анализа. Однако необходимость повышения роли аналитического подхода начинают ощущать даже совсем малые фирмы.
Рассмотрим теперь классификацию методов статистического анализа. Все эти методы могут быть разделены на следующие классы:
описательной статистики;
проверки статистических гипотез;
регрессионного анализа;
дисперсионного анализа;
анализа категориальных данных;
многомерного анализа;
дискриминантного анализа;
кластерного анализа;
анализа выживаемости; анализа и прогноза временных рядов;
статистического планирования экспериментов и статистического контроля качества.
Детальный анализ приведенных математических методов также оставим за пределами нашего обзорного рассмотрения.
Аналитические методы в средствах разведки данных (Data Mining)
Аналитические методы дают конечному пользователю возможность осуществить весь цикл работы с исходными данными, имеющими большие объемы и невыясненную статистическую структуру. Этот цикл называется разведкой данных (Data Mining) и состоит из нескольких этапов: выборка, исследование, модификация, моделирование, оценка результатов (Sample, Explore, Modify, Model, Assess).
Средства Data Mining дают возможность ставить и решать как традиционные, так и нетрадиционные задачи анализа. Например, традиционной является постановка задачи: «Определить, имеется ли статистическая связь между такими показателями, как объем производства товара и объем его реализации (продажи)».
Нетрадиционной же была бы следующая постановка задачи: «Имеется несколько десятков (или даже сотен) показателей деятельности предприятия, и необходимо определить, между какими из них следует искать статистические связи вообще, какого рода связи следует искать (считать ли показатели равноправными, или считать одни показатели независимыми, а другие зависимыми переменными), на каких объектах эти связи проявляются».
При работе приложения на этапе выборки происходит формирование подмножества наблюдений из исходных данных (отбор по критериям или случайный отбор). На этапах исследования и модификации могут быть осуществлены: фильтрация данных, отбрасывание данных с большими выбросами, преобразование исходных переменных. На этапе моделирования осуществляется построение регрессий и оптимизация подмножества переменных, принятие решений на основе методик нейронных сетей, реализующих различные алгоритмы обучения классификации объектов, построение классификационных деревьев для отбора оптимального набора переменных и оптимального разбиения множества объектов, кластеризация и оптимальная группировка объектов. Наконец, на этапе обзора и оценки результатов пользователь имеет возможность сопоставить различные результаты моделирования, выбрать оптимальные класс и параметры моделей, представить результаты анализа в удобной форме.
На этапе подготовки данных обеспечивается доступ к любым реляционным базам данных, текстовым и SAS-файлам. Дополнительные средства преобразования и очистки данных позволяют изменять вид представления, проводить нормализацию значений, выявлять неопределенные или отсутствующие значения. На основе подготовленных данных специальные процедуры автоматически строят различные модели для дальнейшего прогнозирования, классификации новых ситуаций, выявления аналогий. Данные приложения поддерживают построение пяти различных типов моделей — нейронные сети, классификационные и регрессионные деревья решений, ближайшие k-окрестности, байесовское обучение и кластеризацию.
Анализ математического обеспечения существующих систем поддержки принятия решений
Рассмотрим более подробно средства интеллектуального анализа данных (ИАД, Data Mining), применяемые в системах поддержки принятия решений.
В качестве первого направления развития средств ИАД следует выделить методы статистической обработки данных, которые можно разделить на четыре взаимосвязанных раздела:
предварительный анализ природы статистических данных (проверка гипотез стационарности, нормальности, независимости, однородности, оценка вида функции распределения и ее параметров);
выявление связей и закономерностей (линейный и нелинейный регрессионный анализ, корреляционный анализ);
многомерный статистический анализ (линейный и нелинейный дискриминантный анализ, кластер-анализ, компонентный анализ, факторный анализ);
динамические модели и прогноз на основе временных рядов.
Среди наиболее известных и популярных средств статистического анализа следует назвать пакеты Statistica, SPSS, Systat, Statgraphics, SAS, BMDP, TimeLab, Data-Desk, S-Plus, Scenario (BI), «Мезозавр».
Особое направление в спектре аналитических средств ИАД составляют методы, основанные на нечетких множествах. Их применение позволяет ранжировать данные по степени близости к желаемым результатам, осуществлять так называемый нечеткий поиск в базах данных. Однако платой за повышенную универсальность является снижение уровня достоверности и точности получаемых результатов. Поэтому число специализированных приложений данного метода по-прежнему невелико, несмотря на то, что на протяжении последних 35 лет математики-прикладники проявляли к нему повышенный интерес.
Второе крупное направление развития составляют кибернетические методы оптимизации, основанные на принципах саморазвивающихся систем — методы нейронных сетей, эволюционного и генетического программирования.
Однако новые достоинства порождают и новые проблемы. В частности, решения, полученные кибернетическими методами, часто не допускают наглядных интерпретаций, что в определенной степени усложняет жизнь предметным экспертам.
К программным продуктам, использующим кибернетические методы ИАД, относятся системы PolyAnalyst, NeuroShell, GeneHunter, BrainMaker, OWL, 4Thought (BI).
Непосредственно к кибернетическим методам ИАД примыкают синергетические методы. Их применение позволяет реально оценить горизонт долгосрочного прогноза. Особенный интерес вызывают исследования, связанные с попытками построения эффективных систем управления в неустойчивых режимах функционирования.
К третьему крупному разделу ИАД следует отнести совокупность традиционных методов решения оптимизационных задач — вариационные методы, методы исследования операций, включающие в себя различные виды математического программирования (линейное, нелинейное, дискретное, целочисленное), динамическое программирование, принцип максимума Понтрягина, методы теории систем массового обслуживания. Программные реализации большинства этих методов входят в стандартные пакеты прикладных программ, например Math CAD и MatLab.
В четвертый раздел средств ИАД входят средства, которые назовем условно экспертными, т. е. связанными с непосредственным использованием опыта эксперта. К их числу относят метод «ближайшего соседа», который лег в основу таких программных продуктов, как Pattern Recognition Workbench или KATE tools.
Другой подход к выбору решения связан с построением последовательного логического вывода — дерева решений, в каждом узле которого эксперт осуществляет простейший логический выбор («да» — «нет»). В зависимости от принятого выбора, поиск решения продвигается по правой или левой ветви дерева и в конце концов приходит к терминальной ветви, отвечающей конкретному окончательному решению. Здесь процесс статистического обучения выведен за пределы программы и сконцентрирован в виде некоторого априорного опыта, заключенного в наборе ветвей-решений.
Одной из разновидностей метода деревьев решений является алгоритм деревьев классификации и регрессии, предлагающий набор правил для дихотомической классификации совокупности исходных данных. Данный метод обычно применяется для предсказания того, какие последовательности событий будут иметь заданный исход. На основе деревьев решений разработаны такие программные продукты, как IDIS, С5.0 и SIPINA.
К экспертным методам следует отнести и предметно-ориентированные системы анализа ситуаций и прогноза, основанные на фиксированных математических моделях, отвечающих той или иной теоретической концепции. Роль эксперта состоит в выборе наиболее адекватной системы и интерпретации полученного алгоритма. Достоинства и недостатки таких систем очевидны — предельная простота и доступность применения и расплата достоверностью и точностью за эту простоту. Примерами программных продуктов, отвечающих предметно-ориентированным системам в области финансов, являются Wall Street Money, MetaStock, SuperCharts, Candlestick Forecaster.
В завершение обзора экспертных методов ИАД следует упомянуть методы визуализации данных и результатов их анализа, позволяющие наглядно отображать полученные выводы для создания у предметных экспертов и/или руководителей проектов единой картины ситуации. К программным продуктам, позволяющим формировать предварительные отчеты и визуализировать результаты, следует отнести системы Mineset и Impromptu (BI). В частности, система Mineset содержит в себе такие инструменты, как ландшафтный визуализатор, визуализаторы дисперсии, деревьев, правил и свидетельств.
Формировать сложные нелинейные отображения средствами цветной графики позволяет новое направление визуализации результатов, основанное на идеях фрактальной математики.
В начале пути
Если говорить о практике внедрения рассмотренных систем и информационных технологий в Украине, то она находится в самом зачаточном состоянии. Основной целью настоящей статьи и являлось привлечь внимание, прежде всего функциональных руководителей соответствующих служб, к имеющимся возможностям, мировой практике использования систем и основным тенденциям их развития.
Опыт автора по проведению подготовительной работы к внедрению рассматриваемых продуктов показал, что, с одной стороны, на украинских предприятиях исторические данные недооцениваются, а имеющиеся базы данных часто очень «бедны» для извлечения из них значимой информации, т.к. разрабатывались для решения учетных, а не управленческих задач. С другой стороны, в Украине очень ограничены возможности извлечения знаний из данных вследствие большой скорости изменений законодательной базы, что очень сильно искажает временную статистику. Это приводит к необходимости использования, например, нелинейных методов, в развитии которых вместе с украинскими учеными активное участие принимает компания, возглавляемая автором.
Научные направления, имеющие отношение к рассматриваемому вопросу, практически остались за пределами настоящей статьи, как по причине ограниченности формата, так и потому, что относятся в основном к другой сфере знания — самой что ни на есть фундаментальной математике.
Рекомендуемая литература
Efraim Turban, Jay E. Aronson Decision Support Systems and Intelligent Systems (6th Edition). — Prentice Hall, 2000, 912 p.
Э.А. Трахтенгерц. Компьютерная поддержка принятия решений: СИНТЕГ, 1998, 376 с.
Vicki L. Sauter Decision Support System: John Wiley & Sons, Incorporated, 1999, 432 p.
Manuel Mora (Editor), Guisseppi A. Forgionne (Editor), Jatinder N. D. Gupta (Editor) Decision-Making Support Systems: Achievements and Challenges for the New Decade: Idea Group Publishing, 2002, 437 p.
Дэниель Пауэр (Dr. Daniel J. Power) Decision Support Systems: Concepts and Resources for Managers: Quorum Books, подразделение Greenwood Publishing, 2002, 272 p.
Геловани В. А., Башлыков А.А., Бритков В.Б., Вязилов Е.Д. Интеллектуальные системы поддержки принятия решений // М.: Эдиториал УРСС, 2001, 304 с.
Hugh J. Watson, George Houdeshel, R. Kelly Rainer Building Executive Information Systems and Other Decision Support Applications // John Wiley & Sons, Inc., 1996, 512 p.
Дюк В.А., Самойленко А.П. Data Mining: учебный курс // СПб.: Питер, 2001.
B. de Ville. Microsoft Data Mining. Digital Press, 2001.
Introduction to Data Mining and Knowledge Discovery, 2nd edition. By Two Crows Corp., 1998.
IBM, Data Modeling Techniques for Data Warehousing. SG24223800, IBM Corporation, 1998.
J. Han, M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, San Francisco, 2001.