Автор: Melike Bozkaya, Joost Gabriels, Jan Martijn van der Werf
Автор перевода: Горячев Н.В.
Источник:LaQuSo, Laboratory for Quality Software, an activity of Technische Universiteit Eindhoven and Radboud Universiteit Nijmegen, P.O. Box 513, 5600 MB Eindhoven, The Netherlands
1. Введение
Сегодня информационные системы незаменимы в любых организациях. По мере изменения организаций эти системы развиваются от простых, которые легко понять, до сложных систем, которые трудно понять, и, следовательно, трудно поддерживать. Это поднимает вопрос, работает ли система так, как организация думает, что она работает. Этот вопрос обычно происходит в случае, если информационная система имеет некоторые недостатки,
как проблемы с производительностью. Более важно для предприятия,
чтобы контролировать, им нужно убедиться, что система работает
согласно их спецификации.
Информационные системы, поддерживающие процессы, как правило,
записывают все события в журнале. Такой журнал называется журналом событий или контрольный журнал, содержит информацию о событиях, кем и в какое время выполняется: для которых экземпляр действия и процесса, называется регистром. Деятельность может иметь несколько мероприятий. Все события для процесса формируют последовательность, которая называется след или ход этого процесса, и показывает, какие события произошли, в каком порядке и в какое время. Процесс добычи позволяет анализировать эти журналы событий. Процесс майнинга содержится Внутри процесса
, чтобы ответить на такие вопросы, как: как фактический процесс выглядит ?
, соответствуют ли выполненные журналы спецификации, т.е. следуют ли все случаи указанной процессу модели?
, Есть ли какие-либо узкие места в процессе?
, Кто
какие задачи выполняет?
, что обычно работает вместе?
и т.д.
Область интеллектуального анализа процессов охватывает многие области, такие как характеристики производительности (например, время пропускной способности) [1], процесс обнаружения (обнаружение потока управления) [2], [3], [4], процесс соответствия (это спецификация соответствия журнала событий) [5], [6], и социальные сети (например, сотрудничество или субподряд) [7], [8]. Ответы на эти вопросы могут помочь
организации ответить на два основных вопроса: Мы всё
контролируем?
и действительно ли информационная система отражает
состояние процесса?
2. Метод диагностики процесса
Мы представляем методологию быстрой диагностики процесса. Методология направлена на предоставление широкого обзора процесс в информационной системе в течение короткого периода время. Он состоит из пяти этапов: (1) подготовка журнала, в котором журнал событий информационной системы извлекается, (2) журнал осмотра, чтобы получить первый взгляд на процесс, (3) контроль потока, (4) анализ производительности, (5) передача данных и (6) ролевой анализ, то есть люди и ресурсы, которые выполняют действия в процессе. Наконец, результаты сообщаются клиенту. Рисунок 1 показывает диагностику как процесс. Первые два этапа являются входными для анализа потока управления и анализа ролей, производительности анализ также требует ввода анализа потока управления.
Подготовка журнала
В журнале событий каждое событие относится к случаю и деятельности, и имеет отметку времени, указывающую, когда это произошло. Как правило, рассматриваемая информационная система имеет внутренний формат журнала, который содержит всю информацию, но это нужно извлечь, или даже преобразован, чтобы иметь возможность использовать его для процесса добыча. Внутренний формат журналов информационной системы может что-нибудь от простых текстовых файлов до внутренних баз данных, как в Система SAP. Поэтому необходима предварительная обработка журнала. Предварительная обработка уже вызывает много вопросов. Первый шаг выбрать лучшее понятие случая, так как часто есть несколько кандидатов. Следующим шагом является определение видов деятельности и их события. Если журнал имеет несколько отметок времени, семантика из отметок времени должно быть ясно, например, это отметка времени начало события или дела. Такого рода проблемы необходимо заняться, чтобы получить надлежащий журнал событий, чтобы продолжить к следующему этапу.
Журнал осмотра
Следующим этапом является знакомство с журналом событий и получить первый взгляд на процесс, представленный в журнале событий. В На этом этапе собираются статистические данные о журнале. Это включает информация о количестве дел и ролях, общая количество событий, различные события присутствуют, минимальный, максимальное и среднее количество событий на случай, найденное начало и конец событий и их возникновения и т. д. Эта статистика дать представление о размере процесса и журнала событий, и помогает настраивать алгоритмы майнинга и оценивать результаты получены на следующих этапах. Основываясь на этой статистике, событиях, журнал фильтруется для удаления незавершенных случаев, то есть случаев, которые были началось до начала журнала событий, и случаи, которые были все еще работающие в конце журнала событий удаляются. Этот отфильтрованный журнал событий вводится для следующих этапов.
Контроль потока
На этом этапе аспект управления потоком процесса проанализированы. Это дает ответы на вопрос «на что фактический процесс похож? ». Во-первых, если организация имеет описание процесса, проверка соответствия выполняется для проверки соответствует ли процесс спецификации, то есть, что каждый случай в журнале событий могут быть воспроизведены в определении процесса [5]. Если это не так, или описание процесса не существует, поток управления должен быть обнаружен. Здесь очень много алгоритмы, доступные для обнаружения процессов, ср. [2], [12], [13], [14]. Просто запуск различных алгоритмов обнаружения часто дает некоторая модель процесса, но обычно это приводит к модели процесса, подобной спагетти, поскольку нечастое поведение, такое как исключения, также принимаются во внимание. Редкое поведение означает, что есть случай, последовательность которого не встречается слишком часто. Следовательно, чтобы обнаружить модель процесса, которая описывает пробег мельница, необходимо сначала исключить нечастые последовательности, и рассматривать только последовательности с высокой частотой. Следующий По принципу Парето, журнал должен быть отфильтрован так, чтобы по крайней мере 80% журнала покрыты, но это только содержит случаи с высокой частотой встречаемости. Этот журнал событий затем может использоваться для обнаружения потока управления. Хорошая проверка для Модель процесса заключается в проведении проверки соответствия. На этом результат, нечастое поведение может быть отмечено.
Анализ производительности
После обнаружения потока управления эта модель процесса
может быть использован для анализа производительности процесса. Эта
фаза отвечает на такие вопросы, как есть ли узкие места в
процессе?
. Во-первых, анализ точечной диаграммы [14] используется для сравнения
случаев и их пропускной способности. Вертикальная ось пунктирная
диаграмма представляет случаи в журнале событий, горизонтальный
ось представляет время. Это уже дает полезную информацию о
производительность системы.
Затем, воспроизводится журнал модели процесса, узкие места
и пропускная способность отдельных мероприятий и процесса.
Поскольку модель процесса описывает только
пробег мельницы, этого анализа недостаточно. Поэтому после
повторного воспроизведения, различные последовательности должны быть проверены
отдельно, предоставляя ценную информацию о пропускной способности
в случаях с исключениями или другим нечастым поведением.
Передача данных
Цель этого метода – получить представление о процессе организации и их информационном обеспечении Результат диагностики показывает все поведение процесса. Это поведение часто отклоняется от намеченного процесса из-за нежелательного поведения, внешних возбудителей. Диагностика не в состоянии сделать различие между желательным и нежелательное поведение. Поэтому важно спрогнозирвать результат диагностики.
Ролевой анализ
Если журнал событий достаточно богат, или, более точен, если
он содержит информацию о том, кто выполнил событие.
Роли в процессе могут быть проанализированы. Роль – это человек или
событие, которое участвует в процессе, выполняя
деятельность этого процесса. Этот этап дает ответы на вопросы
например, кто выполняет какие действия?
и кто работает
все вместе?
. Сначала создается матрица ролевых действий. В этом
матрица, строки представляют роли, столбцы представляют
каждое событие журнала событий. Каждая ячейка содержит номер сколько
раз эта роль выполнила это событие. Далее для каждой роли
профиль сделан из этой матрицы. Если роли имеют похожие профили,
они образуют группу.
3. Выводы
Таким образом, для того, чтобы ответить на главный вопрос: вcе ли под контролем?
могут быть использованы, приведенные выше методы проведения диагностики.
Диагностика использует только некоторые из
доступных методов анализа, и может быть выполнена в короткий
промежуток времени.
[1] P. Hornix, Performance analysis of business processes through process
mining,
Master’s thesis, Technische Universiteit Eindhoven, 2007.
[2] W. van der Aalst, A. Medeiros, and A. Weijters, Genetic process
mining
in ICATPN 2005, ser. LNCS, vol. 3536, 2005, pp. 48 – 69.
[3] C. Gunther and W. van der Aalst, Fuzzy mining: Adaptive process ?
simplification based on multi-perspective metrics,
in BPM 2007, ser.
LNCS, vol. 4714, 2007, pp. 328 – 343.
[4] J.M. van der Werf, B. van Dongen, C. Hurkens, and A. Serebrenik,
Process discovery using integer linear programming,
in ATPN, ser.
LNCS, vol. 5062, 2008, pp. 368 – 387.
[5] A. Rozinat and W .van der Aalst, Conformance testing: Measuring the
fit and appropriateness of event logs and process models,
in BPM 2005
Workshops, ser. LNCS, vol. 3812, 2005, pp. 163 – 176.
[6] A. Rozinat and W. van der Aalst, Conformance testing: Measuring the
fit and appropriateness of event logs and process models,
in BPM 2005
Workshops, ser. LNCS, vol. 3812, 2005, pp. 163 – 176.
[7] W. van der Aalst, H. Reijers, and M. Song, Discovering social networks
from event logs,
Computer Supported Cooperative Work, vol. 14, no. 6,
pp. 549 – 593, 2005.
[8] M. Song and W. van der Aalst, Towards comprehensive support for
organizational mining,
Technische Universiteit Eindhoven, Tech. Rep.,
2007.
[9] W. van der Aalst, B. van Dongen, C. Gunther ? et al., Prom 4.0:
Comprehensive support for real process analysis, in ICATPN, ser.
LNCS, vol. 4546, 2007, pp. 484–494.
[10] W. van der Aalst, H. Reijers, A. Weijters, B. van Dongen, A. Alves de Medeiros, M. Song, and H. Verbeek, Business process mining: an
industrial application,
Information Systems, vol. 32, no. 1, pp. 713 –
732, 2007.
[11] A. Rozinat, I. de Jong, C. Gunther, and W. van der Aalst, Process mining of test processes: a case study,
Technische Universiteit Eindhoven,
Tech. Rep. WP 220, 2007.
[12] W. van der Aalst, A. Weijters, and L. Maruster, Workflow mining:
Discovering process models from event logs,
IEEE Transactions on
Knowledge and Data Engineering, vol. 16, no. 9, pp. 1128 – 1142,
September 2004.
[13] A. Weijters, W. van der Aalst, and A. Alves de Medeiros, Process
mining with the HeuristicsMiner algorithm,
Technische Universiteit
Eindhoven, Tech. Rep. WP 166, 2006.
[14] M. Song and W. van der Aalst, Supporting process mining by showing
events at a glance,
in WITS 2007, 2007.