Разработка архитектуры интеграции нескольких информационных систем

Автор: Воскобойникова А.А.

Источник: Восточно-Европейский журнал передовых технологий №40 2009г.

Введение

На сегодня основным достижением развития IT-индустрии в рамках обеспечения и поддержки любой информации и знаний на корпоративном уровне стало внедрение систем управления документооборотом и систем управления знаниями. Крупные предприятия начинают повсеместно использовать достижения и технологии менеджмента знаний для повышения эффективности своей работы. Поэтому, активно разрабатываются и внедряются в жизнь интеллектуальные информационные системы, которые аккумулируют в себе все знания предприятия, представленные в виде онтологии.

На фоне того, что информационные технологии очень быстро развиваются и внедряются во все сферы жизни человека, нельзя упускать из виду того, что они очень разнообразны. Каждое предприятие применяет те программные продукты и архитектуры построения систем, которые считает наиболее оптимальными, опираясь при этом на различного рода критерии: быстродействие, безопасность, стоимость решений и прочее. Поэтому, представление и описание одной и той же информации и знаний в двух разных информационных системах может существенно отличаться.

Эта проблема становится существенной, когда происходит объединение нескольких предприятий, включение одного в состав другого, объединение различных организаций в сообщества и т.д. При этом каждое предприятие (организация) предоставляет другому всю или часть имеющихся в нем информации и знаний, и взаимодействие между ними происходит согласно заключенным договорам или соглашениям. Именно поэтому интеграция двух и более информационных систем, хранящихся в них данных и знаний – актуальная и не тривиальная задача. Эта процедура должна быть максимально оптимальной с точки зрения затрат любых ресурсов.

Анализ существующих подходов к интеграции знаний нескольких информационных систем

Интеграция данных и знаний в большинстве случаев основана на трех методах [1]:

1) консолидация данных. При использовании этого метода данные собираются из нескольких первичных систем и интегрируются в одно постоянное место хранения (недостатки: потребность больших дисковых пространств и, соответственно, увеличение времени для получения ответа из места хранения; разнородность представления данных);

2) федерализация данных обеспечивает единую виртуальную картину одного или нескольких первичных файлов данных. Если бизнес-приложение генерирует запрос к этой виртуальной картине, то процессор федерализации данных извлекает данные из соответствующих первичных складов данных, интегрирует их таким образом, чтобы они отвечали виртуальной картине и требованиям запроса, и отправляет результаты бизнес-приложению, от которого пришел запрос (недостатки: при изменении структуры интегрируемых предприятий приходится соответственно менять виртуальную картину; при интеграции нескольких систем возрастает сложность виртуальной картины);

3) распространение данных – осуществляют копирование данных из одного места в другое. Эти приложения обычно работают в оперативном режиме и производят перемещение данных к местам назначения, т.е. зависят от определенных событий. Обновления в первичной системе могут передаваться в конечную систему синхронно или асинхронно (недостатки: многоразовое дублирование данных; отсутствие контроля версионности документов; запоздалое обновление данных).

Каждый из этих методов, хотя и имеет недостатки, но применим к определенному кругу задач интеграции данных в ИС.

Развитие этих методов и широкое их применение со временем привело к формированию программных технологий (рис.1), на основе которых производится интеграция информации [2]:

- EAI (enterprise application integration) – это технология, с помощью которой организация добивается централизации и оптимизации интеграции корпоративных приложений, обычно используя те или иные формы технологии оперативной доставки информации, которая управляется внешними событиями;

- ETL (extract, transform and load) – это технология, которая преобразует данные (обычно с помощью их пакетной обработки) из операционной среды, включающей гетерогенные технологии, в интегрированные, согласующиеся между собой данные, пригодные для использования в процессе поддержки принятия решений. ETL-технология ориентирована на базы данных, например, хранилище, витрину или операционный склад данных;

- EII (enterprise information integration) – это технология для интеграции в режиме реального времени несопоставимых типов данных из многочисленных источников как внутри, так и за пределами корпорации. Инструменты EII обеспечивают универсальный уровень доступа к данным и используют технологию поиска информации или возможности работы по запросам. Технология EII ориентирована на конкретных сотрудников, которые получают информацию через инструментальную панель или отчет.


Место технологий EAI, EII и ETL

Рис. 1. Место технологий EAI, EII и ETL в уже существующей архитектуре (источник – Intelligent Solutions, Inc.)


На основании концепций, задекларированных в данных подходах, предложены различные методы интеграции данных нескольких систем.

Как развитие федеративного подхода предложен подход, в котором в качестве виртуальной картины выступает описание всех данных предприятия в терминах UML и XML. Такое описание – попытка унифицировать описание всех информационных ресурсов предприятия для обеспечения простоты формирования запросов к виртуальной картине.

Еще одним развитием федеративного подхода является создание корпоративного хранилища данных, к построению которого на сегодня существует четыре подхода:

- создание хранилища по условиям заказчика;

- создания хранилища на основе систем планирования ресурсов предприятия (ERP);

- создание виртуального хранилища;

- создание настраиваемого хранилища.

На основании технологии EAI происходит интеграция процессов и приложений уже существующих информационных систем. В данном случае EAI выступает некой интеграционной платформой [4] между несколькими системами для унификации доступа к данным.

Кар развитие технологии EII разработаны специальные интерфейсы – Knowledge Module. Доступны Knowledge Module для всех промышленных СУБД, текстовых файлов, XML , LDAP , ERP и CRM систем, серверов приложений. Стандарт Knowledge Module открытый, возможна модификация существующих и добавление новых интерфейсов [3].

На сегодня в IT-индустрии уже прочно закрепились такие понятия, как бизнес-процесс, метаданные, системы поддержки принятия решений, Business Intelligence, системы управления знаниями. Все это является составной частью менеджмента знаний.

С учетом новых тенденций в проектировании информационных систем, соответственно поменялись и подходы к реализации их интеграции. Однако, остались неизменными принципы, по которым она производится.

На основании технологий менеджмента знаний для интеграции используются такие методы как:

- реализация витрин и хранилищ знаний;

- проектирование корпоративной памяти;

- использование web-сервисов для реализации запросов пользователя от одной системы к другой.

Помимо перечисленных методов интеграции на основе технологий менеджмента знаний, существует метод интеграции информационных систем, который основан на интеграции онтологий этих информационных систем. Это фактически новое направление интеграции данных и знаний различных предприятий, которое по сути своей не опирается на выше обозначенные методы и технологии интеграции данных. Такой подход дает большое преимущество за счет того, что «по нажатию кнопки» происходит объединение двух онтологий, результатом которого является целостное описание знаний двух систем. Однако, на практике разработчики сталкиваются с отсутствием сопроводительных словарей, трактующих термины онтологии, что препятствует объективному, адекватному автоматическому (без участия человека) объединению онтологий. Еще одной проблемой является то, что не всегда система, построенная на онтологии, может менять свою структуру – это зависит от средства реализации системы. Но самым главным недостатком такого подхода является то, что при увеличении размера онтологии несоразмерно быстро растет время отклика на запрос пользователя.

Проанализировав существующие методы интеграции информационных систем и их недостатки, была предложена новая модель интеграции информационных систем

Разработка архитектуры интеграции ИС на основе технологий менеджмента знаний

При разработке новой архитектуры интеграции информационных систем нужно принять во внимание уже наработанный опыт в данной отрасли IT-индустрии и учесть существующие недостатки для обеспечения максимальной эффективности предложенного метода и подтверждения целесообразности его разработки и применения. Также разрабатываемая архитектура должна базироваться на технологиях и принципах менеджмента знаний и быть web-ориентированной.

Учитывая все эти требования к разработке новой архитектуры интеграции, она должна соответствовать следующим критериям:

1) данные информационных систем не должны перемещаться в какие-либо общие хранилища;

2) не должна создаваться избыточность в дублировании документов;

3) существующий формат документов не должен преобразовываться;

4) не должны создаваться какие-либо новые описания системы, помимо уже присутствующих;

5) интеграция не должна никак изменять существующую структуру интегрируемых систем (исключая те случаи, когда информационная структура предприятия меняется из-за его присоединения к другому предприятию и в соответствии с этим необходимо изменить структуру его информационной системы);

6) описания информационных систем не должны объединятся;

7) потоки данных должны быть максимально прозрачными и описывать бизнес-процессы между интегрируемыми системами.

Эти требования являются достаточно общими, но при этом ограничивают архитектуру интеграции таким образом, чтобы предотвратить возникновение недостатков, которые имеются в уже существующих моделях и архитектурах.

Разработанная архитектура предназначена для интеграции информационных систем, которые построены на основе онтологии.

Концептуальная схема архитектуры интеграции представлена на рис. 2.


Концептуальная схема архитектуры интеграции ИС

Рис. 2. Концептуальная схема архитектуры интеграции ИС


На рис. 2 изображена архитектура интеграции, где:

- Система 1 и Система 2 – это интегрируемые информационные системы, построенные на онтологиях, двух предприятий/организаций, которые заключили договор объединения/сотрудничества;

- Онтология договора объединения/сотрудничества – это онтологически описанный документ, который регламентирует суть и принципы объединения предприятий/организаций и устанавливает необходимые разграничения в установившихся между ними отношениях;

- Агент – это сущность (-ти), которые направляет запросы от Системы 1 к Системе 2 (и наоборот) в рамках разграничений доступа, которые представлены в Договоре.

Разработанная архитектура интеграции предполагает применение следующих подходов к проектированию информационных систем:

1) менеджмент знаний – суть интеграции заключается в том, что объединение информационных систем происходит на основании знания о том, как они должны взаимодействовать;

2) мультиагентный подход – запросы от одной системы к другой будут передаваться специально организованными сущностями, – агентами – которые будут «знать» как устройство онтологии системы, так и устройство онтологии взаимодействия систем;

3) принципы проектирования распределенных систем – конечный пользователь, обращаясь с запросом в систему, которая есть ни что иное, как результат интеграции нескольких систем, фактически не объединенных в единое целое, будет иметь представление работы с однородной системой.

Выводы

В работе были рассмотрены и проанализированы методы интеграции данных и знаний информационных систем, в том числе и интеллектуальных. Были описаны достоинства и недостатки существующих методов интеграции.

На основании проделанного анализа была предложена архитектура интеграции информационных систем, которые построены на онтологиях, основанная на онтологическом описании знаний о взаимодействии систем.

Литература

1. «Интеграция данных и Хранилища» // Подготовлено Intersoft Lab, http://citcity.ru/

2. Клодиа Имхофф Аналитические решения: понимание трех составляющих // Подготовлено Intersoft Lab, http://citcity.ru/

3. Официальный сайт компании Softline Business Intelligence (Softline BI) // http://www.softlinebi.kiev.ua

4. Официальный сайт компании «Ай-Теко» // www.i-teco.ru


Вернуться в библиотеку