Інтеграція баз даних та баз знань на основі онтологгії

Автор: Глоба Л.С, Терновой М.Ю., Штогріна О. С.

Источник: Сборник научных работ НТУУ «КПИ» № 1 – 2011


На сьогоднішній день організації використовують велику кількість інформації, як зберігається в розподілених гетерогенних джерелах. Для зберігання та обробки великих об'ємів формалізованої інформації найбільш часто використовують реляційні бази даних (БД). Це обумовлено їх структурою та механізмами вибірки даних, які основані на реляційній алгебрі [1,2]. Також важливим джерелом інформації та основою для прийняття рішень є досвід співробітників, кожен з яких є експертом у своєму напрямку. Людина приймаючи рішення на основі попереднього досвіду, не завжди в змозі бачити картину в цілому та враховувати всі фактори, які впливають на результат. Щоб підвищити ефективність роботи необхідно використовувати системи, які призначені для підтримки прийняття рішень. Такі системи використовують знання, які отримані від експертів. Ці знання, як правило, зберігаються в базах знань (БЗ). Оскільки експерти у своїй роботі як правило оперують неточними та нечіткими поняттями, то ці знання можуть бути представлені у вигляді баз нечітких знань [3,4]. БЗ є складовою частиною систем підтримки прийняття рішень [2,3] та призначені для аналізу інформації шляхом побудови логічного виведення на їх основі. Для здійснення виведення необхідно подати на вхід БЗ вихідні дані. Ці дані, як правило, вводяться користувачем виходячи з інформації, що попередньо отримана та агрегована з різнорідних джерел таких як бази даних. Процес отримання та агрегації інформації вимагає від користувача спеціальних знань в інформаційних технологіях. Все це ускладнює отримання та обробку інформації та знижує швидкість прийняття рішень. Для підвищення ефективності роботи необхідно надати користувачам можливість отримання консолідованої інформації з баз даних та на її основі експертних оцінок з використанням баз знань не володіючи спеціальними знаннями в області інформаційних технологій [5]. Існує ряд підходів, які дозволяють інтегрувати гетерогенні БД, на основі термінологічних словників та онтологій [6-9], а також підходи що надають можливість інтеграції БД за рахунок представлення схем реляційних БД у об'єктному вигляді [10]. Але важливим напрямком є інтеграція в єдиній системі не тільки даних, а й знань. Проблема побудови такої системи полягає в тому, що різні БД та БЗ можуть мати різну структуру, для опису якої використовуються різні терміни, позначення, алфавіти та ін.. Це ускладнює процес отримання даних з таких БД та логічне виведення на основі БЗ. Метою інтеграції БД та БЗ є надання єдиного інтерфейсу доступу до даних та знань, що в результаті полегшить користувачу роботу з такими системами. Вищенаведене обумовлює необхідність створення підходу та системи взаємодії, які дозволять автоматизувати процес обробки інформації та підтримки прийняття рішень на основі знань з БЗ використовуючи інформацію з гетерогенних БД.

1. Структурна схема інтеграції баз даних та баз знань з використанням онтології

Як рішення поставленої задачі пропонується використовувати онтологію предметної області для організації зв'язку між гетерогенними базами даних та базами знань (Рис.1). Онтологія включає машинно-інтерпритуємі формулювання основних понять предметної області та відношення між ними. Використання онтології дозволяє уніфікувати різнорідну інформацію, покращити загальне розуміння структури інформації, відновити логічні зв'язки, яких не вистачає, отримати цілісну картину предметної області, повторно використовувати знання про предметну область та робити висновки на їх основі. Так як онтологія містить не тільки словник термінів, а й відношення між ними, то це дозволяє покращити пошук по предметній області, виконувати аналіз, класифікацію та візуалізацію знань. Також на основі онтології можлива інтеграція прикладних програм користувача.

Зв'язок гетерогенних баз даних та баз знань за допомогою онтології

Рисунок 1. – Зв'язок гетерогенних баз даних та баз знань за допомогою онтології


Для реалізації поставленої задачі на основі запропонованої структурної схеми необхідно визначити та описати функціональність системи взаємодії та порядок її роботи. Система взаємодії повинна мати можливість підключення баз даних, в яких зберігаються дані організації, та баз знань, використовуючи які можливо проводити логічні виведення та отримувати оцінку. Система взаємодії повинна містити онтологію предметної області, яка є основою для єдиної термінології та містить логічний опис предметної області. Для здійснення зв'язку між різними БД та БЗ на основі онтології потрібен механізм, який би дозволяв звертатись до БД та БЗ використовуючи терміни онтології. Таким чином, система взаємодії також повинна включати базу метаданих U , за допомогою якої описується зв'язок між термінами онтології та структурами баз даних, та базу метаданих V , яка містить опис зв'язків між термінами онтології та термінами баз знань.

2. Функціональна схема інтеграції баз даних та баз знань з використанням онтології

При використанні системи взаємодії запропонованим чином користувач повинен мати можливість здійснювати запити двох типів. Перший тип запитів – це запити до баз даних на тримання даних, блок-схема цього запиту наведена на рис. 2. Другий – запити до баз знань, які дозволяють, на основі проведеного виведення, оцінити ситуацію. Блок-схема, яка відображає послідовність дій при виконанні запиту наведена на рис.3.

Блок-схема запиту на отримання даних

Рисунок 2. – Блок-схема запиту на отримання даних


Блок-схема запиту на оцінку

Рисунок 3. – Блок-схема запиту на оцінку


3. Висновки

Побудова системи взаємодії таким чином, щоб вся інформація була описана та пов'язана за рахунок використання онтології, дозволяє користувачам взаємодіяти з системою використовуючи єдину термінологію. Такий підхід дозволяє спільно використовувати та однаково розуміти структуру всієї інформації, як людьми так і комп'ютером, а також використовувати всю інформацію, що є у наявності. При цьому користувач не зобов'язаний володіти спеціальними знаннями в області інформаційних технологій про отримання та обробку інформації, так як з'являється можливість проведення обробки інформації використовуючи природну мову. Також автоматизується підтримка прийняття рішень на основі знань, які представлені у вигляді математичних моделей, та можуть повторно використовуватись.

Література

1. Коннолли Т. Базы данных: проектирование, реализация и сопровождение. Теория и практика / Т. Коннолли, К. Бегг, А. Страчан // М.: Издательский дом «Вильямс», 3-е изд.:Пер. с англ.: Уч.пос. 2003. – 1440с.

2. Корнеев В.В. Базы данных. Интеллектуальная обработка информации. / В.В. Корнеев, А.Ф. Гарев, С.В. Васютин, В.В. Райх // М.: Нолидж, 2000. – 351с.

3. Люгер Дж. Ф. Искусственный интеллект: стратегии и методы решения сложных проблем / Дж. Ф. Люгер // М.: «Вильямс», 4-е издание.2003. – 864 с.

4. Глоба Л. С. Створення баз нечітких знань для інтелектуальних систем управління / Л. С. Глоба, М. Ю. Терновой, О.С. Штогріна // Комп'ютинг. - Міжнародний науково-технічний журнал. – том 7, випуск 1. –Тернопіль, «Економічна думка» – 2008 – С.70-79.

5. Білодід Б.В. Метод отримання інформації в термінах предметної області / Б.В. Білодід, М.Ю. Терновой // Наукові записки Українського науково-дослідного інституту зв'язку, № 4 (12). – К., 2009. – С. 79 – 84.

6. Dejing Dou «Оntograte: towards automatic integration for relational databases and the semantic web through an ontology-based framework» / Dou Dejing, Qin Han, Lependu Paea // International Journal of Semantic Computing, Vol. 4, No. 1 (2010), pp. 123–151.

7. MeSH [Електронний ресурс]. – Електрон. текстові дані. – Режим доступу: http://www.nlm.nih.gov/mesh.

8. "The Semantic Metadatabase (SEMEDA): Ontology Based Integration of Federated Molecular Biological Data Sources", [Електронний ресурс]. – Електрон. текстові дані. – Режим доступу: http://www.bioinfo.de/isb/gcb01/talks/koehler/index.htm.

9. TAMBIS- Joint research project between the School of Biological Sciences and the Information Management Group, part of Computer Science in the University of Manchester in the UK. [Електронний ресурс]. – Електрон. текстові дані. – Режим доступу: http://www.cs.man.ac.uk/~stevensr/tambis/details.htm.

10. Entity Framework. [Електронний ресурс]. – Електрон. текстові дані. – Режим доступу: http://msdn.microsoft.com/en-us/library/bb399567.aspx. Кунгурцев А.Б. Математическая модель объектного представления реляционной базы данных / А.Б. Кунгурцев, А.С. Неизвестный // Труды Одесского политехнического университета, вып. 2 (22), 2007.

Вернуться в библиотеку