Онтологии и базы знаний

Болотова Виктория


Источник: http://www.ling.helsinki.fi/~stviitan/documents/Ontologies_and_KB/ontology.html


Онтологии

По словам аль Гуарино и др. (1995), онтология может быть понята как интенсиональная семантическая структура, которая кодирует неявные правила, сдерживающие структуру части реальности. Онтология отвечает на вопрос «Какие объекты существуют в той или иной области реального мира, и как они взаимосвязаны?». Таким образом, онтология описывает логическую структуру области, ее понятия и отношения между ними.
В системе документов, приобретений знаний и обработки той или иной предметной области, выполняется на основе онтологий. Онтология предметной области определяет понятия и отношения, в которых знания накапливаются и обрабатываются.
Создание онтологии для предметной области вручную основано для данной предметной области.


Рисунок 1 – Модель данных, индуцированная из документов

Модель данных состоит из объектов трех типов:
- агенты (субъекты);
- объекты, на которых действуют агенты;
- отношения между агентами и/или объектами.
Модель данных, изображенная на рисунке 1 может быть легко преобразована в онтологию. Каждое понятие онтологии имеет некоторое понятие типа. Кроме того, понятие имеет ряд атомных свойств (атрибутов) и один или несколько исходящих и/или входящих связей (отношений).
Онтологический инструмент, используемый в системе документов, представляет собой концептуальное сетевое программное обеспечение (CONE), разработанное VTT Information Technology. В частности, CONE – это редактор, который используется для создания онтологий различных предметных областей, как описано в Silvonen (2002).
В модели данных и соответствующей ей онтологии, показанной на рисунке 2 агентах, объектах, а также отношениях, характеризуются свойствами различных типов.

Таблица 1. Виды недвижимости в отношении типа занятости

Имя свойстваТип свойстваОписание
Organisation_namestring Название организации работодателей
Person_namestringНазвание работника
TitlestringЗвание или должность в организации
FunctionstringФункция или зоны ответственности в организации








Онтологии служат концептуальной структурой предметной области, информация собирается и обрабатывается системой документов. Данные модели, показанные на рисунке 1 преобразуется в соответствующие онтологии, изображенные на рисунке 2. Понятия модели данных моделируются как понятия типа Entity в соответствующих онтологиях. Например, это понятия Organization и Person типа Entity в области онтологии, показанной на рисунке 2. Свойства понятий модели данных прямо становятся свойствами соответствующих понятий в онтологии. Каждое свойство имеет имя и тип, которые являются соответственно представленными полями Key и Type. Свойство, возможно, также имеет начальное значение, которое содержится в поле Value свойства.


Рисунок 2 – Онтологии

С тех пор, как текущая версия Редактора CONE не позволяет прикреплять свойства к отношениям, отношения модели данных моделируются как понятия типа Reification в соответствующей онтологии. Например, отношение Employed-by (рисунок 1) отражено соответствующим понятием Employment типа Reification (рисунок 2), которое связано с понятием Organisation отношения типа has-r. Очевидный смысл отношения с количеством элементов на его обоих концах является "организация имеет нуль или более служащих".
Факты, собранные в фазу извлечения информации превращаются в образец базы. Образец базы отмечает структуру и внутреннюю логику области, как описано в соответствующей онтологии. Это означает, что каждое понятие образца обладает свойствами и связями, определенных в соответствующих понятиях онтологии. Например, концептуальная структура со значением «организация имеет нуль или более служащих», описанная выше, отражается понятиями Organisation, Employment и Person, каждое из которых, соединено между собой отношением типа- r.
На рисунке 3 был отобран случай понятия Organisation. Как видно из рисунка, организация "KGB", есть отношение с "Putin:KGB:colonel" понятия Employment. Свойства каждого экземпляра имеют понятие значения, возложенных на них на основе доказательств, собранных домена на этапе извлечения информации. Например, имущество Organisation_name экземпляра занятости на рисунке 4 имеет значение "KGB", который является организацией, которая использовала лица" Путин ".
Свойства каждого понятия обладают ценностями, возложенных на основе доказательств, собранных на этапе извлечения информации. Например, свойство Organisation_name понятия Employment (рисунок 4) имеет значение "KGB", которое является организацией, которая наняла человека "Putin".


Рисунок 3 - Пример понятия Organisation


Рисунок 4 - Пример понятия Employment

Как видно из рисунка 2, все понятия типов Entity и Reification являются подклассами понятий Top_Concept и Top_Relationship, соответственно. Эти понятия, в свою очередь, можно отнести к понятию TOP, которое является наиболее общим понятием в любой области онтологии. Понятие TOP связано с has-a, оно имеет отношение к понятию Evidence_occurrence. Это соотношение является унаследованным подклассом TOP, Top_Concept и Top_Relationship и их подклассы Entity и Reification. Таким образом, каждый образец Entity и Reification может быть связан с соответствующим одним или нескольким образцов Evidence_occurrence базы данных, которая содержит документы и факты, собранные в фазу извлечения информации из исходных документов и источником самих документов.
Образцы базы могут быть получены в результате использования программного обеспечения CONE. Простые запросы могут попросить трудовой стаж лица или лиц, чье название работы изменилось. Более сложные запросы могут быть направлены на преемственность, например информации. Некоторые примеры запросов были реализованы с использованием CONE Query Interface на основе Prolog.