В библиотеку

Источник

Транзитивные нетаксономические отношения в онтологическом моделировании

Б.В. Добров1, Н.В.Лукашевич1

1 Научно-исследовательский вычислительный центр МГУ им. М.В. Ломоносова, Ленинские горы, д.1., стр.4, 119899, Москва, Россия

Abstract. В статье рассмотрены классификация, свойства и практика описания в различных онтологических ресурсах отношений часть-целое и отношений онтологической зависимости. Для этих отношений постулируются свойства транзитивности, поэтому их правильное описание является важным для организации логического вывода в компьютерных  приложениях. Мы показываем, что в настоящее время существует достаточно широкий спектр подходов к этим отношениям. Несмотря на разнообразие подходов,  можно сделать три практических вывода, полезных при создании онтологий в широких предметных областях, включающих  множество различных типов сущностей.

Keywords: Онтология, отношение часть-целое, онтологическая зависимость, информационно-поисковый тезаурус

1   Введение

Для компьютерных приложений и информационных систем, ориентированных на использование онтологий, особое значение представляет возможность применения свойств транзитивности онтологических отношений, на основе которых может строиться многошаговый логический вывод. Наиболее известным транзитивным отношением является отношение таксономии. В число других транзитивных отношений, которые также могут использованы при онтологическом моделировании разных предметных областей, входят отношение часть-целое и отношение онтологической зависимости [1, 2].

Отношение часть-целое может быть установлено между сущностями, относящимися к таким  семантическим типам как: физические объекты, процессы и действия, географические регионы, свойства и состояния, коллекции и множества, абстрактные сущности. Для построения онтологий в реальных предметных областях существенным является вопрос, для какого типа сущностей можно описывать отношения часть-целое, нужно ли выделять подразделения этого отношения, и какое влияние принятые решения могут оказать на свойства транзитивности используемых отношений часть-целое [3, 4].

Отношение онтологической зависимости между сущностями А и В состоит в установлении факта зависимости существования А от существования В. Это отношение известно со времен Аристотеля, и в настоящее время стало активно использоваться при построении онтологий верхнего уровня, однако, на наш взгляд, важность этого отношения для онтологического моделирования конкретных предметных областей пока еще недостаточно изучена.

Разработчики онтологий верхнего уровня относят отношения таксономии, части-целого и отношение онтологической зависимости к так называемым формальным отношениям, которые противопоставляются материальным отношениям:  формальные отношения – это отношения, которые могут применяться во всех предметных областях. Таким образом, использование таких отношений и их свойств может оказаться полезным при разработке широкого круга онтологий.

В статье мы рассмотрим основные подходы к описанию отношения часть-целое и отношения онтологической зависимости в таких относительно недавно появившихся онтологиях верхнего уровня как онтология DOLCE [2], BFO [5], а также в более ранних подходах (CYC [6], SUMO [7], онтология Дж. Совы [8]).

Мы покажем, что между этими отношениями существуют значимые соотношения: некоторые подвиды отношения часть-целое могут быть определены на основе отношения онтологической зависимости, а некоторые важные подвиды отношения онтологической зависимости требуют, чтобы аргументы отношения не состояли в отношении часть-целое.

Важной частью нашего рассмотрения особенностей отношений часть-целое и онтологической зависимости является практика установления нетаксономических отношений в информационно-поисковых тезаурусах, поскольку анализ правил установления таких отношений в тезаурусах позволяет сделать важные практические выводы для построения онтологий для разных предметных областей и приложений.

Нужно отметить, что исследователи в сфере онтологического моделирования по-разному относятся к соотношению понятий информационно-поисковый тезаурус – онтология. Некоторые авторы рассматривают информационно-поисковые тезаурусы как один из видов онтологий, другие - как ресурсы онтологического типа, являющиеся менее формализованными, чем «правильно организованная» онтология [9].

Вместе с тем необходимо подчеркнуть, что информационно-поисковые тезаурусы описывают соотношения между терминами конкретных предметных областей. Как известно, современное терминоведение определяет термин как устойчивое языковое выражение, служащее для выражения понятия специальной предметной области, что говорит о тесной связи между термином и понятием [10]. И, следовательно, опыт, накопленный в области создания больших формализованных терминологических ресурсов – информационно-поисковых тезаурусов,  полезно учесть при построении онтологий.

Задача рассмотрения отношений информационно-поисковых тезаурусов облегчается тем, что многолетняя практика разработки тезаурусов закреплена в многочисленных стандартах как международного так и национального уровня, а также в значительном числе руководств и учебных пособий [11-14].

Статья состоит из 5 разделов. После введения, во втором разделе мы опишем свойства и практику представления в различных ресурсах отношения часть-целое. В третьем разделе будут представлены свойства отношения онтологической зависимости.

В четвертом разделе будет показано, как эти отношения используются при создании информационно-поисковых тезаурусов. Конечно, мы не найдем явных упоминаний отношения онтологической зависимости в руководствах и стандартах по созданию информационно-поисковых тезаурусов. Но, рассмотрев рекомендуемые принципы установления нетаксономических отношений в информационно-поисковых тезаурусах, мы заметим, что правила их становления, приводимые примеры имеют существенную корреляцию с отношением онтологической зависимости.

В пятом разделе мы опишем, как подходить к выбору отношений часть-целое при построении онтологий в сложных гетерогенных областях, какими, например, являются онтологии в сфере информационного поиска.

2   Отношение часть-целое

Отношение часть-целое играет существенную роль во многих предметных областях. Необходимость описания этого отношения возникает при создании таких разных ресурсов как информационно-поисковые тезаурусы, лингвистические ресурсы для компьютерной обработки текстов, онтологии, в объектно-ориентированном программировании.

2.1   Определение отношения часть-целое в философии и лингвистике

Специфической особенностью отношения часть-целое является его разнообразие: отношение может быть установлено между сущностями различных семантических типов: физическими объектами, процессами и действиями, географическими регионами, свойствами и состояниями, коллекциями и множествами, абстрактными сущностями такими как числа.

Изучающая отношение часть-целое отрасль философии - мереология - не накладывает никаких ограничений на типы части и целого, лишь постулируя три основных аксиомы [3,15]:

 

-           Транзитивность:

Части частей являются частями целого:

Если A – часть B и B - часть С, то A – это часть C.

-           Рефлексивность:

Все является частью самого себя: А – это часть А.

-           Несимметричность: ничто не является частью своих частей:

Если A - часть B и A не совпадает с B, то  B – это не часть A.

Поскольку отношение обладает свойством рефлексивности, выделяются еще собственно-части, то есть части, не равные своему целому.

В лингвистике для определения отношения часть-целое широко используются лингвистические тесты, то есть некоторые заданные предложения, в которые подставляются анализируемые сущности. При этом часть обычно называется меронимом, а целое – холонимом.

Естественным тестом для определения меронимии является предложение X – это часть Y, которое должно звучать нормально для X и Y, интерпретируемых как родовые понятия: палец – это часть руки, страница – это часть книги [16].

Другими возможными лингвистическими тестами для отношения часть-целое являются следующие:

Части У включают  X, Z и т.д.(«Части слова включают корень, приставку, суффикс.»)

X и другие части Y.(«Суффикс и другие части слова.»)

Однако, многие авторы отмечают, что если основываться только на лингвистических тестах, то возникают серьезные проблемы с транзитивностью отношения часть-целое. Так, например, рассмотрим следующую совокупность утверждений: рука – это часть дирижера, дирижер – это часть оркестра, но странно, если сказать, что рука – это часть оркестра (см. далее обсуждение такого рода проблем в п.2.3).

2.2. Классификация отношений часть-целое

Существуют различные классификации отношения часть-целое.

На основе лингвистических и когнитивных исследований в работе [4] предлагается различать различные виды специализированных отношений часть-целое с целью преодоления парадоксов транзитивности, возникающих при смешении различных видов отношения часть-целое.

Основная идея работы [4] состоит в том, чтобы классифицировать различные способы, которыми части соотносятся к своему целому, введением различных типов отношений меронимии, различаемых на основе признаков функциональности, гомеомерности и отделимости:

-            Функциональные части ограничены своей функцией, в их пространственном или временном положении. К примеру, ручка чашки может быть расположена в ограниченном числе позиций, если она должна функционировать как ручка.

-            Гомеомерные части представляют собой объект того же типа, что и их целые, к примеру, кусок – пирог, тогда как негомеомерные части отличны от своих целых, например, дерево-лес.

-            Отделимые части могут, в принципе, быть отделенными от целого, к примеру, ручка – чашка, тогда как неотделимые не могут, например, сталь – велосипед.

На основе комбинации этих трех признаков можно выделить следующие типы отношений часть-целое:

-            Компонент/Интегральный объект: Интегральные объекты характеризуются  своей структурой, тогда как их компоненты отделимы и имеют специальную функциональность. Например, Колеса – это части автомобиля, фонология – это часть лингвистики.

-            Член/Коллекция: Члены не играют никакой функциональной роли по отношению к своему целому, они отделимы: дерево – часть леса.

-            Порция/Масса: Целое рассматривается как гомогенный агрегат и его порции подобны целом: Кусок – это часть пирога.

-            Материал/Объект: Материал, из которого сделан объект, не отделим от этого объекта, не имеет функциональной роли и негомеомерный: Сталь – часть велосипеда.

-            Фаза/Деятельность: Фаза, как компонент, имеет функциональную роль, но не отделима: ложка – часть процесса еды, глотание – часть процесса еды.

-            Место/местность: часть гомеомерна, так как каждая часть пространственного региона подобна целому региону, но не отделима: Оазис – это часть пустыни.

 

Классификация отношений часть-целое на основе других принципов приводится в работе [17].

Прежде всего, части подразделяются на структурные части (structural dependent parts), то есть те, которые зависят от структуры целого, и временные части (temporarily-constructed parts).

Структурные части – это части, на которые интегральный объект может быть отделен, или те части, которые существовали как отдельные объекты в момент создания интегрального объекта.

Структурные части разделяются на компоненты, элементы и количества (quantites).

Временные части делятся на сегменты, куски и порции.

Сегменты – это части объекта, выделяемые на основе некоторых внешних критериев, то есть это такие топологические понятия как низ, верх, отверстие, дыра. В отличие от компонентов сегменты не демонстрируют  четких границ между собой. Так, например, мраморная статуя может не иметь внутреннего разделения на голову и шею.

Кусок – это часть объекта, получившаяся в результате произвольного механического разделения этого объекта.

Порции  - это части, определяемые на основе внутренних критериев, как деревянная часть дома.

 

При всем разнообразии подвидов отношения часть-целое, существуют классы отношений, которые не рекомендуется путать с отношениями часть-целое.

Например, к таким отношениям относится отношение «местонахождение внутри»: тот факт, что некто находится в комнате, не означает, что этот некто является частью комнаты. Другим видом, отношений, которые необходимо отделять от отношения часть-целое, является отношения присоединения: тот факт, что электрическая лампа подключена к электрической сети не делает ее частью этой электрической сети [18].

2.3   Проблема транзитивности отношения часть-целое

Разные авторы приводят многочисленные примеры нарушения транзитивности отношения часть-целое [4,16,19], например,

Несомненно, что
Ручка двери является частью двери, дверь является частью дома,
но странно сказать, что
ручка двери является частью дома;

Несомненно, что
Клеточное ядро является частью клетки, клетка является частью органа,
но странно сказать, что
клеточное ядро является частью органа;

Несомненно, что
Ветка является частью дерева, дерево является частью леса,
но странно сказать, что
ветка является частью леса;

Несомненно, что
Ручка ложки часть ложки, ложка – это часть процесса поедания супа,
но странно сказать, что
ручка ложки  есть часть процесса поедания супа
.

Рассматривая разные виды отношения часть-целое, авторы обычно подчеркивают, что проблемы с транзитивностью связаны со смешением разных видов отношений часть-целое.

В работе [4] проблемы с транзитивностью объясняются следующим образом: пока используется один тип отношения, то отношение часть-целое всегда транзитивно. Однако, когда смешиваются различные отношения меронимии, то возникает проблема с транзитивностью.

В работе [16] подчеркивается, что правильно сформированная иерархия состоит из элементов одного и того же типа. Так, если элемент меронимии физический объект, то и все другие элементы меронимии должны быть такими же (например, вес тела не должен фигурировать среди его частей). Если один элемент – является географической областью, то и другие должны быть такими же (так Вестминстерское аббатство не является частью Лондона), если один элемент - абстрактное существительное, то и другие должны быть такими же.

Круз (Cruse) [16] приводит в пример одно из известных видов меронимии - человеческое тело. «Почему меронимия не идет дальше? К семье, населению, биосфере? Что квалифицирует тело как  ЦЕЛОЕ? Частичный ответ заключается в том, что переход от тела к семье означает переход от связного физического объекта к сущности, не имеющей физической связности. Семьи имеют части, конечно, но это люди, а не тела.»

В работе [20] предлагается выделить те отношения часть-целое, которые комбинируясь, дают приемлемые результаты транзитивности, и отделить те отношения часть-целое, которые могут привести к ошибочным транзитивным заключениям. Если моделировать такие отношения как член/коллекция, материал/объект отношениями, отличными от отношений часть-целое, то авторы утверждают, что оставшиеся типы отношений демонстрируют транзитивное поведение, даже если комбинируются произвольным образом. Таким образом, группа отношений компонент/объект, порция/масса, фаза/деятельность, место/местность может быть названа базовыми отношениями часть-целое. В рамках любой комбинации базовых отношений часть-целое действует правило транзитивности, независимо от комбинации конкретных видов отношений.

Другое мнение высказывается в философской работе [3]. Автор работы утверждает, что проблемы с транзитивностью отношения часть-целое и приводимые контрпримеры связаны с неявным сужением понятия «часть» в обыденной речи. То, что ручка двери, являясь функциональной частью двери, может не рассматриваться как функциональная часть дома, не означает, что ручка не является вообще частью дома. Напротив, ручка двери проявляет все обычные свойства частей: масса ручки является частью массы дома; она занимает часть пространства, занятого домом; она будет уничтожена, если уничтожить дом; если уничтожить ручку двери, то и дом будет поврежден.

Если рассмотреть пример: рука дирижера – дирижер – оркестр, то также можно видеть, что масса руки является частью массы оркестра, рука дирижера занимает часть пространства занимаемого оркестром, если будет повреждена рука дирижера, это может вызвать и (может быть даже серьезные) проблемы с функционированием оркестра.

Сужение понятия «часть» заключается в том, что на интерпретацию понятия «часть» накладываются дополнительные условия (то есть дополнительное требование, что часть должна быть функциональной и т.п.) и при этом, действительно, свойство транзитивности может не выполняться. В более общем виде, если х – ф-часть (то есть часть с дополнительным условием ф) от y и y – ф-часть от z, х не обязательно является ф-частью от z. Модификатор отношения ф – может не быть транзитивным, но эта ситуация говорит лишь об отсутствии транзитивности у отношения ф-часть, а не у обобщенного отношения в целом.

Отметим, что если проанализировать упомянутые в п. 2.2 отношения «местонахождение внутри» и «отношение присоединения», то можно заметить, что многие повреждения и даже уничтожение находящегося внутри комнаты, могут не приводить ни к каким повреждениям самой комнаты, а повреждение или даже уничтожение электрической лампы, чаще всего, не приведет к повреждению электрической сети.

2.4   «Вертикальные» отношения между частью и целым

Помимо свойств транзитивности существенную роль в компьютерных системах могут иметь так называемые вертикальные отношения между частью и целым. Вертикальные отношения между частью и целым описывают зависимость свойств части от свойств целого и свойств целого от свойств части (нескольких частей) [21].

Части могут быть входить в состав различных целых, так, например, ручки, шестеренки, ножки могут входить в состав множества разных предметов. Поэтому отношение часть-целое можно рассматривать с позиции факультативности-обязательности отношения относительно части и относительно целого.

Так, пальцы обязательны для руки, в то время как ручка факультативна для двери. При этом здесь не идет речь о логической необходимости. На руке может и не быть пальца (пальцев), но тогда рука воспринимается как имеющая физический недостатки [16].

Для описания вертикальных отношений между частью и целым также используется понятие зависимости существования (экзистенциальной зависимости) [15, 21] (см. далее п.3).

Так, некоторая сущность может находиться в отношении строгой зависимости (rigid dependence) к другой сущности, то есть существование одной сущности подразумевает существование чего-либо какой-либо конкретной сущности, например, человек строго зависит от своего мозга, если будет заменен мозг, то невозможно утверждать, что это тот же человек.

Некоторая сущность находится в отношении  родовой зависимости (generic dependence) к другой сущности, если существование одной сущности подразумевает существование какого-либо примера другой сущности. Так, например,  человек связан со своим сердцем родовой зависимостью, так как сердце может быть заменено [10].

Если целое находится в отношении родовой зависимости к некоторым своим частям – эти части называются существенными частями. Если часть находится в отношении родовой зависимости от целого, то такая часть называется  зависимой частью. Если существует максимум одно целое, содержащее данную часть, то такая часть – эксклюзивна для целого.

Таким образом, можно сказать:

Грибы и водоросли являются существенными частями лишайника.

Деревья являются существенными частями леса.

Этаж является эксклюзивной и зависимой частью здания.

Передовица является эксклюзивной и зависимой частью газеты.

В число вертикальных отношений между частями и их целыми относится также и возможность наследования некоторых свойств как от целого к части так и от части к целому [21]. Так, примером свойства, которое целое наследует от своих частей является его дефектность: во многих случаях целое дефектно, если дефектны его части.

Свойства, которые части наследуют от своего целого, включают, например, свойство расположения («быть под столом»), которое может выполняться как для целого, так и для его частей.

Могут возникать отношения между свойствами частей и свойствами целых: например, пространство, которое обычно занимает часть находится внутри пространства, занимаемого целым, или вес одной части меньше веса целого.

Примером операции, которая наследуется от целого к части, является операция форматирования всего документа [20]: если форматируется целый документ, то, значит, форматируются все его части.

2.5   Отношение часть-целое в компьютерных ресурсах и подходах

При моделировании отношения часть-целое в различных компьютерных ресурсах разработчики стараются учесть особенности этого отношения так, чтобы его можно было использовать для тех или иных операций в соответствующих программных приложениях. Рассмотрим некоторые подходы к описанию отношения часть-целое.

Отношение часть-целое в объектно-ориентированных моделях. В 90-х годах в научных публикациях, посвященных объектно-ориентированным подходам в программировании, развернулась дискуссия о необходимости выделения отношений часть-целое из общего набора атрибутов, приписываемых классам [20, 21],  в связи с особыми свойствами этого отношения.

Результаты этой дискуссии нашли свое воплощение, например, в языке для моделирования объектно-ориентированных систем UML [22]. В этом языке среди всех отношений ассоциации выделяется отношения агрегации, которые служат для описания отношений между агрегатом (целое) и его составной частью.

Дополнительно среди отношений агрегации выделяются отношения композиции, которые устанавливаются в тех случаях, когда части целого имеют такое же время жизни, что и само целое. Эти части уничтожаются вместе с уничтожением целого.

Отношение композиции - частный случай отношения агрегации. Это отношение служит для спецификации более сильной формы отношения часть-целое, при которой составляющие части тесно взаимосвязаны с целым. Особенность этой взаимосвязи заключается в том, что части не могут выступать в отрыве от целого, т.е. с уничтожением целого уничтожаются и все его составные части.

В качестве примера отношения композиции обычно приводится пример окна компьютерной программы, которое может включать подзаголовок, главное меню и др.

Таким образом, мы видим, что в языке UML отдельно моделируется отношение часть-целое, и, кроме того, отдельно выделяется подвид этого отношения, характеризующийся жесткой зависимостью части от целого.

Отношение часть-целое в онтологиях верхнего уровня. Сравним, какие решения по моделированию отношения часть-целое принимаются различными исследователями в онтологиях верхнего уровня.

В онтологии SUMO [7] отношения часть-целое определены только над осязаемыми (tangible) пространственными сущностями – объектами. Такое ограничение не является типичным для общей мереологии.

В этой онтологии отношение часть-целое подразделяется на следующие подвиды: член, компонент, кусок (piece), собственно часть, поверхностная часть. Поверхностные части делятся на поверхность, верх, низ,  и бок.

В онтологии OpenCYC [6] отношение часть-целое определяется в очень общем смысле. Единственное ограничение на аргументы отношения заключается в том, что они должны быть конкретными сущностями. Отношение часть-целое включает такие подвиды как пространственные части, временные части, «концептуальные» части (например, содержать_информацию), члены группы и т.п.

Физические части в онтологии OpenCYC включают следующие подвиды:

-           стенки полости,

-           внешние части

-           внутренние части

-           визуальные отметки.

В онтологии Dolce [2] отношение «объект – материал этого объекта» (ваза – глина) рассматривается как отдельное отношение «составляет» (constitute), не являющееся отношением часть-целое:

Х составляет Y тогда и только тогда, когда X может быть субстратом после разрушения Y.

Такое решение связано с тем, что объект (ваза) и материал, из которого сделан объект считаются различными сущностями. Если предположить, что между глиной и вазой существует отношение часть-целое, то глина должна совпасть с вазой, поскольку у глины и вазы совпадают части, а значит и по аксиомам мереологии глина и ваза совпадают.

Это решение является программным для авторов онтологии, поскольку в DOLCE  принят так называемый мультипликативный подход: считается, что различные сущности могут быть совмещены по пространству и времени. Причина, по которой это возможно, заключается в том, что такие сущности могут иметь несовместимые существенные свойства. Классический пример таких сущностей: ваза и глина, из которой сделана эта ваза: ваза не переживет радикальное изменение формы или топологии, в то время как кусок глины останется тем же независимо от этих изменений. Таким образом, эти две сущности различны, хотя и совмещены по времени и пространству. Считается поэтому, что кусок глины составляет вазу (constituted), но что сама ваза не является куском глины.

Еще одна черта DOLCE – явное разделение на «постоянные» и «происходящие» сущности. Различие между ними состоит в том, что «постоянные» сущности имеются в наличии целиком и неизменно в некотором фиксированном промежутке времени (например, стол, дом в течение периода своего существования).

«Происходящие сущности» разворачиваются во времени и в каждый момент в некотором временном интервале они могут быть различными, по-разному себя проявлять, иметь разный состав, (например: ураган, жизненный цикл), однако при этом их идентичность сохраняется.

Другой способ разделения «постоянных» сущностей и «происходящих» сущностей  заключается в следующем: сущность является «постоянной», если она существует больше, чем в один момент времени, и утверждения о частях должны быть сделаны относительно временной шкалы. Другими словами различие между категориями базируется на фундаментальном различии отношения части для двух категорий: «постоянные» сущности нуждаются в описании отношения часть-целое с добавлением индекса времени, а «происходящие» сущности – нет.

Поэтому в DOLCE рассматриваются два вида отношений часть-целое: постоянное отношение часть-целое и отношение часть-целое в момент времени  t. Постоянное отношение часть-целое устанавливается между «происходящими» сущностями, а временное отношение часть-целое устанавливается между «постоянными» сущностями.

Для описания отношений между «происходящими» сущностями и «постоянными» сущностями вводится отношение участия (participation):

“Обычное представление об участии состоит в том, что «постоянные»  сущности вовлечены в «происходящие» сущности. В онтологии, базирующейся на строгом разделении между «происходящими» сущностями и «постоянными» сущностями, участие не может быть просто частью. Участвующие «постоянные» сущности не являются  частями «происходящих» сущностей, только «происходящие» сущности могут быть частями «происходящих» сущностей. Отношения участия имеют индекс по времени, для того, чтобы учитывать вариации участия во времени (постоянное участие, временное участие)”.

Постоянные сущности «живут» во времени, участвуя в тех или иных «происходящих» сущностях. Например, человек, который является «постоянной» сущностью, участвует в дискуссии, которая является «происходящей сущностью. Человеческая жизнь  также является «происходящей» сущностью, в которой человек участвует всю свою жизнь.

Отметим, что в такой онтологии верхнего уровня как OCRE на счет отношения участия принято полностью противоположное решение: отношение участия рассматривается как частный случай отношения часть-целое [2].

Отношение часть-целое в тезаурусе WordNet. Одним из наиболее известных лексических ресурсов в сфере компьютерной лингвистики является компьютерный тезаурус  WordNet [23].

WordNet версии 2.1 охватывает приблизительно 155 тысяч различных лексем и словосочетаний, организованных в 117 тысяч понятий, или совокупностей синонимов (synset), общее число пар лексема – значение образует 200 тысяч.

Синсет может рассматриваться как представление лексикализованного понятия (концепта) английского языка.

Тезаурус WordNet является чрезвычайно популярным ресурсом в сфере разного рода компьютерных приложений, многими авторами рассматривается как онтология, в работах представлены многочисленные предложения, как сделать WordNet более «правильно устроенным» с онтологической точки зрения [24]. Поэтому важно рассмотреть, какие принципы для описаний отношений часть-целое использовали авторы WordNet .

В WordNet отношение часть-целое называется отношением меронимии, часть называется меронимом, а целое холонимом. Для установления этого отношения применяется лингвистический тест: Х является частью Y, если можно сказать, что Х – это часть Y (An x is a part of Y) или Y имеет X как часть (A y has an x as a part). Внутри отношения меронимии дополнительно выделяются отношения быть_элементом и быть_сделанным_из, например,

собственно часть

flower, bloom, blossom -- (reproductive organ of angiosperm plants esp. one having showy or colorful parts)

PART OF: angiosperm, flowering plant -- (plants having seeds in a closed ovary)

элемент

homo, man, human being, human -- (any living or extinct member of the family Hominidae)

MEMBER OF: genus Homo -- (type  genus of the family Hominidae)

вещество

glass -- (a brittle transparent solid with irregular atomic structure)

SUBSTANCE OF: glassware, glasswork -- (articles made of glass)

SUBSTANCE OF: plate glass, sheet of glass -- (glass formed into a thin sheet)

Для частей характерно, что у многих разных сущностей части могут называться одинаково, например,  point (острие) может  быть у стрелы, ножа, иголки, карандаша, булавки и т.п. В таких случаях в Wordnet описываются все такие холонимы, например,

point -- (sharp end; "he stuck the point of the knife into a tree"; "he broke the point of his pencil")

PART OF: awl -- (a pointed tool for marking surfaces or for punching small holes)

PART OF: icepick, ice pick -- (pick consisting of a steel rod with a sharp point; used for breaking up blocks of ice)

PART OF: knife -- (edge tool used as a cutting instrument; has a pointed blade with a sharp edge and a handle)

PART OF: needle -- (a sharp pointed implement (usually steel))

PART OF: pencil -- (a thin cylindrical pointed writing implement; a rod of marking substance encased in wood)


PART OF: pin -- (a small slender (often pointed) piece of wood or metal used to support or fasten or attach things)

Авторы ресурса подчеркивают, что одной из проблем описания отношений меронимии является то, что части описываются несколько выше, чем это необходимо. Например, часто утверждается, что колесо это часть транспортного средства, но тогда сани не являются транспортным средством. Однако часто такая ситуация является следствием того, что понятие необходимого уровня не лексикализовано в языке. Для данного конкретного примера WordNet вводит специальное дополнительное понятие {wheeled vehicle} – колесное транспортное средство. Приведем еще примеры различных отношений часть-целое из WordNet (табл. 2.1).

 

Таблица 2.1. Примеры различных отношений часть-целое из WordNet

 

Синсет-часть

Синсет-
целое

Трактовка WordNet

Air 1

Wind 1

Воздух входит в состав ветра

Artillery 1

Battary 1

Артиллерийское орудие входит в состав артиллерийской батареи

Bucharest

Romania

Бухарест входит в состав Румынии

Cellulose

Paper1

Целлюлоза  входит в состав бумаги

Iron 1

Steel1

Железо входит в состав стали

Chew 2

Eating

Жевание часть процесса еды

Computer 1

Computer network

Компьютер входит в состав компьютерной сети

Wing 1

Angel1

У ангела есть крыло

Wing 1

Bird1

У птицы есть крыло

Snow 1

Snowball

Снег входит в состав снежка

Palm

Hand

Ладонь – это часть руки

 

Отметим, что к каждой паре приведенных примеров применимо одно из языковых выражений, которое часто используется для отношения часть-целое, то есть установленные отношения соответствуют лингвистическим критериям для установления этого отношения (см.п. 2).

3   Отношение онтологической зависимости

Известный философ Гуссерль считал отношение зависимости центральным отношением онтологии. Еще Аристотель заметил, что невещественные сущности такие как качества и количества зависят от вещественных сущностей.

Никола Гуарино [25] называет теорию зависимости одним из основных инструментов анализа сущностей в рамках Формальной Онтологии. В проекте WonderWeb [2], целью которого являлось построение онтологии верхнего уровня на основе формально-онтологических принципов, в число таких формальных отношений, то есть отношений, применимых во всех предметных областях, входит и отношение онтологической зависимости.

3.1 Определение и свойства отношения онтологической зависимости

Зависимость  сущностей может быть разного содержания. Симонс [26] рассматривает несколько разных видов зависимости между сущностями:

-        физиологическая зависимость (человек А зависит от лекарства В  так, что А не может жить, если не будет принимать это лекарство);

-        причинная зависимость (детонация мины А зависит от предварительного воспламенения В так, что детонация не произойдет, если не будет предварительного воспламенения);

-        логическая зависимость (пропозиция p зависит от пропозиции q, тогда и только тогда, если p не может быть истинным, пока q не является истинным);

-        функциональная зависимость (давление Р фиксированной массы идеального газа зависит от температуры Т  и объема V  тогда и только тогда, когда P не может изменяться, пока не изменяется по крайней мере один из параметров T или V);

-        практическая зависимость (умение А зависит от умения Б тогда и только тогда, когда  умение А не может быть достигнуто, пока не достигнуто умение Б).

Онтологическая зависимость отличается от всех вышеперечисленных зависимостей. Для выявления онтологической зависимости нужно ответить на следующий вопрос: может ли сущность (X) существовать сама по себе, или подразумевает существование чего-либо еще (Y). Так, свойство белизны зависит от вещества, например, от куска бумаги тогда и только тогда, когда это свойство не может существовать без этого куска бумаги.

Определение. Х онтологически зависит от Y =df Необходимо, чтобы выполнялось: Х существует только, если Y существует.

D(X, Y) = def (существует (X) -> существует (Y))

Для отношений онтологической зависимости можно сформулировать пары предложений подобно тому, как определяются семантические отношения между лексическими единицами (диагностические тесты лексического отношения):

X онтологически зависит от Y, если из утверждения
«X существует» следует утверждение «Y существует».

В связи с отношениями зависимости наиболее распространенными используемыми аксиомами является аксиомы рефлексивности и транзитивности [15]:

1) D (x, x) – рефлексивность отношения зависимости

2) D(x,y)  Ù  D(y,z)  ®  D(x,z) - транзитивность отношения зависимости.

3.2   Виды отношения онтологической зависимости

Существует много форм онтологической зависимости.

Во-первых, можно рассмотреть онтологическую зависимость существования конкретной сущности (экзистенциальная зависимость),  или онтологическую зависимость существования свойства сущности (зависимость свойств), в том числе свойство принадлежности к некоторому классу сущностей - концептуальная зависимость [2, 24]

Например, человек зависит от своего мозга – экзистенциальная зависимость. Свойство сущности «быть_гаражом» зависит от существования автомобиля – концептуальная зависимость. Если автомобили исчезнут, то постройка останется, но ее свойство «быть гаражом» исчезнет.

Во-вторых, можно выделить строгую (rigid) зависимость, то есть зависимость от существования конкретной сущности, или родовую зависимость (generic), то есть зависимость от существования класса сущностей. Так, человек  зависит от своего мозга строгой зависимостью – мозг не может быть заменен, а от своего сердца – родовой зависимостью – сердце может быть заменено.

В-третьих, можно рассмотреть течение времени и выделить константную зависимость, то есть зависимость от существования некоторой сущности в текущий момент времени, или историческую зависимость, то есть зависимость от существования некоторой сущности в предшествующий отрезок времени.

Так, ребенок зависит от своей матери исторической зависимостью, если бы мать не существовала в предшествующий промежуток времени, ребенок не мог бы родиться.

В-четвертых, могут быть выделены внутренняя онтологическая зависимость, то есть зависимость от внутренних свойств или частей сущности, и внешняя онтологическая зависимость, то есть онтологическая зависимость от существования некоторой отдельной сущности.

Отношения внутренней и внешней зависимости могут быть определены следующим образом:

ID(x,y)  = def  D(x,y)  Ù  P(y,x)
(внутренняя зависимость – P(x,y) – отношение часть-целое).

ED(x,y)  = def  D(x,y)  Ù  ØP(y,x)
(внешняя зависимость – P(x,y) - отношение часть-целое )

Н. Гуарино указывает на важность выделения из спектра отношений зависимостей отношений внешней зависимости. В работе [1] подчеркивается, что, вообще говоря, необходимо более строгое определение внешней зависимости, которое должно исключить из рассмотрения и другие внутренние характеристики сущности как материал, из которого сделана сущность, его свойства (например, цвет), а, кроме того, те сущности, которые необходимо существуют, например, вселенная.

Наконец, зависимость может быть односторонней или двусторонней.

Рассмотрим в качестве примера отношения между матерью и ее ребенком. Мы видим здесь двустороннюю онтологическую зависимость.

Зависимость ребенка от матери является следующей:

-        экзистенциальная историческая строгая внешняя зависимость, то есть существование ребенка как конкретной сущности зависит от существования конкретной матери (другой сущности) в предшествующий период времени;

Зависимость матери от ребенка  является следующей:

-          концептуальная константная строгая внешняя зависимость, то есть свойство женщины быть матерью в текущий момент времени зависит от существования  в текущий момент времени ее ребенка как конкретной сущности.

Рассмотрим отношения между автомобилем и различными другими сущностями.

Гараж односторонне зависит от автомобиля концептуальной константной родовой внешней зависимостью, то есть некоторая постройка не перестанет существовать, если в мире исчезнут все автомобили, но ее свойство «быть_гаражом» зависит от существования класса сущностей «автомобили».

Автомобиль зависит от своего двигателя экзистенциальной константной родовой внутренней зависимостью, то есть конкретный автомобиль зависит от существования класса конкретных двигателей (двигатель может быть заменен); и эта зависимость является внутренней, поскольку двигатель является частью автомобиля.

Сложным вопросом является вопрос о зависимости между такими сущностями как Сократ и Жизнь_Сократа.  С одной стороны, кажется, что, имеется взаимозависимость, поскольку Сократ зависит от своей жизни. С другой стороны, интуитивно, представляется, что Жизнь_Сократа должна быть более зависимой от Сократа.

В работе [27] уточняется понятие внешней онтологической зависимости. Авторы указывают на необходимость аккуратного описания отношений зависимости в следующем тривиальном случае: собственно Socrate   и {Socrate} как множество из одного элемента. Поскольку, когда существует X, то существует  {Х}, то получается, что X внешне зависит от {Х}, что противоречит интуиции.

Поэтому авторы этой работы обсуждают полезность такого понятия как зависимость по определению [28]:

сказать, что объект х зависит от F, это означает сказать, что F необходимо (eliminably) должно быть использовано в любом определении X.

Это определение может быть сформулировано в терминах свойств, то есть свойство А является зависимым по определению от свойства В, если, необходимо, любое определение А неизбежно требует В.

В результате авторы уточняют отношение внешней родовой зависимости следующим образом: понятие Х является внешне зависимым от понятия Y, если выполняются два условия:

-        определение понятия X необходимо включает понятие Y

-        если для любой сущности x, которая классифицируется как Х, найдется сущность y, которая классифицируется как Y, являющаяся внешней для сущности x, то есть не являющейся частью, материалом или свойством сущности x.

Таким образом определенная внешняя зависимость показывает зависимость сущности Жизнь_Сократа от Сократа, поскольку понятие «Жизнь_Сократа» необходимо требует существования понятия Сократ [27].

3.3   Отношение онтологической зависимости в онтологических ресурсах

Для Дж. Совы [8] в построении онтологии верхнего уровня  одним из существенных параметров является зависимость понятий друг от друга (prehension). Зависимость может быть внешняя (extrinsic) и внутренняя (intrinsic) (рис.1). Если исчезновение одной из сущности меняет структуру или существование другой сущности, то это отношение внутреннее.

Для создаваемых в настоящее время онтологий верхнего уровня понятие зависимости, зависимых сущностей является существенным. Рассмотрим некоторые из таких онтологий.

Онтология BFO (Basic Formal Ontology) [2, 5] является онтологией универсалий, целью которой является структурирование онтологий конкретных научных областей.

В этой онтологии подразделение второго уровня непосредственно связано с понятием зависимости.

На первом уровне все сущности делятся на сущности, существующие во времени, и сущности, происходящие во времени. Временные сущности делятся на пространственные регионы (пространство, плоскость, прямая, точка), независимые сущности, то есть те которые могут существовать отдельно от других сущностей, и зависимые сущности (Dependent entities), существование которых всегда связано с существованием других сущностей – к таким сущностям относятся функции, роли и качества (см. рис.2).

Рис.1 Онтология верхнего уровня Дж.Совы [8] (т.н. «бриллиант» Дж.Совы). Понятие зависимости (prehension) входит в состав основных категорий.

 

Рис.2. Классификация сущностей второго уровня в онтологии BFO

Соответственно, одним из основных отношений онтологии является отношение между зависимыми и независимыми сущностями -  inhere:

C1 inheres in C2 at t, что означает, например, что некоторое качество (например, краснота) зависит от некоторого объекта (например, яблоко или красный жакет), все то время, когда это качество существует, и оно зависит все время своего существования от одного и того же объекта.

В онтологии Dolce [2] отношение зависимости также входит в состав основных отношений онтологии.

Разработчики Dolce рассматривают разнообразный набор отношений зависимости:

-        специфическая зависимость – зависимость от существования конкретного примера сущности (зависимость существования человека от его мозга);

-        родовая зависимость – зависимость от существования класса сущностей (зависимость существования человека от его сердца – может быть заменено);

-        отношения односторонней и двусторонней зависимости;

-        отношения пространственной зависимости.

 

На важность отношений зависимости указывают и разработчики и исследователи предметных онтологий.

В работе [29] приводятся примеры онтологической зависимости в области биологии: не может быть клеточного движения без клеток, биологические процессы зависят от органов, клеток и молекул – такая зависимость является строгой.

В руководстве по использованию онтологии генов GO, которая включает три независимых таксономии: молекулярные функции, биологические процессы и клеточные компоненты,   указывается, что некоторые термины онтологии GO, предполагают присутствие в онтологии других терминов, например, если имеется термин «регулирование X», то «процесс Х» также должен существовать и быть описанным в онтологии (http://www.geneontology.org/GO.usage.htm), что соответствует существованию отношения онтологической зависимости между сущностями РЕГУЛИРОВАНИЕ X и X.

Рассматривая индексирование генных продуктов терминами онтологии GO,  авторы работы [30]  отмечают, что если продукт проиндексирован термином Ti, и имеется термин Ti0, от которого зависит термин Ti, то продукт должен быть проиндексирован и термином Ti0.

4   Отношения часть-целое и онтологической зависимости  в информационно-поисковых тезаурусах

При разработке информационно-поисковых тезаурусов, которые часто рассматриваются как ресурсы онтологического типа, между единицами тезаурусов дескрипторами обычно устанавливаются два типа связи: иерархические и ассоциативные.

Помимо родовидовых отношений в состав иерархических отношений могут входить отношения часть-целое. Иерархические отношения обычно рассматриваются как несимметричные и транзитивные.

4.1   Отношения часть-целое в информационно-поисковых тезаурусах

Многие руководства и стандарты [11, 12] подчеркивают, что отношение часть-целое в информационно-поисковых тезаурусах должно устанавливаться в тех случаях, когда одно понятие включено в другое понятие независимо от контекста, только в таких случаях дескрипторы информационно-поискового тезауруса могут быть организованы в иерархии. Эта рекомендация связана с тем, что обычно в информационном поиске очень трудно четко определить контекст употребления термина и понять, применимо ли в данном контексте то или иное отношение.

Американский стандарт  на разработку тезаурусов [11] приводит общую рекомендацию для установления иерархических отношений, имеющую важное значение и для отношений часть-целое в силу описанных проблем с транзитивностью этого отношения: каждый вышестоящий дескриптор должен относиться к тому же базисному семантическому типу, что и нижестоящий дескриптор, например, оба (нижестоящий и вышестоящий) дескрипторы могут обозначать предмет, действие, свойство и т.п.

Например, анатомия (дисциплина) и центральная нервная система относятся к разным типам понятий, поэтому они не могут быть соединены иерархическими отношениями.

Дескрипторы  центральная нервная система и мозг относятся к органам живого организма и поэтому могут быть соединены иерархически.

Обычно приводится следующий список независимых от контекста отношений часть-целое (список не считается исчерпывающим):

-        системы и органы тела: нервная система - центральная нервная система –мозг;

-        географические объекты: Россия - Ростовская область - Ростов-на-Дону;

-        дисциплины и сферы деятельности: биология – ботаника;

-        иерархически организованные общественные, политические военные структуры: батальон – рота – взвод .

В тех случаях, когда имеется множественная принадлежность части к целому, то между такими терминами не должно устанавливаться иерархическое отношение. Между такими дескрипторами может быть установлено отношение ассоциации. Например, карбюраторы являются частями не только автомобилей. Поэтому дескрипторы карбюратор и автомобиль не должны быть связаны отношением часть-целое в информационно-поисковом тезаурусе.

Таким образом, с точки зрения разработки информационно-поисковых тезаурусов не рекомендуется описывать как отношения часть-целое такие отношения как (см. примеры из п.2.2):

Сталь – велосипед, поскольку сталь может быть в разных артефактах, не только в велосипеде,

Рука – музыкант, поскольку руки не только у музыкантов,

Кусок – пирог, поскольку многие другие вещи можно разделить на куски,

Дерево – лес, поскольку деревья растут не только в лесу.

Правила установления отношений часть-целое в информационно-поисковых тезаурусах не позволяют установить  отношения часть-целое для значительного количества примеров этого отношения в WordNet.

Так, этим  правилам не соответствуют такие примеры (см. п. 2.5)  как:

Air – wind – не всякий воздух обязательно ветер,

Computer – computer network – не всякий компьютер входит в состав сети,

Snow – Snowball – не всякий снег входит в состав снежка,

Iron – Steel – не всякое железо входит в состав стали и др.

 

Но даже так строго ограничиваемое установление отношений часть-целое может иметь проблемы. Так, в работе [31] указывается на проблемы в установлении отношений часть-целое в онтологии генов GO, которая по сути является информационно-поисковым тезаурусом (контролируемым словарем). Авторы работы приводят, по крайней мере, три  разных интерпретации  отношения часть-целое в этом ресурсе:

A является частью В означает, что A иногда является частью B в том смысле, что каждый пример A в некоторый момент своего существования становится частью В, понимаемой как часть-целое между конкретными сущностями, то есть в некоторые момент своего существования А является частью В, а в другие не является.

A является частью В означает, A может быть частью В в смысле независимого от времени отношения между классами: класс A является частью класса В, если существует класс С, являющийся подклассом В, для которого все примеры А являются частями C, и все примеры С содержат в качестве частей примеры А.

A является частью В означает, что словарь A включен в словарь В, например, онтология клеточных компонентов включается в онтологию генов.

4.2  Принципы установления отношения ассоциации в информационно-поисковых тезаурусах.

Одним из распространенных отношений в информационно-поисковых тезаурусах является отношение ассоциации. Рассмотрев рекомендации по установлению этого отношения, описанные в стандартах и руководствах, мы увидим достаточно очевидные аналогии между отношением ассоциации и отношением онтологической зависимости.

Основным назначением установления ассоциативных отношений между дескрипторами информационно-поискового тезауруса является то, что установление такой связи может указать дополнительные дескрипторы, полезные при индексировании или поиске.

Ассоциативное отношение наиболее трудно определить. Российский стандарт на создание информационно-поисковых тезаурусов указывает, что «ассоциативное отношение является объединением отношений, не входящих в иерархические отношения или в отношения синонимии. Допускается включать в ассоциативное отношение все виды отношений, кроме синонимии и отношения род — вид.» [13].

Другие источники стараются изложить более подробные принципы установления ассоциативных отношений, поскольку в противном случае отношение будет проставляться непоследовательно.

Американский стандарт [11] описывает наиболее общее правило установления ассоциативного отношения между дескрипторами таким образом, что это отношение стоит устанавливать между двумя дескрипторами, если при употреблении одного термина другой термин как бы подразумевается. Более того, один термин часто является необходимым элементом определения другого термина, например, термин клетка составляет необходимую часть определения термина цитология.

Более конкретно типы ситуаций, в которых необходимо установить ассоциативные отношения, могут быть следующими:

 

1)       научная дисциплина – объект изучения или специалист в этой дисциплине:

математика - математик

неврология - нервная система

 

2)       операции или процессы и их агент или инструмент:

контроль температурытермостат

охотник охота

 

3)       объекты или процессы и их контрагенты:

растения – гербициды

 

4)       действия и их продукты:

ткачество – ткань

слезоотделение – слеза

 

5)       действия и их цели:

переплетное дело – книга

 

6)       объекты и вещества и их свойства (уникальные свойства – unique):

яды – токсичность

жидкость – поверхностное натяжение

 

7)       понятия, связанные причинно-следственной связью:

смерть – оплакивание

 

8)       понятия и единицы их измерения

Электрический ток - ампер

 

Одним из важных источников ассоциативных отношений, по мнению, разных авторов руководств и учебных пособий по созданию тезаурусов являются определения терминов в энциклопедиях и терминологических словарях [32].

Однако здесь есть серьезные проблемы.

Во-первых, в случаях широких предметных областей, неустоявшихся терминологий, определения терминов могут значительно отличаться, отражать разные особенности концепций авторов словарей, что может привести к появлению ложных ассоциативных связей в тезаурусе.

Во-вторых, словарная статья термина в словаре, энциклопедии может упоминать достаточно много других терминов и неясно, все ли их или какую их часть нужно ассоциировать с заглавным термином.

4.3   Нетаксономические отношения информационно-поискового тезауруса и отношение онтологической зависимости.

На наш взгляд, попытки сформулировать принципы установления отношений в информационно-поисковых тезаурусах имеют явные аналогии с проблемой установления отношений онтологической зависимости.

Во-первых, требование при описании отношения часть-целое того, чтобы это отношение выполнялось вне зависимости от контекста, сильно связано с зависимостью существования части от существования целого, что и показывают приводимые примеры (см. п. 4.1.)

Во-вторых,  наиболее общее правило установления ассоциативного отношения между дескрипторами, рекомендуемое американским стандартом [11], говорящее о том, что при установлении этого отношения один термин как бы подразумевает другой – вообще говоря, во многих случаях это требование означает случаи концептуальной зависимости  и зависимости по определению между понятиями, когда введение одного понятия, термина невозможно пока не введено другое понятие, термин.

Рекомендации по использованию определений терминов для введения ассоциативных отношений также, как представляется, являются попытками нащупать наиболее существенные зависимости между терминами предметной области

В-третьих, если мы рассмотрим примеры рекомендуемых отношений ассоциации, мы увидим, что для большинство терминов, связанных ассоциациями в таких примерах, соответствующие понятия связаны односторонними или двусторонними отношениями онтологической зависимости.

Например, в примерах из п 4.2 имеем:

 

1) научная дисциплина – объект изучения или специалист в этой дисциплине:

математика - математик

неврология - нервная система

 

Специалист по дисциплине является концептуально зависимым от дисциплины, а область изучения является концептуально зависимой от своего объекта изучения.

 

2) операции или процессы и их агент или инструмент

контроль температуры – термостат

охотник – охота

 

Понятно, что приспособления (термостат) концептуально зависят от своего назначения, а роли (охотник) зависят от той ситуации, в которой они задействованы.

 

3) объекты или процессы и их контрагенты

растения – гербициды

 

Если контрагент создан специально для противодействия некоторому объекту или процессу, это означает, что он является концептуально зависимым от этого объекта (процесса).

 

Таким образом, разработчики информационно-поисковых тезаурусов интуитивно включают в правила установления тезаурусных отношений те или иные виды онтологической зависимости.

5   Практические выводы для создания онтологий

Как мы показали в предыдущих разделах, в настоящее время существует достаточно широкий спектр подходов к отношениям часть-целое и отношениям онтологической зависимости. Отношения часть-целое исследуются довольно давно, однако полного согласия между исследователями по их классификации, границам, пока не достигнуто. Отношения онтологической зависимости стали вводиться в онтологические ресурсы относительно недавно, и еще требуют значительного объема исследований.

Несмотря на разнообразие подходов,  можно сделать три практических вывода, полезных при создании онтологий, особенно в широких предметных областях, включающих  множество различных типов сущностей. Эти принципы мы перечислим в следующих подразделах.

О тестах при установлении отношений часть-целое.  При определении того набора отношений, которые будут относиться в данной онтологии в отношениям часть-целое, полезно применять не неоднозначные лингвистические тесты, а проводить анализ, подобный  рассуждениям в приведенным п. 2.3., работе [3], онтологическом анализе Дж.Совы [8], когда рассматривается, как изменение или уничтожение предполагаемых частей и целого влияет друг на друга.

О зависимых частях. При определении отношений часть-целое в создаваемом  онтологическом ресурсе важно прислушаться к рекомендациям стандартов и руководств по разработке информационно-поисковых тезаурусов и, прежде всего, стремиться описывать такие части, которые жестко «привязаны» к своему целому, что  связано  с онтологической зависимостью  части от целого.

Этот вывод связан с тем, что все приводимые примеры кажущейся нетранзитивности отношения часть-целое упоминают  такие части, которые нежестко связаны с приводимыми в примерах целыми, и именно такие отношения часть-целое не рекомендуют устанавливать стандарты и руководства по разработке информационно-поисковых тезаурусов.

Например, работа [16] указывает на проблемы с транзитивностью таких отношений часть-целое как отношения понятиями ТЕЛО, человек и  семья.  Но, как представляется, частью понятия СЕМЬЯ является понятие ЧЛЕН СЕМЬИ, и в таком случае проблем с транзитивностью не обнаруживается.

Как было показано при рассмотрении проблемы транзитивности отношения часть-целое в п.2.3, наложение дополнительных условий на транзитивное отношение может приводить к ограниченному действию этого свойства.

Однако в число аксиом, которые обычно постулируются для отношения зависимости, входит и аксиома транзитивности. Таким образом, транзитивны и базовое отношение часть-целое и дополнительно накладываемое на него условие, что дает возможность использования этого отношения для транзитивного логического вывода.

В случае, если понятие-часть может принадлежать нескольким целым, то можно использовать несколько возможностей для описания такого отношения, которые обычно связаны с введением дополнительных понятий.

Первый способ подходит в тех случаях, если у исходной части есть подвид, который является зависимой частью исходного целого.

Так для описания того факта, что АВТОМОБИЛЬ включает ДВИГАТЕЛЬ,   необходимо ввести дополнительное понятие АВТОМОБИЛЬНЫЙ ДВИГАТЕЛЬ как вид понятия ДВИГАТЕЛЬ и описать понятие АВТОМОБИЛЬНЫЙ ДВИГАТЕЛЬ как часть АВТОМОБИЛЯ.

Тем же способом можно воспользоваться для описания отношения ДЕРЕВО – ЛЕС: для этого могут быть дополнительно введены понятия ЛЕСНОЕ РАСТЕНИЕ, ЛЕСНОЕ ДЕРЕВО (ДЕРЕВО В ЛЕСУ).

Другим способом является введение обобщающего понятия для всех целых, к которым может принадлежать часть и установить отношение между частью и именно этим целым.

Здесь можно привести пример из химии: альдегидная группа входит в такие соединения как альдегидокислоты, альдегидоспирты и т.п., но имеется такое обобщающее выражение  как альдегидное соединение. Таким образом, можно ввести понятие АЛЬДЕГИДНОЕ СОЕДИНЕНИЕ описать как его виды понятия альдегидокислоты и альдегидоспирты, а понятию альдегидная группа установить отношение ЦЕЛОЕ с понятием АЛЬДЕГИДНОЕ СОЕДИНЕНИЕ.

В некоторых случаях можно воспользоваться обоими методами. Так, для описания отношения РЕАКТИВНЫЙ САМОЛЕТРЕАКТИВНЫЙ ДВИГАТЕЛЬ, может быть введено дополнительное понятие АВИАЦИОННЫЙ РЕАКТИВНЫЙ ДВИГАТЕЛЬ или дополнительное понятие РЕАКТИВНЫЕ СРЕДСТВА ПЕРЕДВИЖЕНИЯ.

О базовом наборе отношений. Третий вывод, который может быть сделан на основе рассмотрения формальных нетаксономических отношений часть-целое и отношения онтологической зависимости, состоит в том, что практически в любой предметной области можно начать работу над онтологией с набора из трех отношений: таксономического отношения, отношения часть-целое, и отношения внешней онтологической зависимости, которое связывает между собой сущности, не состоящие между собой в отношении часть-целое.

В случаях, когда необходимо создать онтологию для большой разнородной области, уже сам выбор отношений представляет собой серьезную проблему. Можно достаточно быстро начать работы над онтологией, выявляя основные и понятия и устанавливая три вышеперечисленных отношения, и в процессе работы уточнить полный набор наиболее подходящих для предметной области отношений онтологии.

Литература

1. Guarino, N., Welty, C.: A Formal Ontology of Properties. In Knowledge Engineering and Knowledge Management: Methods, Models and Tools. 12th International Conference, EKAW 2000, Springer Verlag, pp. 97--112 (2000)

2. Masolo, C., Borgo, S., Gangemi, A., Guarino, N., Oltramari, A., Shneider, L.:  WonderWeb. Final Report. Deliverable D18 (2003)

3. Varzi, A.: A Note on Transitivity of Parthood. Applied Ontology, 1:2, pp.141-‑146 (2006)

4. Winston, M., Chaffin, R., Herrmann, D.: A Taxonomy of Part-Whole Relations. Cognitive Science, vol.11, pp. 417--444 (1987)

5. Grenon, P.: Spatio-temporality in Basic Formal Ontology: SNAP and SPAN, Upper-Level Ontology, and Framework for Formalization: PART I. IFOMIS Report 05/2003, Institute for Formal Ontology and Medical Information Science (IFOMIS), University of Leipzig, Leipzig, Germany (2003)

6. Cyc Ontology Guide: Introduction, http://www.cyc.com/cyc-2-1/intro-public.html.

7. Niles, I.,  Pease, A.:  Towards a Standard Upper Ontology. In  Welty, C., Smith, B. (eds.) Proceedings of the 2nd International Conference on Formal Ontology in Information Systems (FOIS-2001), Ogunquit, Maine, October 17-19 (2001)

8. Sowa, J.: Knowledge Representation: Logical, Philosophical, and Computational Foundations. Brooks Cole Publishing Co., Pacific Grove, CA (2000).

9. Welty, C., McGuinness, D., Uschold, M., Gruninger, M., Lehmann, F.: Ontologies: Expert Systems all over again. AAAI-1999 Invited Panel Presentation (1999)

10. Суперанская, А.В., Подольская, Н.В., Васильева, Н.В.: Общая терминология: Вопросы теории. Отв. Ред. Т.Л.Канделаки. Изд. 2-е, стереотипное. М.: Едиториал УРСС  (2003)

11. Z39.19 – Guidelines for the Construction, Format and Management of Monolingual Thesauri.  NISO (1993)

12. Will, L.: Thesaurus consultancy. – The thesaurus: review, renaissance and revision. Roe, S.K., Thomas, A.R. (eds.)  New York; London : Haworth (2004)

13. ГОСТ 7.25.-2001. Тезаурус информационно-поисковый одноязычный: Правила разработки: структура, состав и форма представления: Межгосударственный стандарт. Минск: Межгосударственный совет по стандартизации, метрологии и сертификации (2001)

14. Методика составления информационно-поисковых теазурусов. М.: ВИНИТИ (1973)

15. Gangemi, A., Guarino, N., Masolo, C., Oltramari, A.: Understanding Top-Level Ontological Distinctions. In Proceedings of IJCAI 2001 workshop on Ontologies and Information Sharing. Seattle. pp. 26--33 (2001)

16. Cruse, D.: Lexical Semantics. Cambridge: University Press (1986)

17. Gerstl, P., Pribennow, S.: A conceptual theory of part-whole relations and its applications. Data and Knowledge Engineering, vol. 20,  pp. 305--322 (1996)

18.            Noy, N., Wallace, E.: Simple part-whole relations in OWL Ontologies.  W3C Technical report (2005)

19. Johansson, J.: On the Transitivity of the Parthood  Relations. Relations and Predicates.  Frankfurt: Ontos Verlag,  pp. 161--181 (2004)

20. Motschnig-Pitrik, R., Kaasboll, J.: Part-Whole Relationship Categories and their Application in Object-Oriented Analysis. IEEE TSE,  vol. 11(5), pp.779--797. (1999)

21. Artale, A., Franconi, E., Guarino, N.,  Pazzi, L.: Part-Whole Relations in Object-Centered Systems: An Overview. Data and Knowledge Engineering, vol.20, pp.347--383 (1996)

22.            Леоненков, А.В.: Самоучитель UML. СПб.: БХВ-Петербург (2001)

23. Miller, G.: Nouns in WordNet. In: Fellbaum, C. (ed) WordNet – An Electronic Lexical Database. – The MIT Press.  pp.23--47 (1998)

24. Gangemi, A., Navigli, R., Velardi, P.:  The OntoWordNet project: extension and axiomatisation of conceptual relations in wordnet. International Conference on Ontologies, Databases and Applications of Semantics (ODBASE), Catania (Italy) (2003)

25. Guarino, N.: Formal Ontology and Information Systems. In N. Guarino, editor, Proceedings of the 1st International Conference on Formal Ontologies in Information Systems, FOIS'98, Trento, Italy, pp. 3--15. IOS Press (1998)

26. Simons, P.: Parts. A study in Ontology. Oxford University Press  (1987)

27. Masolo, C., Vieu, L., Bottazzi, E. Catenacci, C., Ferrario, R., Gangemi, A., Guarino, N.: Social roles and their descriptions. Proceedings of the Ninth International Conference on the Principles of Knowledge Representation and Reasoning. AAAI Press (2004)

28. Fine, K.: Ontological Dependence. Proceedings of the Aristotelian Soceity 95: pp.269--290. (1995)

29. Kumar, A., Smith, B.:  The ontology of blood pressure: a case study in creating ontological partitions in biomedicine. (2004)

30. Burgun, A., Bodenreider, O., Aubry, M., Mosser, J.: Dependence relations in Gene Ontology: A preliminary study. Workshop on The Formal Architecture of the Gene Ontology. Leipzig, Germany, May 28-29 ( 2004).

31. Smith, B., Köhler, J., Kumar, A.: On the application of formal principles to life science data: A case study in the Gene Ontology. DILS 2004: Data Integration in the Life Sciences. pp.124--139 (2004)

32. Герд, А.С.: Ассоциативные отношения в информационно-поисковом тезаурусе и пути их выделения. Прикладная лингвистика, Изд-во С.-Петербургского ун-та, стр. 56--62 (2005)