Инструментальные средства создания баз знаний на основе системы онтологий

Болотова В.А. Григорьев А.В.
Донецкий национальный технический университет


Источник: ИУС и КМ - 2010 / Матеріали I науково-технічної конференції молодих учених та студентів. - Донецьк, ДонНТУ - 2010.


Введение

      Сегодня искусственный интеллект – это обширная область исследований и разработок интеллектуальных систем, предназначенных для работы в трудно формализуемых областях деятельности человека. В настоящее время принято выделять несколько направлений развития искусственного интеллекта: Одно из направлений связано с разработкой интеллектуальных систем, основанных на знаниях. В данном направлении занимаются разработкой моделей представления знаний, созданием баз знаний.
      Одним из перспективных применений методов данного направления является создание интеллектуальных обучающих систем (ИОС). ИОС предназначены для автоматизации и индивидуализации обучения. Традиционно выделяют четыре модели представления знаний, используемых при построении баз знаний систем основанных на знаниях:
            1. Логические модели;
            2. Продукционные модели;
            3. Фреймовые модели;
            4. Семантические сети.
      Однако на данный момент особый интерес у исследователей искусственного интеллекта вызывают онтологии. Онтологии могут использоваться для представления знаний о понятиях предметной области и предположительных отношениях между ними, для описания содержания веб-страниц. Кроме того онтологии можно использовать при построении баз знаний не только ИОС, но также любых других приложений.
      1. Общая постановка проблемы.
      В исследовании онтологий вопросы возникают с первых шагов. Так, до сих пор не существует единого определения для понятия онтология. Само понятие онтология происходит от др. - греч. «онтос» - сущее, «логос» - учение, понятие, т.е. это раздел философии, изучающий бытие.
      Википедия определяет онтологию (в информатике) как попытку всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы [1]. Под концептуальной схемой подразумевается набор понятий + информация о понятиях (свойства, отношения, ограничения, аксиомы и утверждения о понятиях, необходимых для описания процессов решения задач в избранной предметной области).
      Среди специалистов, занимающихся проблемами компьютерной лингвистики, наиболее устоявшимся (классическим) считается определение онтологии, данное Губертом: онтология – это спецификация концептуализации [2]. Так же известен ряд расширенных определений Губерта, среди которых можно выделить такие:
            1. Онтология – это эксплицитная спецификация концептуализации, где в качестве концептуализации выступает описание множества объектов предметной области и связей между ними;
            2. Онтология – это знания, формально представленные на базе концептуализации. Формально онтология состоит из терминов, организованных в таксономию, их определений и атрибутов, а также связанных с ними аксиом и правил вывода;
            3. Онтология – формальная спецификация разделяемой концептуализации, которая имеет место в некотором контексте предметной области;
            4. Онтология – база знаний, описывающая факты, которые предполагаются всегда истинными в рамках определенного общества на основе общепринятого смысла используемого словаря.
      На сегодняшний день под онтологией можно понимать:
             1. надежный семантический базис в определении содержания;
            2. общую логическую теорию, которая состоит из словаря и набора утверждений на некотором языке логики;
            3. основу для коммуникации между людьми и компьютерными агентами.
      Таким образом, в настоящее время не существует общепринятого определения. Считается, что онтология представляет собой базу знаний, описывающую факты, которые предполагаются всегда истинными в рамках определенного сообщества на основе общепринятого смысла используемого словаря.
      База знаний же может описывать факты и утверждения, истинность которых зависит от состояния переменных внешней среды. В данном вопросе пока нет полной ясности.
      Следует отметить, что конкретные области использования онтологического подхода на практике требуют специальных подходов, как к определению понятия онтологии, так и к механизму их применения. В частности, такой областью является САПР.
      Цель работы.
      Для систематического изучения свойств онтологий и их применения на практике необходима такая классификация свойств онтологий, которая охватывает свойства самых разных онтологий, не ограничивая исследователей в обнаружении новых свойств.
      Поэтому целью работы является разработка классификации известных из литературы свойств онтологий, удобной для систематического оценивания онтологий на практике. Такая классификация необходима для выбора наиболее полного набора свойств при оценивании произвольной онтологии в зависимости от "типа" онтологии и от преследуемых целей.
      Такая классификация может быть положена в основу единого подхода к оцениванию и определения в однозначных терминах свойств онтологий, а затем и к объективному оцениванию самих онтологий. Полученная классификация должна использоваться как источник требований к использованию онтологического подхода на практике в области САПР.
      2. Постановка задач исследования.
      Постановка задачи.
      Работа предполагает прояснение ситуации с определением понятий «онтология» и «свойство онтологии», анализ существующих классификаций свойств и обсуждение возможности их использования для систематического оценивания онтологий и их моделей на практике. Представить классификацию свойств, нацеленную на охват и упорядочение всех известных из литературы свойств, а также на «накопление» ранее не обсуждавшихся, но присущих онтологиям свойств. С учетом наличия в структуре онтологий различных видов связей детализировать классификацию различных структурных свойств.
      Необходимо выполнить:
            - классификацию онтологий, как источник общих требований к эффективному построению онтологий в различных предметных областях;
            - перечислить специфические требования к онтологиям в САПР;
            - предложить общие подходы к построению онтологий в САПР.
      Проблематика онтологий.
      В настоящее время актуальной является задача формирования концептуальных «прозрачных» представлений для слабоструктурированных предметных областей. Это связано с информационным бумом и лавинообразным ростом «пустой» или зашумленной информации.
      Сегодня ведущей парадигмой структурирования информационных потоков являются онтологии, или иерархические концептуальные структуры, которые формируются аналитиком на основе изучения и структурирования потоков информации, документов, протоколов извлеченных знаний и других источников. Онтологический инжиниринг (ОИ) развивает основные положения инженерии знаний – науки о моделях и методах извлечения, структурирования и формализации знаний.
      Собственно инженерия знаний – это ветвь искусственного интеллекта, в то время как ОИ охватывает более широкий круг приложений – от систем управления знаниями до дистанционного обучения.
      Онтологический инжиниринг делает первые шаги, поэтому каждый аналитик идет методом проб и ошибок, создавая сложнейшие онтологические структуры, отражающие лабиринты профессиональных знаний в различных прикладных областях. Система BpWin (технология SADT) есть средство создания ряда предметно-ориентированных онтологий, отличающихся графическим интерфейсом и типом используемых отношений.
      Потребности в разработке онтологии.
            - для совместного использования людьми или программными агентами общего понимания структуры информации;
            - для возможности повторного использования знаний в предметной области;
            - для того чтобы сделать допущения в предметной области явными;
            - для отделения знаний в предметной области от оперативных знаний;
            - для анализа знаний в предметной области.
            - другими словами онтологии позволяют представить новые понятия так, что они становятся пригодными для машинной обработки
.       С помощью них можно "перекинуть мостик" между новыми понятиями, с которыми система еще не встречалась, и описаниями уже известных классов, отношений, свойств и объектов реального мира.
      Основные вопросы, которые подлежат решению.
            1. Разработка проблемно-ориентированного графического редактора по разработке системы онтологии, что отвечает многоуровневой модели пространства и времени, что соответствует специфике САПР.
            2. Разработка системы ввода семантических продукций над множеством онтологии.
      Критерии построения онтологий.
      Цель создания онтологий - обеспечить поддержку деятельности по накоплению, разделению и повторному использованию знаний. Исходя из этой цели, в [8] введен рад критериев, которым должна отвечать онтология:
            1. прозрачность – онтология должна быть связной, т.е она должна позволять делать выводы, которые согласуются с исходными определениями понятий. По крайней мере, определяемые аксиомы должны быть логически согласованы между собой.
            2. расширяемость – онтология должна быть разработана с возможностью использования разделяемого и пополняемого словаря.
            3. независимость от синтаксиса – концептуализация должна быть специфицирована на уровне знания максимально независимо от представления понятий на уровне символов.
            4. минимальный базис при высокой выразительности – онтология должна вводить минимальный базовый набор понятий, но их должно быть достаточно, чтобы моделировать мир в требуемых целях и создавать сложные сцены.
      На тему «как построить онтологию» существует множество рекомендаций, руководств, советов, подсказок и указаний. Однако до сих пор не предложено общей методологии построения онтологий. Некоторые шаги в этом направлении были предприняты в следующих работах:
            1. IDEF5: язык и метод для описания онтологий [8];
            2. статья Грубера, в которой приведено обсуждение принципов описания онтологий [9];
            3. статья Скуса, посвященная вопросам согласования, как пути для совместного использования и интеграции онтологий, разработанных разными группами [10];
            4. статьи Гомез-Переза, посвященные технологиям совместного использования знаний [11].
      Указанные выше работы приводят дальнейшие шаги в развитии методологии, но не предлагают базовой (skeletal) методологии. Попытаемся вывести такую базовую методологию, опираясь на работы [12] и [13]. Такая методология должна включать ограниченное число стадий и быть применимой к построению любой онтологии.
      В работе [13] авторы считают, что комплексная базовая методология для разработки онтологий должна включать следующие стадии:
            1. Определение цели.
            2. Построение онтологии.
            3. Зафиксировать онтологию.
            4. Закодировать онтологию.
            5. Провести интеграцию существующих онтологий.
            6. Оценить.
            7. Задокументировать.
      Дополнительно для каждой стадии должны быть описаны технология, методика, принципы и рекомендации, например, типы связей между стадиями (рекомендуемый порядок, чередование, входы/выходы).
      Проблема комплексного представления модели объекта проектирования в предлагаемой технологии.
      С точки зрения САПР основные типы онтологий, которые можно применить в САПР, т.е. ориентированные в большей мере на отражение реальных физических объектов, можно назвать подходы языков UML и SADT.
      Отличия подхода UML и языка SADT:
            - UML более ориентирован за счет использования объектно-ориентрованного подхода и диаграмм классов на решение задач типизации, обладая при этом недостаточной долей средств структуризации;
            - SADT более ориентирован на описание структур в ущерб возможности решения задач типизации, т.е. использования объектно-ориентированного подхода и диаграмм классов.
      Общие выводы:
            1) Ни тот, ни другой подход в настоящее время в полной мере не соответствует комплексной задаче, имеющейся в САПР, т.к. в этом случае необходимы как средства структурного отображения объектов, так и средства объектно-ориентированного подхода и диаграмм классов для типизации объектов.
            2) Оба класса языков постепенно переходят в класс смешанных средств, включающих как возможность структурного моделирования, так и возможность типизации. Это достигается за счет ввода новых типов диаграмм, входящих в набор языковых средств.
            3) Средства диаграмм потоков, имеющиеся как UML, так и в SADT, обеспечивают переход модели на следующий уровень абстракции, например, на уровень языков имитационного моделирования типа GPSS.
            4) Актуальными являются любые новые разработки, направленные на создание комплексных моделей, объединяющих возможность типизации и представления структур объектов в САПР.
      Недостатки названных подходов к построению онтологий с точки зрения требований САПР:
            - отсутствие явной ориентации на физическую семантику предметной области, т.е. возможности представления фазовых переменных (потенциалы и потоки) и координат взаимодействия (емкости, сопротивления и т.д.), а так же возможности отражения законов сохранения;
            - отсутствие общих средств построения явных переходов между модельными уровнями представления объекта, заданных в рамках физической семантики предметной области; т.к. отдельные конкретные существующие решения обеспечения данного перехода не составляют целостную методику;
      Т.о, необходим комплексный подход, использующий средства как языка UML, так и языка SADT, лишенный названных недостатков с точки зрения требований со стороны САПР.
      3. Решение задачи и результаты исследований.
      Специфические черты метода представления моделей структур в предлагаемой системе онтологий [14-16]:
            1) Неразрывная связь блока с его свойством-потенциалом;
            2) Наличие рефлексивных структурных связей по «собственному» свойству;
            3) Деление свойств-потенциалов на «свои», т.е. собственный потенциал и «чужие», т.е. потенциалы прочих блоков, влияющих через связи на данный собственный потенциал.
            4) Декомпозиция данных с одновременной декомпозицией блоков, связанных структурными связями с данным свойством;
            5) Декомпозиция всех структурных связей, где имеет место собственное свойство, подвергнутое декомпозиции, включая рефлексивную связь по собственному свойству и связи данного декомпозированного свойства с прочими блоками;
            6) Введение т.н. внешних границы, включающей только те собственные свойства внутренних подблоков данного блока, которые имеют структурные связи с блоками за пределами вышележащего родительского блока;
            7) Введение т.н. внутренней границы, как полный состав собственных свойств всех подблоков данного блока;
            8) Разбиение внутренней границы на два подмножества: первое включает все свойства внешней границы, второе – внутренние, инкапсулированные свойства внутренних подблоков, не имеющих структурных связей с внешней средой.
      Предлагаемая комбинация особенностей метода представления модели структур является оригинальной и отражает специфику САПР.

Выводы

      Анализ позволил сделать следующие выводы, что в настоящее время актуальны исследования, направленные на разработку такого подхода к представлению и тиражированию знаний, который с одной стороны позволял бы наиболее адекватно учитывать специфику проблемной области, а с другой – представлять и использовать знания в некотором унифицированном виде.
      Исходя из анализа, в предлагаемой работе выполнено:
            - построена классификация онтологий, как источник общих требований к эффективному построению онтологий в различных предметных областях;
            - перечислены специфические требования к онтологиям в САПР;
            - предложены общие подходы к построению онтологий в САПР.

Список литературы

      1. Онтология_(информатика) [Электронный ресурс]. Энциклопедия Википедия. - Режим доступа: http://ru.wikipedia.org/wiki/Онтология_(информатика)
      2. Gruber T.R. A translation approach to portable ontologies [Электронный ресурс] / T.R. Gruber // Knowledge Acquisition. 1993. - № 5(2). - С. 199-220. - Режим доступа: http://www-ksl.stanford.edu/kst/what-is-an-ontology.html
      3. Gruber T. Toward Principles for the Design of Ontologies // International Workshop on Formal Ontology, March. 1993. Padova. Italy.
      4. Ясницкий Л. Н. Введение в искусственный интеллект. - М.: Издательский центр «Академия», 2005. - 176 с.
      5. Клещев А. С., Артемьева И. Л.. Математические модели онтологий предметных областей. Часть 1. Существующие подходы к определению понятия «онтология». // Научно - техническая информация, серия 2 «Информационные процессы и системы», 2001, № 2, С. 20 - 27.
      6. Т. А. Гаврилова, В. Ф. Хорошевский. Базые знаний интеллектуальных систем. - С.-Пб.: Питер, 2001
      7. Клещев А. С., Артемьева И. Л.. Математические модели онтологии предметной области. Часть 2. Компоненты модели. // Научно - техническая информация, серия 2 «Информационные процессы и системы», 2001, № 3, с. 19 - 28.
      8. KBSI. Knowledge based systems incorporated, Technical Report IDEF5 Method Report [Электронный ресурс] AL/HRGA, Wright-Patterson Air Force Base, Ohio, September 1994. - Режим доступа: http://www.idef.com/pdf/Idef5.pdf
      9. Gruber T. Towards principles for the design of Ontologies used for knowledge sharing // International Journal of Human-Computer Studies. - 1995. - № 43(5/6). - С. 907-928.
      10. Skuce D. Conventions for reaching agreement on shared Ontologies / D. Skuce // In Proceeding of the 9th Knowledge Acquisition for Knowledge Based Systems Workshop, 1995 [Электронный ресурс]. - Режим доступа: http://portal.acm.org/ft_gateway.cfm?id=1135849&type=pdf&coll=GUIDE&dl=GUIDE&CFID=43461927&CFTOKEN=47811814
      11. Gomez-Perez A. Evaluation and assessment of knowledge sharing technology // Towards Very Large Knowledge Bases - Knowledge Building and Knowledge Sharing 1995 / A. Gomez-Perez, N. Juristo, J. Pazos ; іn N.J. Mars, editor. - Amsterdam : IOS Press, 1995. - Р. 289-296.
      12. Гладун А.Я. Онтологии в корпоративных системах. Часть I / А.Я. Гладун, Ю.В. Рогушина // Корпоративные системы. - 2006. - № 1. - С. 41-47.
      13. Uschold Mike. Towards a Methodology for Building Ontologies [Электронный ресурс]/ Mike Uschold, Martin King. - Режим доступа: http://www.aiai.ed.ac.uk/project/pub/documents/1995/95-ont-ijcai95-ont-method.ps
      14. Григорьев А.В. Семантика модели предметной области для интеллектуальных САПР. Научные труды Донецкого государственного университета. Серия «Информатика, кибернетика и вычислительная техника», (ИКВТ-2000) выпуск 10. - Донецк, ДонГТУ, 2000. - С. 148-154.
      15. Григорьев А.В. Комплекс моделей САПР как система взаимосвязанных уровней о действительности. Научные труды Донецкого государственного университета. Серия «Информатика, кибернетика и вычислительная техника», (ИКВТ-2000) выпуск 10. - Донецк, ДонГТУ, 2000. - С. 155-167.
      16. Григорьев А.В. Вербальная модель предметной области для интеллектуальных САПР. Науковi працi Донецького Державного технiчного унiверситету. Серiя «Обчислювальна технiка та автоматизацiя». Випуск 20. - Донецьк, ДонДТУ, 2000. - С. 171-180.


© Болотова Виктория, ДонНТУ 2010