Автор: Р.С. Кутелёв, М.И. Пахота, А.В. Григорьев
Источник: Донецкий национальный технический университет: Сборник материалов III Международной научно-практической конференции (студенческая секция) – г. Донецк: ДонНТУ, 2020. – с.176–182,[Ссылка]
Аннотация: В статье проведен сравнительный анализ редакторов онтологий. Выполнен анализ представления классов, паттернов. Изучена возможность использования продукций для синтеза классов в редакторах онтологий.
Ключевые слова: онтология, класс, продукционные правила, синтез классов, редактор онтологий.
Одним из наиболее перспективных и динамично развивающихся областей искусственного интеллекта являются онтологии. Такое состояние дел делает актуальной задачу поиск новых путей развития инструментальных средств работы с онтологиями, и, в частности, редакторов онтологий.
Под онтологией можно понимать:
Еще совсем недавно редакторы онтологий относились к системам, более предназначенным только для полноценного описания понятий различных предметных областей, с достаточно слабой инструментальной базой для ввода правил или продукций.
Такое состояние позволяло рассматривать два класса систем: редакторы онтологий, с одной стороны, и – экспертные системы и инструментальные системы для создания экспертных систем, с другой стороны.
В настоящее время редакторы онтологий все больше приобретают черты инструментальных систем для создания экспертных систем, но построенных уже, в отличие от старых
систем такого класса, на базе полноценной модели предметной области.
Современные онтологии выполняют три задачи:
Целью предлагаемой работы является решение двух задач:
1) Выполнение анализа современных редакторов онтологий с точки зрения:
2) Определение актуальных направлений развития редакторов онтологий и постановка задачи по созданию редакторов онтологий нового поколения.
На данный момент существует огромное количество инструментов работы с онтологиями. Наиболее популярными являются: Apollo, Protégé, Swoop, OntoStudio, TopBraid Composer (FE).
Общее описание инструментов (табл. 1) включает информацию о разработчиках и доступности. На таблице видно, что Apollo, Protégé и Swoop имеют открытый исходный код, а OntoStudio и TopBraid Composer (FE) находятся под лицензией на программное обеспечение [2].
Особенность |
Apollo |
OntoStudio |
Protégé |
Swoop |
TopBraid Composer (FE) |
Разработчики |
KMI открытый университет |
Ontoprise |
SMI Стэнфордский университет |
MND Университет Мэриленда |
Верхний квадрант |
Доступность |
Открытый исходный код |
Лицензия |
Открытый исходный код |
Открытый исходный код |
Лицензия |
Импорт с языков |
Apollo Meta |
XML(S), OWL, RDF(S),UML диаграммы, схемы базы данных (Oracle,MS- SQL, DB2,MySQL), Outlook, метаданные файловой системы и удаленный доступ OntoBroker |
XML(S), RDF(S), OWL, (RDF,UML, XML)backend, Excel, BioPortal b DataMaster |
OWL, XML, RDF и текстовые форматы |
RDFa, WOL, RDF(s),XHTML, Microdata и RDFa источники данных, SPIN, Лента новостей, файлы RDF в новый TDB, электронная почта и Excel |
Экспорт на языки |
OCMLи CLOS |
XML(S), OWL, RDF(S),UML и OXML |
XML(S), RDF(S), OWL, Clips, SWRL-IQ, Instance Selection, MetaAnalysis, OWLDoc, Queries and (RDF,UML, XML)backend |
RDF (S), OIL и DAML |
Слияние / преобразование графиков RDF, RDF (S), WOL |
Архитектура программного обеспечения и эволюция инструмента (табл. 2) включает информацию о платформах, необходимых для использования инструмента. Фактически предоставляется следующая информация: архитектура по умолчанию (автономная, клиент / сервер, многоуровневое приложение), расширяемость, хранение онтологий (базы данных, файлы ASCII и т.д.) и управление резервным копированием.
Все эти инструменты переходят на платформы Java, Swoop основан на веб-технологиях, а Protégé, OntoStudio и Swoop имеют архитектуру клиент / сервер. Protégé, OntoStudio и TopBraid Composer (FE) используют базы данных для хранения онтологий [2].
Функциональная совместимость (табл. 3) включает информацию о взаимодействии инструментов с другими инструментами и языками разработки онтологий, переводах на некоторые языки онтологий и обратно.
Это еще одна важная особенность интеграции онтологий в приложения. Большинство этих инструментов поддерживают импорт и экспорт на многие языки и из них в различных форматах. TopBraid Composer (FE) поддерживает импорт в источники данных RDFa, WOL, RDF, XHTML, микроданные и RDFa, SPIN, новостную ленту, электронную почту и Excel. Swoop поддерживает RDF (S), OIL и DAML. Apollo поддерживает метаязык Apollo и т.д. Protégé поддерживает импорт текстовых файлов, таблиц базы данных и файлов RDF. OntoStudio поддерживает схемы баз данных (Oracle, MS-SQL, DB2, MySQL), электронную почту Outlook и т. Д. TopBraid Composer (FE) поддерживает экспорт слияний / преобразований графиков RDF, RDF (S) и WOL.
Также Swoop поддерживает RDF (S), OIL и DAML, а Apollo поддерживает метаязык Apollo. Большинство из них поддерживают OWL, RDF (S) и XMl (S). Однако сравнительного исследования качества каждого из этих переводчиков не проводилось. Более того, нет экспериментальных результатов о возможности обмена онтологиями между различными инструментами и знаниями в процессе перевода [2].
Особенность |
Apollo |
OntoStudio |
Protégé |
Swoop |
TopBraid Composer (FE) |
Семантическая веб-архитектура |
Независимая |
Eclipse клиент/сервер |
Независимая и клиент-сервер |
Веб-интерфейс и клиент-сервер |
Независимый Eclipse плагин |
Расширяемость |
Плагины |
Плагины |
Плагины |
Yes Via плагины |
Плагины |
Управление резервным копированием |
Нет |
Нет |
Нет |
Нет |
Нет |
Хранение онтологий |
Файлы |
СУБД |
Файл и СУБД (JDBC) |
Как HTML модели |
СУБД |
Особенность |
Apollo |
OntoStudio |
Protégé |
Swoop |
TopBraid Composer (FE) |
С другими инструментами онтологии |
Нет |
OntoAnnotate ,OntoBroker, OntoMat, Semantic и Miner |
PROMPT, OKBC, JESS, FaCT и Jena |
Нет |
Sesame , Jena и Allegro Graph |
Понятие “онтология” включает в себя пространственное знание, семантическое знание, временное знание, представленное на рисунке 1.
Пространственное знание. Объекты имеют два свойства: пространственное и непространственное. Пространственные свойства определяют объекты по трем категориям, а именно положение объектов, форма объектов и размер объектов. Непространственные свойства представляют цвет и категорию объекта. Эти свойства поддерживают планирование задач робота. Пространственное представление необходимо для представления концепции пространства и формы в роботизированной среде [4]. В основе системы ИИ лежит разработка задачи робота высокого уровня, в которой все знания предметной области представлены с использованием пространственных функций. Но навигация роботов осуществляется с неполными знаниями предметной области, неизвестными объектами и незнакомым расположением объектов в предметной области. Чтобы решить эту проблему, пространственное представление с использованием онтологии определяет, как явную, так и неявную спецификацию задачи в домене, а также предоставляет карту для моделируемой области. Пространственное представление явно определяет пространственные сущности, такие как расположение объекта, форма объекта и определяет положение объекта в домене. Неявная спецификация управляет поведением робота и движением действий по достижению места назначения в пространстве. Это пространственное представление основано на трех основных категориях, а именно на пространственной сущности, пространственных отношениях и нечеткой информации, которые помогают роботу успешно работать и планировать в пределах своего окружения [3].
Семантическое знание. Семантические знания могут представлять общие знания, такие как концепции, их отношения и то, как они семантически связаны. Семантические знания предоставляют инструкции и подробную информацию, необходимые для выполнения в интеллектуальной системе. Семантические знания позволяют выводить новую информацию, позволяющую роботу выполнять большой набор задач. Робот должен обладать достаточными знаниями для восприятия детерминированной среды и доступа к методам выполнения действий с использованием этого семантического знания. Планирование задач имеет последовательность упорядоченных действий для достижения цели высокого уровня [4].
Временное знание. Временная логика используется для представления временной информации, которая включает как качественную, так и количественную информацию. Количественная временная информация выражает моменты времени, связанные с такими событиями, как время начала или окончания. Качественная временная информация выражает события с помощью временных отношений, которые определяют последовательный порядок между событиями. Эта временная информационная система помогает в упорядочивании задач, используя время начала события, продолжительность события и совпадение двух событий, что очень важно для роботов, чтобы действовать в окружающей среде.
Чтобы избежать столкновений в домене, необходимы глубокие знания об окружающей среде для обработки задач или методов. Как следствие, временная логика также выражает спецификации знаний предметной области, чтобы можно было выполнять последовательность движений, синхронизацию, охват и временной порядок различных задач. Онтология обеспечивает полную структуру знаний предметной области с использованием этих трех представлений. Эти хорошо представленные знания помогают роботу эффективно выполнять действия [5].
С точки зрения представления знаний (табл. 4) существует семейство инструментов, которое позволяет представлять знания в соответствии с гибридным подходом, основанным на фреймах и логике первого порядка. Кроме того, Protégé предоставляет гибкие компоненты моделирования, такие как метаклассы. OntoStudio поддерживает методологию Onto Knowledge.
Особенность |
Apollo |
OntoStudio |
Protégé |
Swoop |
TopBraid Composer (FE) |
KR Парадигма модели знаний |
Фреймы (OKBC) |
Фреймы и логика первого порядка |
Фреймы, логика первого порядка, SWRL и метаклассы |
OWL |
RDF,OWL и SWRL |
Язык аксиом |
Неограниченный |
Да (F-Logic) |
Да (PAL) |
OWL- DL |
OWL-DL |
Методическая поддержка |
Нет |
Да Onto- Knowledge |
Нет |
Нет |
Нет |
Сервисы вывода представлены в табл. 5. Сюда входят: встроенные и другие механизмы вывода, механизмы проверки ограничений и согласованности, автоматические классификации и обработка исключений. Для встроенного механизма вывода Protégé использует PAL, OntoStudio использует OntoBroker, а TopBraid Composer (FE) использует WOL, SPARQL и Rule. Protégé, Swoop и TopBraid Composer (FE) имеют внешние подключенные механизмы вывода. TopBraid Composer (FE) использует обработку исключений [2].
Особенность |
Apollo |
OntoStudio |
Protégé |
Swoop |
TopBraid Composer (FE) |
Встроенный механизм логического вывода |
Нет |
Да |
Да (PAL) |
Нет |
WOL, SPARQL и Rule |
Другой механизм вывода |
Нет |
Нет |
RACER, FACT, FACT++,F-logic и Pellet |
Pellet и RDF-like |
OWLIM, Pellet и SPARQL Rules |
Проверка ограничений/согласованности |
Да |
Да |
Да |
Только с плагином |
Да |
Автоматические классификации |
Нет |
Нет |
Нет |
Нет |
Нет |
Обработка исключений |
Нет |
Нет |
Нет |
Нет |
Да |
Экспертные системы (ЭС) — первый продукт, появившийся на информационном рынке, как итог 30-летней изыскательской работы в области искусственного интеллекта (ИИ). ЭС представляют собой программы для компьютера, которые могут воспроизводить процесс решения проблемы человеком экспертом.
Состав знаний ЭС определяется следующими факторами:
В соответствии с общей схемой статической экспертной системы для ее функционирования требуются следующие знания:
Общая структура экспертной системы представлена на рис. 2.
Один из самых важных компонентов экспертной системы является база знаний. Именно от полноты и непротиворечивости наличествующих в ней знаний зависит качество экспертной системы.
Онтологии можно использовать в качестве основы для создания базы. Например, задачи, решаемые системами принятия решения, отличаются плохой формализованностью, то очень важно иметь детализированные, непротиворечивые и логичные знания по заданной предметной области. Системы принятие решений часто используют огромные массивы знаний. А так как с помощью онтологии можно явно описать семантику знаний и данных, то она служит базисом для интеграции и совместного применения разных данных при решении разных задач.
Идея реализации экспертной системы с помощью онтологий не нова и была описана в статье “An Ontology-Based Expert System for General Practitioners to Diagnose Cardiovascular Diseases” [7]. В статье описывается идея, рассматривается архитектура и принцип реализации данной системы.
Архитектура предлагаемой системы состоит из нескольких модулей. Рис. 3 иллюстрирует эти модули и взаимодействие между ними.
Как и для любой другой экспертной системы, ядром такой системы является модуль базы знаний, который состоит из базы фактов и базы правил. Факты извлекаются с помощью пользовательского интерфейса из пользователя. База правил состоит из правил принятия решений SWR и структурированных классов онтологии, наряду с отношениями между этими классами. Классы онтологии формировались с использованием Protégé. В редакторе Protégé, как и в других редакторах, отсутствует возможность программного синтеза классов. Данная функция могла бы быть полезна разработчикам интеллектуальным систем [7].
Подводя итог, можно сказать, что инструменты Apollo, Protégé 3.4 и Swoop являются онтологией с открытым исходным кодом, а для инструментов: требуется лицензия на программное обеспечение OntoStudio и TopBraid composer (FE).
Также есть некоторые инструменты, которые требуют изучения онтологии приложения / знания конкретного языка Swoop. Инструменты: Protégé, TopBraid Composer (FE) и OntoStudio используют базы данных для хранения онтологий. То же самое относится к функциям управления резервным копированием, которые только что предоставляются TopBraid Composer (FE). Protégé и OntoStudio - это более графические инструменты онтологии. Swoop - это веб-приложение. OntoStudio поддерживает методологию Onto Knowledge. TopBraid Composer (FE) использует обработку исключений. Некоторые инструменты поддерживают только совместную редакцию функций просмотра. Редакторы Protégé, TopBraid Composer (FE), Swoop и OntoStudio предоставляют онтологию документации, импорт / экспорт онтологий в различные форматы, графическое представление онтологий, библиотеки онтологий и подключенные механизмы вывода, а Apollo поддерживает метаязык Apollo[2].
Современные редакторы онтологий имеют как преимущества, так и недостатки. В данном докладе проведено исследование редактора онтологий на возможность создания экспертной системы. Следующим шагом развития данных программ могла бы стать экспертная система на основе онтологий с возможностью программного синтеза классов.