ГЛАВНАЯ СТРАНИЦА ДонНТУ
ПОРТАЛ МАГИСТРОВ ДонНТУ

УКРАИНСКИЙ АНГЛИЙСКИЙ

Магистр ДонНТУ Болотова Виктория Александровна

Болотова Виктория Александровна

Факультет компьютерных наук и технологий

Специальность: «Программное обеспечение автоматизированных систем»

Тема выпускной работы:

Инструментальные средства создания баз знаний на основе системы онтологий

Научный руководитель: Григорьев Александр Владимирович


Материалы по теме выпускной работы: Об авторе | Библиотека | Ссылки | Отчет о поиске | | Индивидуальный раздел

ВВЕДЕНИЕ

    В настоящее время актуальной является задача формирования концептуальных «прозрачных» представлений для слабо-структурированных предметных областей. Сегодня ведущей парадигмой структурирования информационных потоков являются онтологии, или иерархические концептуальные структуры, которые формируются аналитиком на основе изучения и структурирования потоков информации, документов, протоколов извлеченных знаний и других источников.

    Онтологический инжиниринг (ОИ) развивает основные положения инженерии знаний – науки о моделях и методах извлечения, структурирования и формализации знаний.

    Собственно инженерия знаний – это ветвь искусственного интеллекта, в то время как ОИ охватывает более широкий круг приложений – от систем управления знаниями до дистанционного обучения.

    Онтологический инжиниринг делает первые шаги, поэтому каждый аналитик идет методом проб и ошибок, создавая сложнейшие онтологические структуры, отражающие лабиринты профессиональных знаний в различных прикладных областях.

    Система BpWin есть средство создания ряда предметно-ориентированных онтологий, отличающихся графическим интерфейсом и типом используемых отношений.

    Обоснование темы магистерской работы – актуальность построения средств создания баз знаний на основе онтологии, которые позволяют работать с многоуровневыми моделями пространства и времени.


Цель работы

    Для систематического изучения свойств онтологий и их применения на практике необходима такая классификация свойств онтологий, которая охватывает свойства самых разных онтологий, не ограничивая исследователей в обнаружении новых свойств.

    Поэтому целью работы является разработка классификации известных из литературы свойств онтологий, удобной для систематического оценивания онтологий на практике. Такая классификация необходима для выбора наиболее полного набора свойств при оценивании произвольной онтологии в зависимости от «типа» онтологии и от преследуемых целей.

    Такая классификация может быть положена в основу единого подхода к оцениванию и определения в однозначных терминах свойств онтологий, а затем и к объективному оцениванию самих онтологий. Полученная классификация должна использоваться как источник требований к использованию онтологического подхода на практике в области САПР.


Актуальность темы работы

    Сегодня искусственный интеллект – это обширная область исследований и разработок интеллектуальных систем, предназначенных для работы в трудно формализуемых областях деятельности человека. В настоящее время принято выделять несколько направлений развития искусственного интеллекта: одно из направлений связано с разработкой интеллектуальных систем, основанных на знаниях. В данном направлении занимаются разработкой моделей представления знаний, созданием баз знаний.

    Одним из перспективных применений методов данного направления является создание интеллектуальных обучающих систем (ИОС). ИОС предназначены для автоматизации и индивидуализации обучения. Традиционно выделяют четыре модели представления знаний, используемых при построении баз знаний систем основанных на знаниях:


        1. Логические модели;

        2. Продукционные модели;

        3. Фреймовые модели;

        4. Семантические сети.

    Однако на данный момент особый интерес у исследователей искусственного интеллекта вызывают онтологии. Онтологии могут использоваться для представления знаний о понятиях предметной области и предположительных отношениях между ними, для описания содержания веб – страниц. Кроме того онтологии можно использовать при построении баз знаний не только ИОС, но также любых других приложений.


Предполагаемая научная новизна

    Работа предполагает прояснение ситуации с определением понятий «онтология» и «свойство онтологии», анализ существующих классификаций свойств и обсуждение возможности их использования для систематического оценивания онтологий и их моделей на практике. Представить классификацию свойств, нацеленную на охват и упорядочение всех известных из литературы свойств, а также на «накопление» ранее не обсуждавшихся, но присущих онтологиям свойств. С учетом наличия в структуре онтологий различных видов связей детализировать классификацию различных структурных свойств.

    Необходимо выполнить:

        - классификацию онтологий, как источник общих требований к эффективному построению онтологий в различных предметных областях;

        - перечислить специфические требования к онтологиям в САПР;

        - предложить общие подходы к построению онтологий в САПР.


Планируемые практические результаты

        1. Разработка проблемно-ориентированного графического редактора по разработке системы онтологии, что отвечает многоуровневой модели пространства и времени.

        2. Разработка системы ввода семантических продукций над множеством онтологии.


ОНТОЛОГИИ КАК СПОСОБ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

    Онтологии – одно из современных направлений в области искусственного интеллекта. В общем виде онтологии определяют как базу знаний специального вида, или как «спецификацию концептуализации» предметной области.

    Это значит, что в предметной области на основе классификации базовых терминов выделяются основные понятия (концепты) и устанавливаются связи между ними. Этот процесс называют концептуализацией.

    Затем онтология может быть представлена в графическом виде или описана на одном из формальных языков (формальная онтология) – это процесс спецификации онтологий.


ПРИМЕР ОНТОЛОГИИ В ГРАФИЧЕСКОМ ВИДЕ


ПРИМЕР ФОРМАЛЬНОГО ОПИСАНИЯ ОНТОЛОГИЙ НА ЯЗЫКЕ OWL


ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ ОНТОЛОГИЙ В ИТ-ИНФРАСТРУКТУРЕ

    Онтологии могут быть использованы:
для описания предметных областей научных исследований,
для описания учебных дисциплин и планов обучения,
для составления библиотечных каталогов.

    Представление библиотечных каталогов как формальных онтологий позволит автоматизировать их обработку и выполнять семантический поиск в онтологическом пространстве, описывающем совокупность библиотек.


КЛАССИФИКАЦИЯ ОНТОЛОГИЙ

    Существуют различные типы классификации онтологий. С моей точки зрения, наиболее полезным будет выделить два типа классификации онтологий:

Семантическая:
1) по уровню выразительности;
2) по степени формальности;
3) по уровню детальности представления.

Прагматическая:
1) по степени зависимости от конкретной задачи или прикладной области;
2) по языку представления онтологических знаний;
3) по предметной области;
4) по цели создания;
5) по наполнению (содержимому).

    Приведем краткую характеристику каждой классификации.

Семантическая классификация

1. По уровню выразительности
Тяжеловесные онтологии. Тяжеловесные онтологии сильно аксиоматизированы, такой уровень аксиоматизации позволяет осуществлять онтологическое связывание явно. Цель аксиоматизации – избежать терминологической и концептуальной неоднозначности из-за неправильной интерпретации.
Легковесные онтологии.Это простые таксономические структуры примитивов или композиции термов с соответствующими определениями.

2. По степени формальности
Данная классификация схожа с классификацией по уровню выразительности языка описания онтологии, однако не эквивалентна ей.
Неформальные. Это онтологии, которые описываются в документе на любом естественном языке (английский, русский, украинский и т.д.). Такие онтологии также могут быть богато наполненными, непротиворечивыми и точными.
Более формализованные. Таксономия может быть двух видов – основанная на термах или на концептах. Такие онтологии, хотя и формализованы, но очень слабо структурированы. - основанные на термах. В этом случае в иерархии тематического раздела более общие термины находятся выше, по мере спуска по иерархии термины становятся все более специфичными; - основанные на концептах. Иерархия состоит из классов и их подклассов, в которых отображаются их отличительные и необходимые свойства.
Сильно формализованные. Онтологии для решения инженерных уравнений. Задают формальную семантику термов (таких, как количество и единица измерения) в разрешенных языком точных и непротиворечивых выражениях.

3. По уровню детальности представления
Некоторые количественно-измеримые метрики могут быть применены к расчету уровня детальности представления.
Низкий. Онтология может быть построена на основе терминов и нескольких типов связей.
Высокий. Онтология может содержать намного больше деталей, включая правила, по которым термины могут быть связаны между собой.

Прагматическая классификация

1. По степени зависимости от конкретной задачи или прикладной области
Верхнего уровня. Такие онтологии описывают наиболее общие концепты (пространство, время, материя, объект, событие, действие и т.д.), которые не зависимы от конкретной проблемы или области.
Ориентированные на предметную область. Во многих дисциплинах сейчас разрабатываются стандартные онтологии, которые могут использоваться экспертами по предметным областям (доменам) для совместного использования и аннотирова¬ния информации в своей области.
Ориентированные на задачу. Это онтология, используемая конкретной прикладной программой и содержащая термины, которые используются при разработке ПО, выполняющего конкретную задачу.
Прикладные онтологии описывают концепты, которые зависят как от онтологии задач, так и от онтологии домена. Примером может служить онтология для автомобилей, строительных материалов, вычислительной техники.

2. По языку представления онтологических знаний
RDF. Основное предназначение языка – описание метаданных документов, размещаемых в Интернете.
DAML+OIL – семантический язык разметки Web-ресурсов, который расширяет стандарты RDF і RDF Schema за счет более полных примитивов моделирования.
OWL (Web Ontology Language) – язык представления онтологий следующего поколения после DAML+OIL. Проект предполагает создание мощного механизма семантического анализа. Онтология OWL – это последовательность аксиом, фактов и ссылок на другие онтологии.
KIF (Knowledge Interchange Format, или формат обмена знаниями) – специальный язык, предназначенный для обмена знаниями между разными компьютерными системами. Разрабатывался для описания общего формата представления знаний, независимого от конкретных систем.
CycL (язык описания онтологии Cyc) – это гибридный язык, в котором объединены свойства фреймов и логики предикатов. CycL различает такие сущности, как экземпляры, классы, предикаты и функции.
OCML (Operational Conceptual Modeling Language) язык поддерживает построение нескольких типов конструкций представления знаний. Он позволяет задавать спецификацию и операционализацию функций, связей, классов, экземпляров и правил. Он также включает механизмы для описания онтологий и методов решения задач – основные технологии, разработанные в области представления знаний. LOOM и Power Loom – языки представления знаний. Цель проекта Loom – разработка и внедрение продвинутых средств для представления знаний и рассуждений в области искусственного интеллекта
Ontolingua предоставляет распределенную среду для совместного просмотра, создания, редактирования, изменения и использования онтологий.
F-Logic – онтологический язык, который создавался для осуществления взаимодействия между онтологиями, построенными на основе предикатов, и онтологиями, построенными на основе F-Logic.

3. По предметной области
Онтология отражает общие знания о предметной области, такие, как иерархия классов понятий и семантические отношения на этих классах. Для каждой предметной области онтологии создаются экспертами своей области, которые проводят формали¬зацию знаний, определений и правил получения новых знаний.

4. По цели создания
Онтологии приложения. Используются во время выполнения конкретного приложения, осуществляющего онтологическое нанесение ограничений на аксиоматиза¬цию для терминологической службы, т.е. используются в работе блока построения рассуждений.
Ссылочные онтологии. Используются во время разработки приложений, для взаимного понимания и толкования между агентами, принадлежащими к разным сообществам, для установления консенсуса между сообществами, которые нуждаются во введении нового термина, или просто для пояснения значения термина новому участнику сообщества.

5. По наполнению (содержимому)
Данная классификация (рис. 1) очень похожа на классификацию по цели создания, однако акцент делается на реальное содержимое онтологии, а не на абстрактную цель.
Дополнительно можно ввести и другие классификации. Сложность создания таких онтологий обычно заключается в том, что возможно наличие различий в понятийных системах разных языков.

Рисунок 1 – Схема классификации онтологий по наполнению

Анимация выполнена с помощью программы mp_gif_animator, имеет объем 52 Кб, состоит из 6 кадров и длится 18 секунд

ЗАКЛЮЧЕНИЕ

        Существуют различные толкования самого понятия онтологии. В данной работе под онтологией понимается структурная спецификация некоторой предметной области, ее концептуальное описание в виде формализованного представления, которое включает словарь терминов предметной области и логические выражения, описывающее взаимосвязи этих понятий.

        На волне интереса к онтологиям были созданы инструментальные средства и механизмы, специально ориентированные на широкое применение онтологий в задачах интеллектуального поиска, классификации, выявление несогласованности в данных, моделирования поведения интеллектуальных агентов. Однако даже наличие хорошего инструментального окружения не снимает проблем, связанных с трудностью проектирования и построения самих онтологий, а автоматизация процесса извлечения онтологий, как и в целом, задача извлечения знаний, и по настоящее время не имеют своего эффективного решения. Тем ценнее становятся уже разработанные онтологии и опыт их использования для решения широкого круга задач.

        В процессе создания современных интеллектуальных информационных систем зачастую требуется интеграция знаний из разнородных источников и, как следствие, эффективное решение задач, связанных с тиражированием знаний. По-прежнему не имеет своего удовлетворительного решения проблема автоматизации процесса выбора адекватного специфике конкретной проблемной области и принятого в ней стиля рассуждения экспертов средства представления знаний. Поэтому и по сей день актуальны исследования, направленные на разработку такого подхода к представлению и тиражированию знаний, который с одной стороны позволял бы наиболее адекватно учитывать специфику проблемной области, а с другой – представлять и использовать знания в некотором унифицированном виде.

        Онтологические модели за время исследований в этой области претерпели значительное развитие. В настоящее время для создания и поддержки онтологий существует целый ряд инструментов, которые помимо общих функций редактирования и просмотра выполняют поддержку документирования онтологий, импорт и экспорт онтологий разных форматов и языков, поддержку графического редактирования, управление библиотеками онтологий и т.д.

        Данные инструментарии построения онтологий обладают рядом существенных недостатков. Большинство инструментов хранит свои онтологии в текстовых файлах, что ограничивает размер онтологий, имеют низкую производительность, нужна дополнительная разработка алгоритмов для удобства работы с хранимыми метаданными, обладают избыточностью функций, что затрудняет работу пользователя.


СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

        1. Core Software Ontology. Core Ontology of Software Components. Core Ontology of Services [Электронный ресурс]. OntoWare Group. – Режим доступа:http://cos.ontoware.org

        2. Gruninger Michael. An Ontology Framework / Michael Gruninger, Leo Obrst // Ontology Summit-NIST, (Gaithersburg, MD April 22–23, 2007). – Gaithersburg, 2007.

        3. Гладун А.Я. Онтологии в корпоративных системах. Часть I / А.Я. Гладун, Ю.В. Рогушина // Корпоративные системы. – 2006. – № 1. – С. 41–47.

        4. Глибовець М.М. Побудова україномовної онтології засобами СУБД / М.М. Глибовець, О.О. Марченко, А.О. Никоненко // Наукові записки. Комп’ютерні науки / Національний університет «Києво-Могилянська академія». – 2008. - Том 86. - С. 46-49.

        5. Ontolingua [Электронный ресурс]. Artificial Intelligence Laboratory of the Department of Computer Science at Stanford University. – Режим доступа: http://www.ksl.stanford.edu/software/ontolingua/

        6. Овдей О.М. Обзор инструментов инженерии онтологий / О.М. Овдей, Г.Ю. Проскудина // Электронные библиотеки. – 2004. – Т. 7, вып. 4. – С. 3–19.

        7. Константинова Н.С. Онтологии как системы хранения знаний [Электронный ресурс] / Н.С. Константинова, О.А. Митрофанова. – Режим доступа: http://www.sci-innov.ru/icatalog_new/index.php?action=send_att&entry_id =68352&fname=68352e2-st08_(Митрофанова О.А.).pdf

        8. Григорьев А.В. Семантика модели предметной области для интеллектуальных САПР. Научные труды Донецкого государственного университета. Серия «Информатика, кибернетика и вычислительная техника», (ИКВТ–2000) выпуск 10. – Донецк, ДонГТУ, 2000. – С. 148–154.

        9. Григорьев А.В. Комплекс моделей САПР как система взаимосвязанных уровней о действительности. Научные труды Донецкого государственного университета. Серия «Информатика, кибернетика и вычислительная техника», (ИКВТ–2000) выпуск 10. – Донецк, ДонГТУ, 2000. – С. 155–167.

        10. Григорьев А.В. Вербальная модель предметной области для интеллектуальных САПР. Науковi працi Донецького Державного технiчного унiверситету. Серiя «Обчислювальна технiка та автоматизацiя». Випуск 20. – Донецьк, ДонДТУ, 2000. – С. 171–180.



© Болотова Виктория, ДонНТУ 2010