Построение модели онтологии интеллектуальной системы мониторинга учебного процесса дистанционного образования

 

Источник: http://www.nbuv.gov.ua/portal/natural/ii/2009_2/3%5C00_Nekrashevich.pdf

С.П. Некрашевич
Государственный университет информатики и искусственного интеллекта,
г. Донецк, Украина
netrovich@gmail.com

Компьютерная система дистанционного образования (ДО) предназначена для адаптации процесса обучения к индивидуальным характеристикам обучаемых, она освобождает вовлеченных в учебный процесс преподавателей, студентов и адми- нистрацию от ряда трудоемких и рутинных операций по представлению учебной ин- формации и контролю знаний, что способствует разработке объективных методов контроля знаний и облегчению накопления учебно-методического опыта.

Разрабатываемая интеллектуальная система, использующая шифрование управ- ляющей информации маркерами расширенной реальности ARGET [1], предоставляет измеримые метрики процесса дистанционного образования и осуществляет мониторинг учебного процесса, а также его операционный анализ и прогнозирование. Сокращение длины шифрограммы основывается на использовании специального, перестраиваемого системой словаря смыслов управляющей информации. Словарь строится интеллектуаль- ной системой на основании онтологической модели учебного процесса.

Поэтому центральное место в системе занимают онтологии. Они предоставля- ют концептуальную модель задач и предметной области, определяют реализацию бизнес-логики системы. Учебный процесс, его структура и бизнес-процессы описы- ваются в терминах связанных знаний.

Онтология является спецификацией концептуализации предметной области [2]. Это формальное и декларативное представление, которое включает словарь понятий и соответствующих им терминов предметной области, а также логические выраже- ния, которые описывают множество отношений между понятиями. Для описания отношений в онтологиях используются различные формальные модели и языки, су- ществующие в искусственном интеллекте – предикаты, продукции, фреймы, семан- тические сети и др. Термин «онтология» является синонимом представления знаний.

Формально онтология определяется как тройка множеств [3, с. 286-291]:

О = <X, R, F>

X – множество концептов (понятий, терминов) предметной области, которую пред- ставляет онтология O; R – множество отношений между концептами заданной предметной области; F – множество функций интерпретации (аксиоматизация), заданных на концептах и/или отношениях онтологии O.

Предметная область ДО требует использования различных моделей онтологий, представленных в табл. 1.

Словарь предметной области требует наличия только концептов X, в то время как таксономия понятий требует дополнительного указания отношений между этими концептами в виде отношения is-a для моделирования наследования концептов.

Для разделения понятий предметной области на синонимы, антонимы и другие классы дескриптивной логики вводятся отношения нескольких типов, соответствую- щие этим классам разделения (например, синоним, антоним, отлично-от).

Структурная (композиционная) схема, являющаяся подтипом сетевой структуры, использует только один тип отношений part-of (является-частью) или обратное ему contains (содержит). Пример структурной схемы ДО приведен на рис. 1.

Рисунок 1 – Композиционная схема

Таким образом, использование отношений между концептами занимает важное место в модели онтологии. Многообразие различных типов отношений позволяет мо- делировать не только информационную структуру, но и операционную семантику понятий предметной области ДО.

Предметная область учебного процесса ДО содержит достаточно большое ко- личество связанных понятий и их экземпляров. Концептуальное моделирование и проек- тирование модели онтологии интеллектуальной системы этой предметной области требует применения многоуровневой системы онтологий различных типов. Такая сис- тема может быть определена общей онтологией без учета доменов, которые модели- руются отдельно.

Использование множества концептов целесообразно в виде онтологической сис- темы, разделяющей уровни (домены) и выделяющие компоненты сильной связности в виде отдельных онтологий различных типов.

Формальное определение онтологической системы

S = <Ometa, {Odomain}, If>

Ometa – метаонтология <X, R, Ø>
{Odomain} – множество предметных онтологий <X, R, F> и онтологий задач ПО <X, Ø, Ø>
If – машина вывода, ассоциированная с S.

Работа машины вывода характеризуется описанием исходной ситуации, опре- делением целевой ситуации и выводом на сети посредством распространения волн активации от узлов исходной ситуации, использующих свойства отношений, с ними связанные.

Формальную модель результирующей онтологии ИС предметной области ДО можно представить в виде кортежей множеств.
О = <X, R, F>
X = <N, A, E>
R = <N, {X}i, i=1..*>
E = <N, P, X>
A = <N, D, C, X>
P = <N, A, V>
D = <N, метаописание, F>
V = <D, С, значение, F>
N = <название на языке L>
L = <язык>
F = <функции интерпретации>
С = <F>

Наиболее важным элементом модели онтологии является понятие концепта (concept). Каждому концепту из множества X = {xi | i=1..NX} ставится в соответствие тройка из множеств названий, атрибутов и экземпляров концептов. Наличие экземпляров E в этом кортеже позволяет определять концепт как отдельный класс через множество составляющих его экземпляров.

Следующим важным элементом модели, как было показано выше, является от- ношение между концептами (relation). Каждому отношению из множества R = {ri | i=1..NR} ставится в соответствие пара множеств названий и связей между концептами. Данная модель позволяет использовать произвольное число концептов, участвующих в связи, начиная с традиционных и повсеместно используемых бинарных отношений, заканчивая отношениями более высокой кратности. Отдельно следует отметить на- личие отношений кратности 1, при котором концепт находится в отношении к самому себе (внутреннее замыкание), использование такого отношения позволяет моделировать порядок, выстраивающий иерархию экземпляров одного концепта, например, зависи- мости документов, иерархии сотрудников и др. Отношения высокой кратности можно свести (редуцировать) к бинарным и использовать их в модели, однако это увеличи- вает количество отношений и снижает уровень абстракции модели в целом.

На рис. 2 изображены отношения различных типов, включающие наследование и ассоциации. Не показаны отношения высокой кратности между преподавателем, студентом и предметом для описания тернарной ассоциации.

В классической сетевой семантической модели отношения можно рассматривать как подмножество концептов на основании их принадлежности этому множеству в виде самостоятельных понятий предметной области, связывающих концепты [4].

Атрибуты концептов также рассматриваются как значения отношения has (имеет атрибут) между концептом и самим атрибутом, однако в данной модели все атрибуты концептов выделяются в отдельное множество, ответственное за домен атрибутов.

Аналогичным образом экземпляры концепта можно рассматривать как значе- ния отношения instance-of между концептом и самим объектом, однако в данной модели экземпляры выделяются в отдельное множество, ответственное за домен объектов.

Рисунок 2 – Тезаурус документов

Атрибуты (attribute) концептов A = {ai | i=1..NA} описывают структуру и домен свойств каждого концепта и определяются множествами названий, типов данных (da- tatype) и ограничений. Использование X в кортеже атрибута A позволяет задавать домен применения атрибутов среди концептов, например, наличие атрибутов даты или маркера регистрации у некоторых концептов позволяет выделить их в отдель- ный класс понятия (все, что можно регистрировать).

Семантика типа данных (datatype) D = {di | i=1..ND} определяется в метаонтологии и описывается набором применимых операций. Для анализа такой семантики и применения в информационной модели необходимо использовать интерпретирующие правила F. Существует достаточно много подходов к моделированию и семантичес- кому описанию системы типов данных, включая промышленные стандарты описания схем данных, однако их рассмотрение выходит за рамки статьи.

Каждому из экземпляров (entity) концептов E = {ei | i=1..NE} ставится в соответствие кортеж из множеств названий, свойств P экземляров и концептов X. Исполь- зование X в кортеже позволяет моделировать роли, в которых может выступать каждый отдельный экземпляр. Например, конкретный документ, используемый в процессе ДО, может рассматриваться как экземпляр различных классов (текст, гипертекст, множество изображений листов, озвучка текста на естественном языке и др.), что соответствует как множественному наследованию в объектно-ориентированном подходе, так и применению более гибкой системы реализации объектами интерфейсов, которые широко используются в компонентном программировании и технологиях Corba, COM, Java RMI и др.

Каждому из свойств (property) экземпляров P = {pi | i=1..NP} ставится в соответствие кортеж из множеств атрибутов A и данных V, соответствующих значениям этих атрибутов.

Данные из множества V = {vi | i=1..NV} являются терминальными (конечными) элементами модели, их конкретные значения не хранятся непосредственно в системе, а находятся в специализированном хранилище данных для удобства аналитической обработки, источником данных также может служить F.

С точки зрения логики более высокого порядка, данные являются экземплярами типов данных и должны быть представлены подмножеством экземпляров E, в то время как типы – отдельными концептами X. Эта логика сохраняется только для ти- пов данных. На практике часто данные хранятся отдельно от схемы, их описывающей, примером являются схемы баз данных или схемы описания данных, представленных в формате XML.

Ограничение (constraint) C = {ci | i=1..NC} является исключением из общего правила определения типа D и используется в качестве механизма ограничения не только значений, но и ограничения мощности используемых множеств. Задание ог- раничения исключает создание множеств элементов, имеющих незначительные разли- чия. Вместо этого создается общее множество элементов и накладываются ограничения на его отдельные элементы.

Каждый элемент модели при своем создании получает уникальный идентифика- тор id, который связан с элементом все время его существования и не меняется при изменении значения элемента. Идентификатор является частью значения элемента и обеспечивает его идентификацию в интеллектуальной системе. В качестве иденти- фикатора также может использоваться элемент названия N, однако это приводит к избыточности модели и в случае наличия повторений в множестве N могут потребо- ваться дополнительные действия (вывод) для идентификации конкретного элемента по его имени.

Использование нескольких названий на различных языках позволяет моделировать синонимы без введения дополнительных концептов, а также обеспечивает интеропера- бельность в среде с несколькими языками. Например, используемый в интеллектуаль- ной системе документ может быть закодирован с использованием названий на одном языке, а проинтерпретирован на другом языке с сохранением исходной семантики.

Множество языков L = {langi | i=1..NL} представляет основу для понятий линг- вистической онтологии [5], а именно, все названия и лексически зависимые опреде- ления, на которых представлена онтология описания понятий, их экземпляров, атрибутов и отношений как на естественном языке, так и с использованием искусственных но- таций, на которых формально представлены тесты модели. Использование нескольких естественных языков позволяет разделять домены, например, государственного языка и делопроизводства (украинский язык), язык повседневного общения (русский язык), домен международных связей (английский язык).

Для облегчения визуализации проводится моделирование предметной области на языке UML [6], оно заключается в описании концептов и отношений с учетом раз- личных доменов.

Использование нотации UML оправдано ввиду наличия удобных средств моде- лирования, концептуального в том числе, и наличия удобных способов представления статической структуры и динамического поведения объектов.

Однако, учитывая то, что UML ориентирован в первую очередь на разработку программного обеспечения на основе объектно-ориентированного подхода, необходи- ма некоторая адаптация его применения для онтологического моделирования, поэтому вносятся некоторые расширения:

- состояние и поведение объектов на данном этапе концептуального моделирования не указываются, поскольку они больше важны для построения информационной модели и архитектуры реализации и будут доопределяться на более поздних этапах;
– расширены типы отношений между понятиями – добавлены некоторые отношения предметной области;
– использованы несколько отношений между классами;
– использованы внутренние отношения (отношение порядка, выстраивающее иерархию подчинения в коллекции).

Результирующая модель онтологии может быть представлена семантической сетью, которая интерпретирует онтологию с точки зрения элементарных составляю- щих на низком уровне абстракции. После доопределения атрибутов концептов может быть построена и реализована информационная модель, например, в виде реляционной базы данных.

Выводы

Предложенная формальная модель онтологии интеллектуальной системы мони- торинга учебного процесса дистанционного образования является первичным этапом в разработке интеллектуальной системы, требуется дальнейшая разработка вопросов проектирования и наполнения онтологии по предложенной модели, ее описание в формате хранилища данных и представление на формальном языке (например, OWL), а также определение и использование функций интерпретации F и применение их в задачах бизнес-процессов предметной области ДО.

Литература

1. Гудаев О.А. Синтез и анализ предложений графического языка передачи сообщений в мобильных робототехнических системах с элементами расширенной реальности (ARGET) / О.А. Гудаев // Ис- кусственный интеллект. - 2006. - No 2. - С. 467-498.
2. Gruber T.R. A translation approach to portable ontologies / T.R. Gruber // Knowledge Acquisition. – 1993. – V. 5(2). – P. 99-220.
3. Гаврилова Т.А. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский. – СПб. : Питер, 2001.
4. Некрашевич С.П. Представление данных в Интернет на основе семантических сетей / С.П. Некра- шевич, Д.В. Божко // Искусственный интеллект. – 2006. – No 1. – C. 57-59.
5. Добров Б.В. Вторичное использование лингвистических онтологий: изменение в структуре концептуа- лизации / Б.В. Добров, Н.В. Лукашевич // Восьмая Всероссийская научная конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (Владимир-Суздаль, 16-18 октября 2006 г.) – C. 56-64.
6. БучГ.ЯзыкUML.Руководствопользователя/БучГ.,РамбоД.,ДжекобсонА.–М.:Изд-воДМК,2000.