ДонНТУ   Портал магистров ФКНТ Кафедра АСУ

Реферат по теме выпускной работы

Содержание

Введение

Разработка и использование онтологий являются одной из новых информационных технологий, назначение которой можно определить как поддержку процессов совместного решения задач, т. е. возможность обеспечить одинаковое понимание всеми пользователями смысла применяемых при решении терминов, их атрибутов и отношений между ними. Термин «онтология» в общем можно трактовать как разновидность сетевой модели знаний о предметной области. На неформальном уровне онтология – это описание некоторой предметной области, состоящее из терминов и правил их использования. В формальной трактовке онтология представляет собой систему, состоящую из понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории.

В области информационных технологий термин «онтология» употребляется в контексте со следующими понятиями: концептуализация; знания; модели знаний; системы, основанные на знаниях. Концептуализация представляет собой процесс перехода от представления предметной области на естественном языке к точной спецификации этого описания на некотором формальном языке, ориентированном на компьютерное представление. Одним из наиболее распространенных является определение, согласно которому онтология есть точная (выраженная формальными средствами) спецификация концептуализации. Исходя из перечисленных выше определений, можно выделить следующее: в рамках применения в области информационных технологий онтология – это формально представленные знания о предметной области на базе описания множества понятий (концептов) предметной области, знаний о них и связях (отношениях) между ними.

Из множества задач, решаемых с помощью онтологий, таких как построение и использование баз общих знаний для различных интеллектуальных систем; организация поиска по смыслу в текстовой информации; создание систем, реализующих механизмы рассуждений, и др., была выбрана задача определения общей терминологической базы рекрутинговой системы.

1. Актуальность темы

Прогресс в области информационных технологий привёл к накоплению огромного количества электронных резюме самых разнообразных форматов. Задача поиска конкретной информации в этом объёме становится год от года сложнее. Одним из возможных решений это проблемы видится привязывание к документам их семантического описания в виде онтологий или других типов описания семантических отношений объектов.

2. Цель и задачи исследования, планируемые результаты

Целью исследования является разработка онтологической базы знаний для рекрутинговой системы, содержащей словарь терминов предметной области и логические связи, которые описывают, как эти термины соотносятся между собой.

Основные задачи исследования:

  1. Определение терминов предметной области и взаимосвязей между ними.
  2. Выбор метода создания онтологии.
  3. Создание модели предметной области.
  4. Определение классов, иерархии классов и их свойств.
  5. Разработка онтологической базы знаний.
  6. Cоздание подсистемы поиска подходящих кандидатов.

Объект исследования: Предметная область связанная с подбором персонала.

Предмет исследования: Методы проектирования и создания онтологий.

3. Обзор исследований и разработок

Поскольку в связи с огромными темпами увеличения информации в интернет сети, довольно острым становится вопрос о возможных вариантах хранения полученной информации для дальнейшего её анализа и получения знаний. Поэтому идея онтологического подхода представления знаний была широко исследована как американскими, европейскими учеными, так и отечественными специалистами. Впервые термин онтология в области информационных технологий применил Губер [1].

3.1 Обзор международных источников

Введенное Губером [1] разделение спецификаций знаний на две составляющие (каноническую форму и онтологию) не очень удобно, т.к. приходится описывать одни и те же знания два раза. Современные языки описания онтологий позволяют совместить эти формы спецификаций в единое целое. Таким образом, сейчас под онтологией понимается любое описание декларативных знаний, сделанное на формальном языке и снабженное некоторой классификацией специфицируемых знаний, позволяющей человеку удобно воспринимать их. Каноническая форма не обязательно использует язык логики предикатов, могут использоваться и другие формализмы. Например, можно использовать т.н. алгебраический подход к описанию знаний [2], в котором факты представляются в виде термов, а различные соотношения между фактами – в виде ограничений, налагаемых на вид этих фактов, и выраженных в форме аксиом эквивалентности. Но любое такое описание должно включать в себя представление декларативных знаний в виде иерархии объектов (классов), только в этом случае это описание может считаться онтологией.

Некоторые авторы [3,4] используют термин «онтология» только для спецификаций знаний о мире, т.е. таких концептуализаций, целью которых является описание структуры Бытия безотносительно какой–либо инженерной задачи. Такой концептуализацией уже давно занимаются философы, и в философии термин «онтология» применяется именно в этом смысле — как спецификация знаний об окружающем мире. Программисты, однако, сталкиваются с иного рода задачами: они проводят концептуализацию с целью построения модели решаемой задачи.

3.2 Обзор национальных источников

В Одесском национальном политехническом университете В.И. Межуевым было предложено использовать онтологии как модели предметных областей [5].

В Украине, усилиями А. В. Крошилина и С. В. Крошилиной была издана целая книга [6], посвященная автоматизированному анализу деятельности предприятия с использованием семантических сетей.

4. Обоснование выбора онтологической базы знаний

В последние годы разработка онтологий — формальных явных описаний терминов предметной области и отношений между ними — переходит из мира лабораторий по искусственному интеллекту на рабочие столы экспертов по предметным областям. Это можно объяснить следующими причинами использования онтологий:

  1. Возможность повторного использования знаний в предметной области.
  2. Для того чтобы сделать допущения в предметной области явными.
  3. Для отделения знаний в предметной области от оперативных знаний.
  4. Для анализа знаний в предметной области

Обеспечение возможности повторного использования знаний предметной области стало одной из движущих сил недавнего всплеска в изучении онтологий. Например, для моделей многих различных предметных областей необходимо сформулировать понятие времени. Это представление включает понятие временных интервалов, моментов времени, относительных мер времени и т.д. Если одна группа ученых детально разработает такую онтологию, то другие могут просто повторно использовать ее в своих предметных областях. Кроме того, если нам нужно создать большую онтологию, мы можем интегрировать несколько существующих онтологий, описывающих части большой предметной области.

Создание явных допущений в предметной области, лежащих в основе реализации, дает возможность легко изменить эти допущения при изменении наших знаний о предметной области. Жесткое кодирование предположений о мире на языке программирования приводит к тому, что эти предположения не только сложно найти и понять, но и также сложно изменить, особенно непрограммисту. Кроме того, явные спецификации знаний в предметной области полезны для новых пользователей, которые должны узнать значения терминов предметной области [7]. Применение онтологической базы знаний для создания системы по подбору персонала позволяет справиться с такой сложной проблемой, как согласование концептуальных описаний навыков соискателя, которые могут трактоваться двусмысленно различными специалистами.

В центре большинства онтологий находятся классы. Классы описывают понятия или термины предметной области. Однако разработка онтологий отличается от проектирования классов и отношений в объектно–ориентированном программировании. Объектно–ориентированное программирование сосредотачивается главным образом на методах классов — программист принимает проектные решения, основанные на операторных свойствах класса, тогда как разработчик онтологии принимает эти решения, основываясь на структурных свойствах класса. В результате структура класса и отношения между классами в онтологии отличаются от структуры подобной предметной области в объектно–ориентированной программе.

Совместное использование людьми или программными средствами общего понимания структуры информации является одной из наиболее общих целей разработки онтологий. Поэтому использование онтологии в рекрутинговой системе позволит определить словарь терминов данной предметной области, включающий в себя четкое описание возможных навыков соискателя, так же онтология позволит описать иерархию навыков и их взаимосвязь друг с другом. Здесь под навыком соискателя понимается некие профессиональные знания и умения, необходимые кандидату для работы на той или иной должности

5. Выбор метода построения онтологии

Для решения поставленной задачи предлагается исследовать применение следующих способов построения онтологий: иерархический, системно–когнитивный. Не существует единственного «правильного» способа или методологии разработки онтологий, но знание того, для чего мы собираемся использовать онтологию и насколько детальной или общей она будет, повлияет на многие решения, касающиеся моделирования. Поэтому стоит выделить основные задачи, которые должны решаться с помощью нашей онтологии:

Рассмотрим системно–когнитивный подход, методология данного моделирования, предназначенная для анализа и принятия решений в плохо определенных ситуациях, была предложена Р. Аксельродом [8]. Она основана на моделировании субъективных представлений экспертов о ситуации и включает: методологию структуризации ситуации; модель представления знаний эксперта; методы анализа ситуаций. Задачей когнитивного моделирования является выявление и описание абстрактных или существующих коррелируемых явлений, событий, происходящих на объекте контроля и управления. Когнитивный инструментарий позволяет снижать сложность исследования, формализации, структурирования и моделирования системы.

Модель предметной области в когнитивной модели представляется в виде знакового ориентированного графа с обратными связями. В вершинах графа располагаются различные события либо ключевые элементы ситуации. Дуги, соединяющие вершины, отображают причинно–следственные связи между ними. Существенно, что параметры событий и степени их взаимного влияния могут выражаться как точными количественными параметрами, так и нечеткими качественными соотношениями. Узел такого графа можно интерпретировать с помощью диаграммы функционального моделирования IDEF0 (см. рис. 1), которая обычно на входе имеет цель процесса, на выходе – результат процесса, который обеспечивается на основании спецификаций и критериев с применением алгоритмов и методов. Однако для более детального, выразительного описания процесса необходимо учитывать также семантические и прагматические аспекты функционирования сложных систем. Поэтому на семантическом уровне дополнительно рассматриваются на входе – интерпретация цели процесса, на выходе – интерпретация результата процесса, при управлении учитываются правила функционирования системы, при использовании инструментов – основные принципы функционирования системы. На прагматическом уровне учитываются состояние системы и измененное состояние системы, ресурсные ограничения, интеллектуальные ресурсы и инструментальные средства [9].

Узел знакового ориентированного графа

Рисунок 1 – Узел знакового ориентированного графа

Данный подход отражает взаимосвязь между ситуациями и процессами, происходящими в предметной области, а так же ориентирован на поддержку принятия решения в той или иной ситуации, что не является целью нашей системы, т.к. нашей системе предстоит анализировать объекты и классы [10].

Иерархический подход включает следующие этапы[11]:

Данный метод позволит построить четкую иерархическую модель навыков соискателей, а так же добавит возможность указания его уровня. Такая модель существенно упростит реализацию задачи нахождения оптимального кандидата и позволит посчитать его степень компетентности на выдвинутую должность. Поэтому в дальнейшем при создании онтологии будет использоваться иерархический подход.

6. Пример создания онтологии рекрутинговой системы

В качестве примера создания онтологии использовалось программное средство «Protege», которое позволяет декларативным образом описать онтологию, определяя явным образом какова классовая иерархия и к каким классам принадлежат индивидные концепты. Структура части онтологии в виде графа изображена на рис. 2.

Пример построения онтологии рекрутинговой системы

Рисунок 2 – Пример построения онтологии рекрутинговой системы (анимация: 4 кадра, 5 циклов повторения, 49,4 килобайта)

После создания иерархической базы знаний реализация поиска подходящих кандидатов по выдвинутым от работодателя требованиям сводится к поиску расстояния от вакансии к соискателям.

Выводы

Использование онтологического подхода для построения общей концептуальной модели рекрутинговой системы позволяет формировать общие понятийные пространства, обеспечивающие адекватное понимание информации, используемой в предметной области, и таким образом устранить семантическую неопределенность. Отражение полного объема словаря построенной онтологии в реферате является невозможным в связи с большим числом элементов.

Дальнейшая разработка онтологии будет направлена на внедрение дескрипционных логик, которые позволят осуществлять логический вывод на основании имеющихся данных в базе знаний. Так же будет выработан механизм запросов к базе знаний на языке SPARQL позволяющий отбирать наиболее подходящих кандидатов.

Список источников

  1. Gruber T.R. A translation approach to portable ontologies // Knowledge Acquisition, 1993.
  2. Бениаминов Е.М. Алгебраические методы в теории баз данных и представлении знаний. М.: Научный мир, 2003.
  3. Guarino N. Formal ontology in information systems // Proceedings of FOIS’98, Trento, Italy, 6–8 June 1998. Amsterdam, IOS Press, 1998. 3–15.
  4. Когаловский М., Калиниченко Л. Концептуальное моделирование и онтологические модели // Онтологическое моделирование. Труды симпозиума в г. Звенигороде, 19–20 мая, 2008.
  5. Межуев В.И. Использование онтологий как моделей предметных областей / «Искусственный интеллект» 4’2009, 4–11 с.
  6. Крошилина С.В., Крошилин А.В., Каширин А.Ю. Автоматизированный анализ деятельности предприятия с использованием семантических сетей / А.В. Крошилин. — М.: Горячая Линия — Телеком, 2011. — 140с.
  7. Гаврилова Т.А., Хорошевский В.Ф. // Базы знаний интеллектуальных систем. — СПб.: Питер, 2001. — 384 с.
  8. Natalya F. Noy, Deborah L. McGuinness Ontology Development 101: A Guide to Creating Your First Ontology / Stanford University, Stanford, CA, 94305 [Электронный ресурс]. — Режим доступа: http://protege.stanford.edu
  9. Попов Д. В., Поляковский С. Ю., Мухачева Н. Н. Математическое и программное обеспечение конфайнмент–моделирования сложных систем // Принятие решений в условиях неопределенности: Межвуз. науч. сб. Уфа: Уфимск. гос. авиац. техн. ун–т, 2007. С. 19–26.
  10. Нифталиев В.Э., Привалов М.В., Создание онтологической базы знаний рекрутинговой системы (ИУС-2013) / Материалы IV международной научно–технической конференции студентов, аспирантов и молодых ученых. — Донецк, ДонНТУ — 2013, Том 2, с. 57–61.
  11. Н.Н. Мухачева, Д.В. Попов Системно–когнитивный подход к построению онтологических баз знаний информационно–интеллектуальных ресурсов // Вестник РГРГТУ. № 4 (выпуск 30). Рязань, 2009. С. 123–135.