Назад в библиотеку

Создание онтологической базы знаний рекрутинговой системы

Авторы: Нифталиев В.Э., Привалов М.В.
Источник: Информационные управляющие системы и компьютерный мониторинг (ИУС–2012) / Материалы международной научно–технической конференции студентов и молодых учёных. — Донецк, ДонНТУ — 2013, с. 73–76.

Аннотация

Нифталиев В.Э., Привалов М.В. Создание онтологической базы знаний рекрутинговой системы. Приведено обоснование выбора онтологического подхода для описания модели предметной области рекрутинга. Рассмотрены методы построения онтологий. Выбран оптимальный способ, позволяющий наилучшим образом произвести формулирование, структурирование и представление данных и знаний.

Общая постановка проблемы

При составлении резюме, соискатели в большинстве случаев используют либо слишком детализированный способ описаний своих навыков и их уровня, либо наоборот поверхностный, что усложняет поиск оптимальных кандидатов для работодателя. Так же отсутствие единой стандартной формы резюме усложняет процесс первичного анализа резюме.

Обоснование выбора онтологической базы знаний

В последние годы разработка онтологий - формальных явных описаний терминов предметной области и отношений между ними – переходит из мира лабораторий по искусственному интеллекту на рабочие столы экспертов по предметным областям. Это можно объяснить следующими причинами использования онтологий:

  1. возможность повторного использования знаний в предметной области;
  2. для того чтобы сделать допущения в предметной области явными;
  3. для отделения знаний в предметной области от оперативных знаний;
  4. для анализа знаний в предметной области.

Обеспечение возможности повторного использования знаний предметной области стало одной из движущих сил недавнего всплеска в изучении онтологий. Например, для моделей многих различных предметных областей необходимо сформулировать понятие времени. Это представление включает понятие временных интервалов, моментов времени, относительных мер времени и т.д. Если одна группа ученых детально разработает такую онтологию, то другие могут просто повторно использовать ее в своих предметных областях. Кроме того, если нам нужно создать большую онтологию, мы можем интегрировать несколько существующих онтологий, описывающих части большой предметной области.

Создание явных допущений в предметной области, лежащих в основе реализации, дает возможность легко изменить эти допущения при изменении наших знаний о предметной области. Жесткое кодирование предположений о мире на языке программирования приводит к тому, что эти предположения не только сложно найти и понять, но и также сложно изменить, особенно непрограммисту. Кроме того, явные спецификации знаний в предметной области полезны для новых пользователей, которые должны узнать значения терминов предметной области [4].

Применение онтологической базы знаний для создания системы по подбору персонала позволяет справиться с такой сложной проблемой, как согласование концептуальных описаний навыков соискателя, которые могут трактоваться двусмысленно различными специалистами.

В центре большинства онтологий находятся классы. Классы описывают понятия или термины предметной области. Однако разработка онтологий отличается от проектирования классов и отношений в объектно-ориентированном программировании. Объектно-ориентированное программирование сосредотачивается главным образом на методах классов – программист принимает проектные решения, основанные на операторных свойствах класса, тогда как разработчик онтологии принимает эти решения, основываясь на структурных свойствах класса. В результате структура класса и отношения между классами в онтологии отличаются от структуры подобной предметной области в объектно-ориентированной программе.

Совместное использование людьми или программными средствами общего понимания структуры информации является одной из наиболее общих целей разработки онтологий. Поэтому использование онтологии в рекрутинговой системе позволит определить словарь терминов данной предметной области, включающий в себя четкое описание возможных навыков соискателя, так же онтология позволит описать иерархию навыков и их взаимосвязь друг с другом. Здесь под навыком соискателя понимается некие профессиональные знания и умения, необходимые кандидату для работы на той или иной должности.

Выбор метода построения онтологии

Для решения поставленной задачи предлагается исследовать применение следующих способов построения онтологий: иерархический, системно-когнитивный. Не существует единственного «правильного» способа или методологии разработки онтологий, но знание того, для чего мы собираемся использовать онтологию и насколько детальной или общей она будет, повлияет на многие решения, касающиеся моделирования. Поэтому стоит выделить основные задачи, которые должны решаться с помощью нашей онтологии:

  1. Создание единого словаря терминологии организации.
  2. Построение иерархии понятий (таксономии), характеризующих деятельность системы.
  3. Оптимизация поиска и навигации, нахождение расстояния от созданной работодателем вакансии до резюме соискателя, путем соотношения навыков.
  4. Решение проблемы интеграции разнородных баз и хранилищ данных.

Рассмотрим системно-когнитивный подход, методология данного моделирования, предназначенная для анализа и принятия решений в плохо определенных ситуациях, была предложена Р. Аксельродом [2]. Она основана на моделировании субъективных представлений экспертов о ситуации и включает: методологию структуризации ситуации; модель представления знаний эксперта; методы анализа ситуаций. Задачей когнитивного моделирования является выявление и описание абстрактных или существующих коррелируемых явлений, событий, происходящих на объекте контроля и управления. Когнитивный инструментарий позволяет снижать сложность исследования, формализации, структурирования и моделирования системы.

Модель предметной области в когнитивной модели представляется в виде знакового ориентированного графа с обратными связями. В вершинах графа располагаются различные события либо ключевые элементы ситуации. Дуги, соединяющие вершины, отображают причинно-следственные связи между ними. Существенно, что параметры событий и степени их взаимного влияния могут выражаться как точными количественными параметрами, так и нечеткими качественными соотношениями. Узел такого графа можно интерпретировать с помощью диаграммы функционального моделирования IDEF0 (см. рис. 1), которая обычно на входе имеет цель процесса, на выходе – результат процесса, который обеспечивается на основании спецификаций и критериев с применением алгоритмов и методов. Однако для более детального, выразительного описания процесса необходимо учитывать также семантические и прагматические аспекты функционирования сложных систем. Поэтому на семантическом уровне дополнительно рассматриваются на входе – интерпретация цели процесса, на выходе – интерпретация результата процесса, при управлении учитываются правила функционирования системы, при использовании инструментов – основные принципы функционирования системы. На прагматическом уровне учитываются состояние системы и измененное состояние системы, ресурсные ограничения, интеллектуальные ресурсы и инструментальные средства [5].

Узел знакового ориентированного графа

Рисунок 1 – Узел знакового ориентированного графа

Данный подход отражает взаимосвязь между ситуациями и процессами, происходящими в предметной области, а так же ориентирован на поддержку принятия решения в той или иной ситуации, что не является целью нашей системы, т.к. нашей системе предстоит анализировать объекты и классы.

Иерархический подход включает следующие этапы:

  1. определение классов в онтологии;
  2. расположение классов в таксономическую иерархию (подкласс - надкласс);
  3. определение свойств классов и описание допускаемых значений свойств;
  4. заполнение значений слотов экземпляров.

Данный метод позволит построить четкую иерархическую модель навыков соискателей, а так же добавит возможность указания его уровня. Такая модель существенно упростит реализацию задачи нахождения оптимального кандидата и позволит посчитать его степень компетентности на выдвинутую должность. Поэтому в дальнейшем при создании онтологии будет использоваться иерархический подход.

Пример разработанной онтологии

В качестве примера создания онтологии использовалось программное средство «Protege», которое позволяет декларативным образом описать онтологию, определяя явным образом какова классовая иерархия и к каким классам принадлежат индивидные концепты. Структура части онтологии в виде графа изображена на рис. 2.

Пример построения онтологии рекрутинговой системы

Рисунок 2 – Пример построения онтологии рекрутинговой системы (анимация: 4 кадра, 5 циклов повторения, 49,4 килобайта)

После создания иерархической базы знаний реализация поиска подходящих кандидатов по выдвинутым от работодателя требованиям сводится к поиску расстояния от вакансии к соискателям.

Заключение

Использование онтологического подхода для построения общей концептуальной модели рекрутинговой системы позволяет формировать общие понятийные пространства, обеспечивающие адекватное понимание информации, используемой в предметной области, и таким образом устранить семантическую неопределенность. Отражение полного объема словаря построенной онтологии в статье является невозможным в связи с большим числом элементов.

Дальнейшая разработка онтологии будет направлена на внедрение дескрипционных логик, которые позволят осуществлять логический вывод на основании имеющихся данных в базе знаний. Так же будет выработан механизм запросов к базе знаний на языке SPARQL позволяющий отбирать наиболее подходящих кандидатов.

Список использованной литературы

1. Gruber T.R. A translation approach to portable ontologies. Knowledge Acquisition, 1993.
2. Наталья Ф. Ной (Natalya F. Noy) и Дэбора Л. МакГиннесс (Deborah L. McGuinness) Стэнфордский Университет, Стэнфорд, Калифорния, Разработка онтологий 101: руководство по созданию Вашей первой онтологии.
3. Н.Н. Мухачева, Д.В. Попов Системно-когнитивный подход к построению онтологических баз знаний информационно-интеллектуальных ресурсов // Вестник РГРГТУ. № 4 (выпуск 30). Рязань, 2009. С. 123-135.
4. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. – СПб.: Питер, 2001. – 384 с.
5. Попов Д. В., Поляковский С. Ю., Мухачева Н. Н. Математическое и программное обеспечение конфайнмент-моделирования сложных систем // Принятие решений в условиях неопределенности: Межвуз. науч. сб. Уфа: Уфимск. гос. авиац. техн. ун-т, 2007. С. 19–26.
6. Лапшин В.А. Онтологии в компьютерных системах [Электронный ресурс]. — Режим доступа: www.rsdn.ru