ДонНТУ   Портал магістрів ФКНТ Кафедра АСУ

Реферат за темою випускної роботи

Зміст

Вступ

Розробка і використання онтологій є однією з нових інформаційних технологій, призначення якої можна визначити як підтримку процесів спільного вирішення завдань, тобто можливість забезпечити однакове розуміння всім користувачам змісту застосовуваних при вирішенні термінів, їх атрибутів і відносин між ними. Термін «онтологія» загалом можна трактувати як різновид мережевої моделі знань про предметну область. На неформальному рівні онтологія - це опис деякої предметної області, що складається з термінів і правил їх використання. У формальній трактуванні онтологія являє собою систему, що складається з понять і набору тверджень про ці поняття, на основі яких можна будувати класи, об'єкти, відносини, функції та теорії.

В області інформаційних технологій термін «онтологія» вживається в контексті з наступними поняттями: концептуалізація; знання; моделі знань; системи, засновані на знаннях. Концептуалізація являє собою процес переходу від подання предметної області на природній мові до точної специфікації цього опису на деякій формальній мові, орієнтованому на комп'ютерне подання. Одним з найбільш поширених є визначення, згідно з яким онтологія є точна (Виражена формальними засобами) специфікація концептуалізації. Виходячи з перерахованих вище визначень, можна виділити наступне: у рамках застосування в галузі інформаційних технологій онтологія - це формально представлені знання про предметної області на базі опису безлічі понять (концептів) предметної області, знань про них і зв'язках (відносинах) між ними.

З безлічі завдань, що вирішуються за допомогою онтологій, таких як побудова і використання баз загальних знань для різних інтелектуальних систем; організація пошуку за змістом в текстовій інформації; створення систем, що реалізують механізми міркувань, та ін, була обрана задача визначення загальної термінологічної бази рекрутингової системи.

1. Актуальність теми

Прогрес в області інформаційних технологій привів до накопичення величезної кількості електронних резюме найрізноманітніших форматів. Завдання пошуку конкретної інформації в цьому обсязі стає рік від року складніше. Одним з можливих рішень це проблеми бачиться прив'язування до документів їх семантичного опису у вигляді онтологій або інших типів опису семантичних відносин об'єктів.

2. Мета і задачі дослідження та заплановані результати

Метою дослідження є розробка онтологічної бази знань для рекрутингової системи, що містить словник термінів предметної області та логічні зв'язки, які описують, як ці терміни співвідносяться між собою.

Основні завдання дослідження:

  1. Визначення термінів предметної області і взаємозв'язків між ними.
  2. Вибір методу створення онтології.
  3. Створення моделі предметної області.
  4. Визначення класів, ієрархії класів і їх властивостей.
  5. Розробка онтологічної бази знань.
  6. Cоздание підсистеми пошуку відповідних кандидатів.

Об'єкт дослідження : Предметна область пов'язана з підбором персоналу.

Предмет дослідження : Методи проектування і створення онтологій.

3. Огляд досліджень та розробок

Оскільки у зв'язку з величезними темпами збільшення інформації в інтернет мережі, досить гострим стає питання про можливі варіанти зберігання отриманої інформації для подальшого її аналізу та отримання знань. Тому ідея онтологічного підходу представлення знань була широко досліджена як американськими, європейськими вченими, так і вітчизняними фахівцями. Вперше термін онтологія в області інформаційних технологій застосував Губер [1].

3.1 Огляд міжнародних джерел

Введене Губером [1] поділ специфікацій знань на дві складові (канонічну форму і онтологію) не дуже зручно, тому що доводиться описувати одні й ті ж знання два рази. Сучасні мови опису онтологій дозволяють поєднати ці форми специфікацій в єдине ціле. Таким чином, зараз під онтологією розуміється будь–яке опис декларативних знань, зроблене на формальній мові і забезпечене деякої класифікацією спеціфіціруемих знань, що дозволяє людині зручно сприймати їх. Канонічна форма не обов'язково використовує мову логіки предикатів, можуть використовуватися й інші формалізми. Наприклад, можна використовувати т.зв. алгебраїчний підхід до опису знань [2], в якому факти представляються у вигляді термів, а різні співвідношення між фактами — у вигляді обмежень, що накладаються на вигляд цих фактів, і виражених у формі аксіом еквівалентності. Але будь–яке таке опис має включати в себе подання декларативних знань у вигляді ієрархії об'єктів (класів), тільки в цьому випадку це опис може вважатися онтологією.

Деякі автори [3, 4] використовують термін «онтологія» тільки для специфікацій знань про світ, тобто таких концептуалізацій, метою яких є опис структури Буття безвідносно якої–небудь інженерної задачі. Такий концептуалізацією вже давно займаються філософи, і у філософії термін «онтологія» застосовується саме в цьому сенсі — як специфікація знань про навколишній світ. Програмісти, однак, стикаються з іншого роду завданнями: вони проводять концептуалізацію з метою побудови моделі розв'язуваної задачі.

3.2 Огляд національних джерел

В Одеському національному політехнічному університеті В.І. Межуєва було запропоновано використовувати онтології як моделі предметних областей [5].

В Україні, зусиллями А. В. Крошіліна і С. В. Крошіліной була видана ціла книга [6], присвячена автоматизованого аналізу діяльності підприємства з використанням семантичних мереж.

4. Обгрунтування вибору онтологічної бази знань

В останні роки розробка онтологій — формальних явних описів термінів предметної області і відносин між ними — переходить зі світу лабораторій з штучного інтелекту на робочі столи експертів по предметних областях. Це можна пояснити наступними причинами використання онтологій:

  1. Можливість повторного використання знань в предметній області.     
  2. Для того щоб зробити допущення в предметній області явними.     
  3. Для відділення знань в предметній області від оперативних знань.     
  4. Для аналізу знань в предметній області

Забезпечення можливості повторного використання знань предметної області стало однією з рушійних сил недавнього сплеску у вивченні онтологій. Наприклад, для моделей багатьох різних предметних областей необхідно сформулювати поняття часу. Це подання включає поняття тимчасових інтервалів, моментів часу, відносних заходів часу і т.д. Якщо одна група вчених детально розробить таку онтологію, то інші можуть просто повторно використовувати її у своїх предметних областях. Крім того, якщо нам потрібно створити велику онтологію, ми можемо інтегрувати кілька існуючих онтологій, що описують частини великий предметної області.

Створення явних припущень в предметній області, що лежать в основі реалізації, дає можливість легко змінити ці припущення при зміні наших знань про предметну область. Жорстке кодування припущень про світ на мові програмування призводить до того, що ці припущення не тільки складно знайти і зрозуміти, а й також важко змінити, особливо непрограмістів. Крім того, явні специфікації знань в предметній області корисні для нових користувачів, які повинні дізнатися значення термінів предметної області [7]. Застосування онтологічної бази знань для створення системи з підбору персоналу дозволяє впоратися з такою складною проблемою, як узгодження концептуальних описів навичок здобувача, які можуть трактуватися двозначно різними фахівцями.

У центрі більшості онтологій знаходяться класи. Класи описують поняття або терміни предметної області. Однак розробка онтологій відрізняється від проектування класів і відносин в об'єктно–орієнтованому програмуванні. Об'єктно–орієнтоване програмування зосереджується головним чином на методах класів – програміст приймає проектні рішення, засновані на операторних властивостях класу, тоді як розробник онтології приймає ці рішення, грунтуючись на структурних властивостях класу. У результаті структура класу і відносини між класами в онтології відрізняються від структури подібної предметної області в об'єктно–орієнтованої програми.

Спільне використання людьми або програмними засобами загального розуміння структури інформації є однією з найбільш загальних цілей розробки онтологій. Тому використання онтології в рекрутингової системі дозволить визначити словник термінів даної предметної області, що включає в себе чіткий опис можливих навичок здобувача, так само онтологія дозволить описати ієрархію навичок та їх взаємозв'язок один з одним. Тут під навичкою здобувача розуміється деякі професійні знання та вміння, необхідні кандидату для роботи на тій або іншій посаді

5. Вибір методу побудови онтології

Для вирішення поставленого завдання пропонується досліджувати застосування таких способів побудови онтологій: ієрархічний, системно–когнітивний. Не існує єдиного «правильного» способу чи методології розробки онтологій, але знання того, для чого ми збираємося використовувати онтологію і наскільки детальної або загальної вона буде, вплине на багато рішень, що стосуються моделювання. Тому варто виділити основні завдання, які повинні вирішуватися за допомогою нашої онтології:

Розглянемо системно–когнітивний підхід, методологія даного моделювання, призначена для аналізу і прийняття рішень у погано певних ситуаціях, була запропонована Р. Аксельродом [8]. Вона заснована на моделюванні суб'єктивних уявлень експертів про ситуацію і включає: методологію структуризації ситуації; модель подання знань експерта; методи аналізу ситуацій. Завданням когнітивного моделювання є виявлення та опис абстрактних або існуючих корелюється явищ, подій, що відбуваються на об'єкті контролю і управління. Когнітивний інструментарій дозволяє знижувати складність дослідження, формалізації, структуризації і моделювання системи.

Модель предметної області в когнітивної моделі представляється у вигляді знакового орієнтованого графа із зворотними зв'язками. У вершинах графа розташовуються різні події або ключові елементи ситуації. Дуги, що з'єднують вершини, відображають причинно–наслідкові зв'язки між ними. Істотно, що параметри подій і ступеня їх взаємного впливу можуть виражатися як точними кількісними параметрами, так і нечіткими якісними співвідношеннями. Вузол такого графа можна інтерпретувати за допомогою діаграми функціонального моделювання IDEF0 (див. рис. 1), яка зазвичай на вході має мету процесу, на виході — результат процесу, який забезпечується на підставі специфікацій та критеріїв із застосуванням алгоритмів і методів. Однак для більш детального, виразного опису процесу необхідно враховувати також семантичні та прагматичні аспекти функціонування складних систем. Тому на семантичному рівні додатково розглядаються на вході — інтерпретація мети процесу, на виході — інтерпретація результату процесу, при управлінні враховуються правила функціонування системи, при використанні інструментів — основні принципи функціонування системи. На прагматичному рівні враховуються стан системи та змінений стан системи, ресурсні обмеження, інтелектуальні ресурси та інструментальні засоби [9].

Вузол знакового орієнтованого графа

Рисунок 1 — Вузол знакового орієнтованого графа

      

Даний підхід відображає взаємозв'язок між ситуаціями і процесами, що відбуваються в предметній області, а так само орієнтований на підтримку прийняття рішення в тій чи іншій ситуації, що не є метою нашої системи, тому нашій системі належить аналізувати об'єкти і класи.

Ієрархічний підхід включає наступні етапи:

Даний метод дозволить побудувати чітку ієрархічну модель навичок шукачів, а так само додасть можливість зазначення його рівня. Така модель істотно спростить реалізацію завдання знаходження оптимального кандидата і дозволить порахувати його ступінь компетентності на висунуту посаду. Тому надалі при створенні онтології буде використовуватися ієрархічний підхід.

6. Приклад створення онтології рекрутингової системи

Як приклад створення онтології використовувалося програмне засіб «Protege», яке дозволяє декларативним чином описати онтологію, визначаючи явним чином яка класова ієрархія і до яких класів належать індивідуальна концепти. Структура частини онтології у вигляді графа зображена на рис. 2.

Прімер побудови онтології рекрутингової сістеми

Рисунок 2 - Приклад побудови онтології рекрутингової системи (анімація: 4 кадри, 5 циклів повторення, 49,4 кілобайт)

Після створення ієрархічної бази знань реалізація пошуку відповідних кандидатів за висунутими від роботодавця вимогам зводиться до пошуку відстані від вакансії до претендентів.

Висновки

Використання онтологічного підходу для побудови загальної концептуальної моделі рекрутингової системи дозволяє формувати спільні понятійні простору, що забезпечують адекватне розуміння інформації, використовуваної в предметній області, і таким чином усунути семантичну невизначеність. Відображення повного обсягу словника побудованої онтології у рефераті є неможливим у зв'язку з великим числом елементів.

Подальша розробка онтології буде спрямована на впровадження дескріпціонних логік, які дозволять здійснювати логічний висновок на підставі наявних даних у базі знань. Так само буде вироблений механізм запитів до бази знань на мові SPARQL дозволяє відбирати найбільш підходящих кандидатів.

Перелік посилань

  1. Gruber T.R. A translation approach to portable ontologies // Knowledge Acquisition, 1993.
  2. Бениаминов Е.М. Алгебраические методы в теории баз данных и представлении знаний. М.: Научный мир, 2003.
  3. Guarino N. Formal ontology in information systems // Proceedings of FOIS’98, Trento, Italy, 6–8 June 1998. Amsterdam, IOS Press, 1998. 3–15.
  4. Когаловский М., Калиниченко Л. Концептуальное моделирование и онтологические модели // Онтологическое моделирование. Труды симпозиума в г. Звенигороде, 19–20 мая, 2008.
  5. Межуев В.И. Использование онтологий как моделей предметных областей / «Искусственный интеллект» 4’2009, 4–11 с.
  6. Крошилина С.В., Крошилин А.В., Каширин А.Ю. Автоматизированный анализ деятельности предприятия с использованием семантических сетей / А.В. Крошилин. — М.: Горячая Линия — Телеком, 2011. — 140с.
  7. Гаврилова Т.А., Хорошевский В.Ф. // Базы знаний интеллектуальных систем. — СПб.: Питер, 2001. — 384 с.
  8. Natalya F. Noy, Deborah L. McGuinness Ontology Development 101: A Guide to Creating Your First Ontology / Stanford University, Stanford, CA, 94305 [Электронный ресурс]. — Режим доступа: http://protege.stanford.edu
  9. Попов Д. В., Поляковский С. Ю., Мухачева Н. Н. Математическое и программное обеспечение конфайнмент–моделирования сложных систем // Принятие решений в условиях неопределенности: Межвуз. науч. сб. Уфа: Уфимск. гос. авиац. техн. ун–т, 2007. С. 19–26.
  10. Нифталиев В.Э., Привалов М.В., Создание онтологической базы знаний рекрутинговой системы (ИУС-2013) / Материалы IV международной научно–технической конференции студентов, аспирантов и молодых ученых. — Донецк, ДонНТУ — 2013, Том 2, с. 57–61.
  11. Н.Н. Мухачева, Д.В. Попов Системно–когнитивный подход к построению онтологических баз знаний информационно–интеллектуальных ресурсов // Вестник РГРГТУ. № 4 (выпуск 30). Рязань, 2009. С. 123–135.