Вступ


Аналіз стану питання, що досліджується


Визначення експертних систем


Представлення знань у СППР


Поняття про ефективність та розробку експертних систем


Узагальнення результатів наукового пошука та аналізу


Висновок


Українська Українська English

Розробка інтелектуальної експертної системи підтримки приняття рішень за випуском спеціалістів в умовах ДонНТУ

Керiвник: доцент, к.т.н., Г.В. Мокрий

Вступ

     Комп'ютеризація суспільства - один з основних напрямків науково-технічного прогресу - викликала істотні зміни в технології розробки і використання програмних засобів.
    Ці зміни були підготовлені всім розвитком теорії і практики штучного інтелекту (ШІ), найбільш істотним результатом якого з'явився перехід до так називаної нової інформаційної технології і створення експертних систем (ЕС).
    Перші ЕС - медичні mycin і dendral для підтримки прийняття рішень додатків по хімії з'явилися в середині 70-х років у рамках дослідницьких програм по штучному інтелекті. Уже перші ЕС виявилися корисними. Медична система mycin успішно вписалася в клінічну практику, допомагаючи у виборі лік хворим з бактериемией, менінгітом, циститом.
    Суть технологічних змін, полягає в появі нового класу інструментальних засобів ШІ, що став основою створення кінцевих програмних продуктів на основі принципово іншої технології, з новими якісними можливостями створюваних продуктів. Ці зміни істотно підвищують інтелект програм, нові засоби замінили цілу технологічний ланцюжок, у якій між кінцевим користувачем і ЕОМ знаходилося трохи посередників.
    Історично велика частина інвестицій у корпоративні обчислювальні засоби була зв'язана із системами, що чи породжують фіксують дані, наприклад, у бухгалтерському обліку, обробці замовлень, виробництві і системах інформації про клієнтів. Зараз організації вкладають усе більше ресурсів у додатки і технології, що дозволяють витягти з таких зібраних даних додаткову вигоду. Для цього найчастіше прибігають до створення сховищ даних (data warehousing) і оперативній аналітичній обробці (OLAP - Online analytical processing). Ці терміни охоплюють процес збору, очищення і просівання даних з різних робочих систем, а також надання широкої аудиторії бізнесів-користувачів доступу до отриманої інформації для аналізу і підготовки звітів. Постійні сховища очищеної і систематизованої інформації, доступні для перегляду користувачами, називаються сховищами чи даних вітринами даних (data marts).
    OLAP надає організаціям найбільш гнучкі і продуктивні засоби доступу, перегляду й аналізу даних, зв'язаних з бізнесом. Насамперед, OLAP представляє дані користувачам за допомогою природної, інтуїтивної моделі даних. Завдяки легкості переміщення за даними бізнеси-користувачі можуть більш ефективно переглядати й аналізувати інформацію зі своїх сховищ даних, що дозволяє організаціям краще усвідомити цінність цих даних. По-друге, OLAP прискорює доставку інформації користувачам, що переглядають такі багатомірні структури. З цією метою підготовка деяких значень, що обчислюються, у масиві даних здійснюється заздалегідь, а не під час виконання. Сполучення легкості переміщення і високої продуктивності допомагає користувачам переглядати й аналізувати дані набагато швидше й ефективніше, ніж це було б можливо тільки на основі технології реляційних баз даних. У результаті вони присвячують більше часу аналізу даних і менше - аналізу баз даних.
    Таким чином, поява експертних систем і OLAP-додатків у цілому надало зручний і дуже ефективний механізм для прийняття рішень, аналізу і прогнозування.



1. Аналіз стану питання, що досліджується

     Оцінюючи стан розглянутих питань стосовно до Донецького Національного Технічного Університету, в умовах якого ведеться розробка, варто скасувати, що до даного часу на базі різних програмних і апаратних засобів розроблена інформаційна система обробки оперативних даних, підтримуючі усі види основного і допоміжного документообігу, зв'язаного з роботою ВУЗа. Також ця система дозволяє істотно спростити всі процеси, зв'язані з веденням штату співробітників, контингенту студентів, абітурієнтів, матеріальних цінностей. Однак ніякої аналітичної інформації дана система не надає, або ж її одержання зв'язане з великими витратами часу і трудомісткістю реалізації.
    Однак під час створення й удосконалювання даної комп'ютеризованої системи були накопичені досить великі обсяги інформації, що дозволяють одержувати не тільки оперативні дані для роботи над конкретними щоденними нестатками ВУЗа, але і за допомогою допоміжних засобів робити аналіз і прогноз з метою прийняття рішень щодо тих чи інших питань, що стосується підвищення ефективності організації навчального процесу. Теоретично як такі допоміжні засоби звичайно виступають Microsoft Excel, Microsoft Access, Crystal Re-ports. Ці додатки мають досить могутні інструменти, що дозволяють обробляти і представляти в необхідному форматі оперативну інформацію, і крім того, досвідчений фахівець може також проводити аналіз накопичених даних. Однак у досить великій кількості випадків рішення поставлених керівництвом і аналітиками задач за допомогою перерахованих програмних засобів приводить до утруднень, зв'язаним, з одного боку, зі складністю, а іноді і неможливістю добору необхідних даних, і з іншого боку, з необхідністю представлення їх у виді, зручному для аналізу, що не завжди можливо.
    Такі складності, зв'язані з аналітичною обробкою великих обсягів інформації, виникають, насамперед, через неоднорідність наявних даних - унаслідок поетапного розвитку інформаційної системи установи існують підсистеми, дані в який зберігаються в різних форматах, таких як Microsoft SQL Server, Microsoft Access, DBF. Крім цього, дані представлені в одному форматі, наприклад, бази даних SQL Server, розташовані на різних серверах, найчастіше територіально розрізнених. Також для адекватного аналізу найчастіше вимагаються зовнішні дані (тобто не містяться у внутрішніх СУБД ВУЗа, що можуть мати непередбачений формат.)
    Таким чином, ситуація, що склалася з аналітичною обробкою інформації, не відповідає вимогам, висунутими фахівцями-аналітиками і керівниками установи і тепер не може забезпечити рішення поставлених задач по аналізі даних.
    Унаслідок цього, виникає необхідність створення системи аналітичної обробки наявних даних, що в остаточному підсумку повинна привести до розробки Системи Підтримки Прийняття Рішень (СППР), як одного з найбільш могутніх інструментів аналізу інформації. Першим кроком реалізації такої системи повинне з'явитися проектування і створення сховища даних, здатного об'єднати і підготувати до подальшої обробки розрізнено зберігаються дані.



2. Визначення експертних систем

    
    Експертна система (ЕС) - це система штучного інтелекту, що використовує накопичені знання для забезпечення високоефективного рішення задач у вузькій професійній області. Експертні системи відносяться до систем підтримки прийняття рішень (СППР), заснованим на знаннях. Традиційні СППР універсальні і застосовуються для рішення унікальних проблем у різних предметних областях, а ЕС дають відповіді на питання у вузькій предметній області і роблять висновки, що міг би зробити людина-професіонал високої кваліфікації. Інтеграція традиційної СППР із ЕС утворить більш складний вид - так називану експертну систему підтримки прийняття рішень (ЕСППР). Така система, виходячи з загальних вимог, пропонованих до ЕС, повинна пояснювати свої ради кінцевому користувачу, і, крім того, надавати йому універсальні засоби вільного моделювання. Таким чином, саме такий варіант організації системи буде розглядатися в магістерській роботі, тому що він надає найбільше раціональний підхід до одержання результативного аналізу.
    У загальному випадку дані в системі підтримки прийняття рішень - це відособлена база, дані якої отримані або від експерта - людини, або просто як статистична інформація, що збирається за визначеними правилами в плині деякого проміжку часу. Інструментальними засобами побудови ЕС служать мова програмування і підтримуючий пакет програм, використовувані при створенні ЕС.
    ЕС являють собою реальний практичний додаток штучного інтелекту, що підкреслено ще одним визначенням: ЕС - це інформаційну систему, заснована на знаннях визначеної комплексної предметної області, що виконує роль експерта-консультанта для кінцевих користувачів. Ресурсними компонентами ЕС є апаратні, програмні і людські ресурси.
    Апаратні ресурси складаються з автономних мікрокомп'ютерних систем, а також мікрокомп'ютерних робочих станцій і терміналів, приєднаних до мінікомп'ютерам чи великих ЕОМ за допомогою телекомунікаційної мережі. Складні ЕС іноді розробляються на могутніх комп'ютерах спеціального призначення, безпосередньо спроектованих для передових програмних пакетів розробки експертних чи систем мов программування ЛІСП чи ПРОЛОГ.
    Програмні ресурси - це механізм введення-висновку і представлення інформації, а також засобу для роботи зі знаннями і для зв'язку з кінцевими користувачами. Програми одержання знань не є частиною експертної системи, а є програмними засобами тільки для розробки бази знань. База знань у розроблювальній системі заснована на концепції сховища даних. За допомогою цієї концепції можна досить просто агрегировать дані з різних джерел, різного формату, розміру і способу представлення. Зручними засобами розробки ЕС на основі сховища даних є програми-оболонки експертних систем без її ядра (основного змісту), тобто без її баз знань і фактів. Загальновизнано також, що кінцевим користувачам і експертам великі практичні можливості створення ЕС надають кошти СКБД (Microsoft SQL, Oracle і т.д). Особливо корисні при розробці СППР, заснованих на сховищах даних, реляційні СКБД, що підтримують багатомірне представлення даних. Засобу СКБД називають також обмеженими генераторами підтримки прийняття рішень, оскільки вони надають користувачу кілька основних аналітичних інструментів (запити "якщо", кореляційно-регресійний і деякі інші види статистичного аналізу, оптимізацію, побудову й аналіз трендів). Для рішення складних задач аналізу і прогнозу цих засобів недостатньо, у зв'язку з чим виникає задача розробки або добірки необхідних методів.
    Людські ресурси. Коли створюється велика ЕС, те база знань і процес експертизи звичайно проектуються інженером по знаннях з фактів і правил, наданих експертом. ЕС дає рекомендації кінцевому користувачу. Експерти і кінцеві користувачі можуть бути і самі собі інженерами по знаннях, якщо уміють використовувати програмні оболонки ЕС чи інтелектуальні можливості електронних таблиць.
    По сферах використання ЕС їх можна розділити на виробничі й управлінські. Виробничі ЕС дають експертний висновок по керуванню виробничими процесами, управлінські - допомагають менеджерам приймати рішення. У даній роботі буде розглядатися варіант комбінованої системи, тому що керуючому персоналу необхідне як рішення задач по організації навчального процесу, так і можливість одержання аналітичної інформації з визначених питань.



3. Представлення знань у СППР

     У базі знань у деякому закодованому виді зберігаються формалізовані знання. На сучасному етапі розвитку ЕС використовується кілька форм представлення знань. Виділимо з них чотири основні:
    1."Трійка" об'єкт- атрибут- значення, наприклад: будинок- колір- зелений; пацієнт- температура- висока. Ця форма представлення знань визначає "об'єкт", що володіє деякими атрибутами (властивостями), що можуть приймати значення з відомого набору.
    2.Правила продукції у виді: Якщо пацієнт хворий грипом И стадія захворювання початкова, ТО температура висока з імовірністю = 0.95 И головний біль є з імовірністю = 0.8.
    Правило продукції складається з двох частин: посилки (ЯКЩО) і висновку (ТЕ), кожна з який складається з конъюнкції тверджень більш низького рівня деталізації.
    3.Фрейм. Являє собою іменовану таблицю з деякою кількістю слотів- осередків, що мали свої імена й одержують у процесі роботи машини висновку деякі значення. Як значення можуть бути присутнім константи, посилання на фрейми більш високого чи більш низького рівня, а також деякі обчислювальні процедури.
    4.Семантична мережа. Це орієнтований граф, вершини якого відповідають об'єктам (подіям), а дуги описують відносини між вершинами.
    Перша з зазначених форм представлення знань ("трійка") є найбільш ранньою формою, свого роду перехідної, від представлення даних до представлення знань. Найкраща область застосування "трійки"- діагностичні ЕС у предметній області з великою кількістю легко-кластерізуємих об'єктів, у кожнім класі яких мається велика кількість загальних атрибутів. Прикладом такої області може служити діагностика складних технічних систем.
    Представлення знань за допомогою правил продукції - найпоширеніша форма реалізації БЗ. За допомогою продукції можна описати практично будь-яку систему знань. На них засновані всі ранні ЕС, такі, як MYCIN, а також гнітюча більшість сучасних ЕС у різних предметних областях. Відповідно до цієї форми реалізації БЗ зроблена більшість систем - "оболонок" і багато інструментальних середовищ. У цілому продуктійна форма представлення знань є природної і зручний для формалізації знань, отриманих в експерта.
    Фрейм- структури деякою мірою стали розвитком методу електронних таблиць в області обробки знань. Це друга по частоті зустрічальності в конкретних реалізаціях ЕС форма представлення знань. Фрейм -структури найбільше розумно застосовувати в предметній області з чітко вираженою ієрархічною структурою.
    Семантичні мережі споконвічно виникли як модель довгострокової людської пам'яті в психології. Великий інтерес до роботи із семантичними мережами виявляють розроблювачі систем взаємодії на природних мовах.
    На сучасному етапі робіт в області ЕС нерідко використовується змішана форма представлення знань. Такі ЕС називаються гібридними. Має сенс скористатися саме цією концепцією, тому що велика кількість розв'язуваних задач вимагає різного представлення знань.



4. Поняття про ефективність та розробку експертних систем

     ЕС добре вирішують вузькі специфічні проблеми у визначеній сфері знання, але програють у рішенні задач, що вимагають широкого кругозору. ЕС ефективні при рішенні аналітичних задач. Наприклад, ЕС допомагає фінансовому консультанту по інвестиціях, що видає рекомендації для клієнтів. Однак ЕС не може оцінити нюанси поточної політики, економіки, соціального чи розвитку поводження споживача. Ці важливі фактори повинні аналізуватися консультантом-людиною. При чи придбанні розробці ЕС необхідно осмислити і порівняти переваги експертної системи і витрати на неї. Можливі випадки, коли людина-експерт вирішує задачу за кілька хвилин, а створення ЕС вимагає створення декількох сотень правил і кілька місяців проектування.
    Звичайно великі ЕС розробляються інженерами по знаннях методом прототипування тобто поступовим наближенням від начерку до кінцевої мети.
    Інженер по знаннях - це професіонал, що працює з експертами в пошуку знань (фактів і евристик), що вони обробляють. Інженер по знаннях будує базу знань (а при необхідності і всю ЕС) і повинний уміти працювати з експертами в багатьох предметних областях. За рубежем оболонки ЕС відносно недорогі. Вони допомагають кінцевому користувачу розробляти власні експертні системи. Деякі оболонки використовують формат електронної таблиці, полегшуючи розробку правил IF - THEN.



5. Узагальнення результатів наукового пошука та аналізу

     Таким чином, у результаті пошуку й аналізу, проведеного при виконанні курсового проекту, мною були виділені пункти, по яких буде вестися подальша розробка, обрані програмні і технічні засоби для реалізації, а також концептуальне обґрунтування.
    Задача може бути вирішена з використанням різних програмних засобів і платформ. Різні їхні представники відрізняються набором аналітичних засобів, наданих користувачу, інструментарієм, форматом збереження даних, можливостями адміністрування. Не останнім фактором є і вартість ліцензійної версії продукту. Тому в оптимальному співвідношенні ціна-продуктивність слід зазначити платформу Microsoft SQL Server 2000. Його убудовані засоби аналізу й обробки даних (Decision Support Service, Pivot Table, Query Analyzer) являють собою гарну базу для побудови системи. Слід зазначити, що в порівнянні з деякими іншими засобами моделювання OLAP(наприклад, Darvin, Pilot Dis-covery, Idis, ORACLE Express), Microsoft SQL Server 2000 володіє поруч недоліків, таких як недостатня методологія видобутку знань, погана підтримка розрідженої таблиці факту, велика кількість надлишкової інформації. Однак при всім цьому дана платформа проста у використанні, дозволяє добре погоджувати дані з різних зовнішніх джерел, має високу продуктивність і надійністю, а головне, вартість ліцензійної версії її набагато нижче того ж ORACLE Express, що, безсумнівно, важливо в умовах слабкого фінансування програмних відділень ВУЗа.
    У зв'язку з цим пошук буде вестися в напрямку методів аналізу, що чи не надають надають у неповній мері стандартні засоби Microsoft SQL Server 2000. Так само будуть розроблятися методи пошуку знань і виявлення схованих закономірностей, специфічних для досліджуваного питання.



Висновок

     У результаті виконання курсового проекту мною були отримані наступні результати:
- даний обґрунтування необхідності введення СППР у структуру АСУ ВУЗа
- підготовлене концептуальне забезпечення для майбутньої роботи
- обрана й обґрунтована елементарна технічна база для розробки
- обрані й обґрунтовані основні концепції аналізу даних
- розглянута і проаналізована методологія даної проблематики
- визначені подальші напрямки пошуку
- відбита специфіка даної задачі
У цілому виконання курсового проекту заклало фундамент для подальшого продовження дослідження і пошуку, визначило основні пріоритети і задачі майбутньої розробки.




© Авторські права належать ДонНТУ
березень 2004