Введение


Анализ состояния исследуемого вопроса


Определение экспертных систем


Представление знаний в СППР


Понятие об эффективности и разработке экспертных систем


Обобщение результатов научного поиска и анализа


Заключение


Українська Русский English

Персональная страница
магистра ДонНТУ Меренкова Л.В.


Разработка интеллектуальной экспертной системы поддержки принятия решений по выпуску специалистов в условиях ДонНТУ


Разработка интеллектуальной экспертной системы поддержки принятия решений по выпуску специалистов в условиях ДонНТУ

Руководитель: доцент, к.т.н., Г.В. Мокрый

Введение

     Компьютеризация общества - одно из основных направлений научно-технического прогресса - вызвала существенные изменения в технологии разработки и использования программных средств.
    Эти изменения были подготовлены всем развитием теории и практики искусственного интеллекта (ИИ), наиболее существенным результатом которого явился переход к так называемой новой информационной технологии и создание экспертных систем (ЭС).
    Первые ЭС - медицинские mycin и dendral для поддержки принятия решений приложений по химии появились в середине 70-х годов в рамках исследовательских программ по искусственному интеллекту. Уже первые ЭС оказались полезными. Медицинская система mycin успешно вписалась в клиническую практику, помогая в выборе лекарств больным с бактериемией, менингитом, циститом.
    Суть происшедших технологических изменений заключается в появлении нового класса инструментальных средств ИИ, который стал основой создания конечных программных продуктов на основе принципиально другой техноло-гии, с новыми качественными возможностями создаваемых продуктов. Эти из-менения существенно повышают интеллект программ, новые средства заменили целую технологическую цепочку, в которой между конечным пользователем и ЭВМ находилось несколько посредников.
    Исторически большая часть инвестиций в корпоративные вычислительные средства была связана с системами, которые порождают или фиксируют данные, например, в бухгалтерском учете, обработке заказов, производстве и системах информации о клиентах. Сейчас организации вкладывают все больше ресурсов в приложения и технологии, которые позволяют извлечь из таких собранных данных дополнительную выгоду. Для этого чаще всего прибегают к созданию хранилищ данных (data warehousing) и оперативной аналитической обработке (OLAP - Online analytical processing). Эти термины охватывают процесс сбора, очистки и просеивания данных из различных рабочих систем, а также предоставление широкой аудитории бизнес-пользователей доступа к полученной информации для анализа и подготовки отчетов. Постоянные хранилища очищенной и систематизированной информации, доступные для просмотра пользователями, называются хранилищами данных или витринами данных (data marts).
    OLAP предоставляет организациям наиболее гибкие и производительные средства доступа, просмотра и анализа данных, связанных с бизнесом. Прежде всего, OLAP представляет данные пользователям с помощью естественной, интуитивной модели данных. Благодаря легкости перемещения по данным бизнес-пользователи могут более эффективно просматривать и анализировать информацию из своих хранилищ данных, что позволяет организациям лучше осознать ценность этих данных. Во-вторых, OLAP ускоряет доставку информации пользователям, просматривающим такие многомерные структуры. С этой целью подготовка некоторых вычисляемых значений в массиве данных осуществляется заранее, а не во время выполнения. Сочетание легкости перемещения и высокой производительности помогает пользователям просматривать и анализировать данные гораздо быстрее и эффективнее, чем это было бы возможно только на основе технологии реляционных баз данных. В результате они посвящают больше времени анализу данных и меньше - анализу баз данных.
    Таким образом, появление экспертных систем и OLAP-приложений в целом предоставило удобный и очень эффективный механизм для принятия решений, анализа и прогнозирования.



1. Анализ состояния исследуемого вопроса

     Оценивая состояние рассматриваемых вопросов применительно к Донецкому Национальному Техническому Университету, в условиях которого ведётся разработка, следует отменить, что к данному времени на базе различных программных и аппаратных средств разработана информационная система обработки оперативных данных, поддерживающая все виды основного и вспомогательного документооборота, связанного с работой ВУЗа. Также эта система позволяет существенно упростить все процессы, связанные с ведением штата сотрудников, контингента студентов, абитуриентов, материальных ценностей. Однако никакой аналитической информации данная система не предоставляет, либо же её получение связано с большими затратами времени и трудоёмкостью реализации.
    Однако во время создания и совершенствования данной компьютеризированной системы были накоплены достаточно большие объемы информации, позволяющие получать не только оперативные данные для работы над конкретными ежедневными нуждами ВУЗа, но и с помощью вспомогательных средств производить анализ и прогноз с целью принятия решений относительно тех или иных вопросов, касающихся повышения эффективности организации учебного процесса. Теоретически в качестве таких вспомогательных средств обычно выступают Microsoft Excel, Microsoft Access, Crystal Re-ports. Эти приложения имеют достаточно мощные инструменты, позволяющие обрабатывать и представлять в необходимом формате оперативную информацию, и кроме того, опытный специалист может также проводить анализ накопленных данных. Однако в достаточно большом количестве случаев решение поставленных руководством и аналитиками задач с помощью перечисленных программных средств приводит к затруднениям, связанным, с одной стороны, со сложностью, а иногда и невозможностью отбора необходимых данных, и с другой стороны, с необходимостью представления иx в виде, удобном для анализа, что не всегда возможно.
    Такие сложности, связанные с аналитической обработкой больших объёмов информации, возникают, прежде всего, из-за неоднородности имеющихся данных - вследствие поэтапного развития информационной системы учреждения существуют подсистемы, данные в которых хранятся в различных форматах, таких как Microsoft SQL Server, Microsoft Access, DBF. Кроме этого, данные представленные в одном формате, например, базы данных SQL Server, расположены на различных серверах, зачастую территориально разрозненных. Также для адекватного анализа зачастую требуются внешние данные (т.е. не содержащиеся во внутренних СУБД ВУЗа, которые могут иметь непредсказуемый формат.)
    Таким образом, ситуация, сложившаяся с аналитической обработкой информации, не отвечает требованиям, выдвигаемыми специалистами-аналитиками и руководителями учреждения и в данное время не может обеспечить решение поставленных задач по анализу данных.
    Вследствие этого, возникает необходимость создания системы аналитической обработки имеющихся данных, которая в конечном итоге должна привести к разработке Системы Поддержки Принятия Решений (СППР), как одного из наиболее мощных инструментов анализа информации. Первым шагом реализации такой системы должно явиться проектирование и создание хранилища данных, способного объединить и подготовить к дальнейшей обработке разрозненно хранящиеся данные.



2. Определение экспертных систем

    
    Экспертная система (ЭС) - это система искусственного интеллекта, использующая накопленные знания для обеспечения высокоэффективного решения задач в узкой профессиональной области. Экспертные системы относятся к системам поддержки принятия решений (СППР), основанным на знаниях. Традиционные СППР универсальны и применяются для решения уникальных проблем в различных предметных областях, а ЭС дают ответы на вопросы в узкой предметной области и строят заключения, которые мог бы сделать человек-профессионал высокой квалификации. Интеграция традиционной СППР с ЭС образует более сложный вид - так называемую экспертную систему поддержки принятия решений (ЭСППР). Такая система, исходя из общих требований, предъявляемых к ЭС, должна пояснять свои советы конечному пользователю, и, кроме того, предоставлять ему универсальные средства свободного моделирования. Таким образом, именно такой вариант организации системы будет рассматриваться в магистерской работе, так как он предоставляет наиболее рациональный подход к получению результативного анализа.
    В общем случае данные в системе поддержки принятия решений - это обособленная база, данные которой получены либо от эксперта - человека, либо просто как статистическая информация, собираемая по определённым правилам в течении некоторого промежутка времени. Инструментальными средствами построения ЭС служат язык программирования и поддерживающий пакет программ, используемые при создании ЭС.
    ЭС представляют собой реальное практическое приложение искусственного интеллекта, что подчеркнуто еще одним определением: ЭС - это информационная система, основанная на знаниях определенной комплексной предметной области, выполняющая роль эксперта-консультанта для конечных пользователей. Ресурсными компонентами ЭС являются аппаратные, программные и людские ресурсы.
    Аппаратные ресурсы состоят из автономных микрокомпьютерных систем, а также микрокомпьютерных рабочих станций и терминалов, подсоединенных к миникомпьютерам или большим ЭВМ при помощи телекоммуникационной сети. Сложные ЭС иногда разрабатываются на мощных компьютерах специального назначения, непосредственно спроектированных для передовых программных пакетов разработки экспертных систем или языков программиро-вания ЛИСП или ПРОЛОГ.
    Программные ресурсы - это механизм ввода-вывода и представления информации, а также средства для работы со знаниями и для связи с конечными пользователями. Программы получения знаний не являются частью экспертной системы, а являются программными средствами только для разработки базы знаний. База знаний в разрабатываемой системе основана на концепции хранилища данных. С помощью этой концепции можно достаточно просто агрегировать данные из разных источников, разного формата, размера и способа представления. Удобными средствами разработки ЭС на основе хранилища данных являются программы-оболочки экспертных систем без ее ядра (основного содержания), т. е. без ее баз знаний и фактов. Общепризнанно также, что конечным пользователям и экспертам большие практические возможности создания ЭС предоставляют средства СУБД (Microsoft SQL, Oracle и т.д). Особенно полезны при разработке СППР, основанных на хранилищах данных, реляционные СУБД, поддерживающие многомерное представление данных. Средства СУБД называют также ограниченными генераторами поддержки принятия решений, поскольку они предоставляют пользователю несколько основных аналитических инструментов (запросы "что-если", корреляционно-регрессионный и некоторые другие виды статистического анализа, оптимизацию, построение и анализ трендов). Для решения сложных задач анализа и прогноза этих средств недостаточно, в связи с чем возникает задача разработки либо подборки необ-ходимых методов.
    Людские ресурсы. Когда создается крупная ЭС, то база знаний и процесс экспертизы обычно проектируются инженером по знаниям из фактов и правил, предоставляемых экспертом. ЭС дает рекомендации конечному пользователю. Эксперты и конечные пользователи могут быть и сами себе инженерами по знаниям, если умеют использовать программные оболочки ЭС или интеллектуальные возможности электронных таблиц.
    По сферам использования ЭС их можно разделить на производственные и управленческие. Производственные ЭС дают экспертное заключение по управлению производственными процессами, управленческие - помогают менеджерам принимать решения. В данной работе будет рассматриваться вариант комбинированной системы, так как управляющему персоналу необходимы как решение задач по организации учебного процесса, так и возможность получения аналитической информации по определённым вопросам.



3. Представление знаний в СППР

     В базе знаний в некотором закодированном виде хранятся формализованные знания. На современном этапе развития ЭС используется несколько форм представления знаний. Выделим из них четыре основные:
    1."Тройка" объект- атрибут- значение, например: дом- цвет- зелёный; пациент- температура- высокая. Эта форма представления знаний определяет "объект", обладающий некоторыми атрибутами (свойствами), которые могут принимать значения из известного набора.
    2.Правила продукций в виде: Если пациент болен гриппом И стадия заболевания начальная, ТО температура высокая с вероятностью = 0.95 И головная боль есть с вероятностью = 0.8.
    Правило продукции состоит из двух частей: посылки (ЕСЛИ) и заключения (ТО), каждая из которых состоит из конъюнкции утверждений более низкого уровня детализации.
    3.Фрейм. Представляет собой именованную таблицу с некоторым количеством слотов- ячеек, имевших свои имена и получающих в процессе работы машины вывода некоторые значения. В качестве значений могут присутствовать константы, ссылки на фреймы более высокого или более низкого уровня, а также некоторые вычислительные процедуры.
    4.Семантическая сеть. Это ориентированный граф, вершины которого соответствуют объектам (событиям), а дуги описывают отношения между вершинами.
    Первая из указанных форм представления знаний ("тройка") является наиболее ранней формой, своего рода переходной, от представления данных к представлению знаний. Наилучшая область применения "тройки"- диагностические ЭС в предметной области с большим количеством легко-кластеризуемых объектов, в каждом классе которых имеется большое количество общих атрибутов. Примером такой области может служить диагностика сложных технических систем.
    Представление знаний с помощью правил продукции - самая распространённая форма реализации БЗ. С помощью продукций можно описать практически любую систему знаний. На них основаны все ранние ЭС, такие, как MYCIN, а также подавляющее большинство современных ЭС в различных предметных областях. В соответствии с этой формой реализации БЗ сделано большинство систем - "оболочек" и многие инструментальные среды. В целом продукционная форма представления знаний является естественной и удобной для формализации знаний, полученных у эксперта.
    Фрейм- структуры в определённой степени стали развитием метода электронных таблиц в области обработки знаний. Это вторая по частоте встречаемости в конкретных реализациях ЭС форма представления знаний. Фрейм -структуры наиболее разумно применять в предметной области с чётко выраженной иерархической структурой.
    Семантические сети изначально возникли как модель долговременной человеческой памяти в психологии. Большой интерес к работе с семантическими сетями проявляют разработчики систем взаимодействия на естественных языках.
    На современном этапе работ в области ЭС нередко используется смешанная форма представления знаний. Такие ЭС называются гибридными. Имеет смысл воспользоваться именно этой концепцией, так как большое количество решаемых задач требует различного представления знаний.



4. Понятие об эффективности и разработке экспертных систем

     ЭС хорошо решают узкие специфические проблемы в определенной сфере знания, но проигрывают в решении задач, требующих широкого кругозора. ЭС эффективны при решении аналитических задач. Например, ЭС помогает финансовому консультанту по инвестициям, выдающему рекомендации для клиентов. Однако ЭС не может оценить нюансы текущей политики, экономики, социального развития или поведения потребителя. Эти важные факторы должны анализироваться консультантом-человеком. При приобретении или разработке ЭС необходимо осмыслить и сравнить преимущества экспертной системы и затраты на нее. Возможны случаи, когда человек-эксперт решает задачу за несколько минут, а создание ЭС требует создания нескольких сотен правил и несколько месяцев проектирования.
    Обычно крупные ЭС разрабатываются инженерами по знаниям методом прототипирования, т. е. постепенным приближением от наброска к конечной цели.
    Инженер по знаниям - это профессионал, работающий с экспертами в поиске знаний (фактов и эвристик), которые они обрабатывают. Инженер по знаниям строит базу знаний (а при необходимости и всю ЭС) и должен уметь работать с экспертами во многих предметных областях. За рубежом оболочки ЭС относительно недороги. Они помогают конечному пользователю разрабатывать собственные экспертные системы. Некоторые оболочки используют формат электронной таблицы, облегчая разработку правил IF - THEN.



5. Обобщение результатов научного поиска и анализа

     Таким образом, в результате поиска и анализа, проведенного при выполнении курсового проекта, мною были выделены пункты, по которым будет вестись дальнейшая разработка, выбраны программные и технические средства для реализации, а также концептуальное обоснование.
    Задача может быть решена с использованием различных программных средств и платформ. Различные их представители отличаются набором аналитических средств, предоставляемых пользователю, инструментарием, форматом хранения данных, возможностями администрирования. Не последним фактором является и стоимость лицензионной версии продукта. Поэтому в оптимальном соотношении цена-производительность следует отметить платформу Microsoft SQL Server 2000. Его встроенные средства анализа и обработки данных (Decision Support Service, Pivot Table, Query Analyzer) представляют собой хорошую базу для построения системы. Следует отметить, что по сравнению с некоторыми другими средствами моделирования OLAP(например, Darvin, Pilot Dis-covery, Idis, ORACLE Express), Microsoft SQL Server 2000 обладает рядом недостатков, таких как недостаточная методология добычи знаний, плохая поддержка разреженной таблицы факта, большое количество избыточной информации. Однако при всём этом данная платформа проста в использовании, позволяет хорошо согласовывать данные из различных внешних источников, обладает высокой производительностью и надёжностью, а главное, стоимость лицензионной версии ее гораздо ниже того же ORACLE Express, что, несомненно, важно в условиях слабого финансирования программных отделений ВУЗа.
    В связи с этим поиск будет вестись в направлении методов анализа, которые не предоставляют или предоставляют в неполной мере стандартные средства Microsoft SQL Server 2000. Так же будут разрабатываться методы поиска знаний и выявления скрытых закономерностей, специфических для исследуемого вопроса.



Заключение

     В результате выполнения курсового проекта мною были получены следующие результаты:
- дано обоснование необходимости введения СППР в структуру АСУ ВУЗа
- подготовлено концептуальное обеспечение для будущей работы
- выбрана и обоснована элементарная техническая база для разработки
- выбраны и обоснованы основные концепции анализа данных
- рассмотрена и проанализирована методология данной проблематики
- определены дальнейшие направления поиска
- отражена специфика данной задачи
В целом выполнение курсового проекта заложило фундамент для дальнейшего продолжения исследования и поиска, определило основные приоритеты и задачи будущей разработки.




© Авторские права принадлежат ДонНТУ
март 2004