Прищепа Владимир Владимирович

Факультет компьютерных наук и технологий

Кафедра компьютерной инженерии

Специальность «Компьютерные системы и сети»

Исследование и разработка оптимальных запросов при выборке многосвязных данных больших объемов в реляционных базах данных. Разработка АРМ «Нагрузка преподавателя» в рамках АСУ ДонНТУ

Научный руководитель к.т.н., доц. Краснокутский Владимир Алексеевич

Реферат по теме магистерской работы

Содержание

Цели и задачи
Актуальность и мотивация
Научная новизна
Планируемые практические результаты
Обзор исследований и разработок по теме
Заключение
Список использованной литературы

Цели и задачи

Цель магистерской работы состоит в разработке части программного комплекса по автоматизации формирования нагрузки ВУЗа, а именно – автоматизация формирования нагрузки преподавателей.

Формирование нагрузки выполняется последовательно и состоит из следующих этапов:

формирование нагрузки кафедр;
формирование нагрузки преподавателей;
формирование расписания занятий.

Работа ведется командой из трех разработчиков. Командной задачей является проектирование комплекса и согласование структур данных для обмена информацией между его модулями.

Задача магистра состоит в проектировании и разработке отдельного модуля с предоставлением различных наборов прав и интерфейсов для пользователей разных групп: администраторов, преподавателей, сотрудников учебно-методического отдела, ответственных лиц на кафедре.

Актуальность и мотивация

Формирование нагрузки является трудоемкой задачей, требующей больших временных затрат. Весь процесс, от начала – составление учебных планов, до конца – утверждение нагрузки, занимает несколько месяцев. Все данные для документов, отчетов и сводок формируются вручную, что влечет большое количество ошибок, связанных с человеческим фактором, их поиск и исправление занимает существенную часть общего времени.

Недостатками схемы ручного распределения учебной нагрузки на кафедрах являются:

низкая гибкость метода;
высокая сложность и трудоёмкость процесса распределения;
высокая вероятность ошибки при расчётах;
сложность проверки результатов расчёта;
отсутствие средств защиты информации;
отсутствие механизмов организации совместного доступа к результатам [10].

Научная новизна

В начале разработки предполагалось, что модуль формирования нагрузки преподавателей станет программным интерфейсом, который будет помогать человеку распределять дисциплины между преподавателями кафедры. При поиске информации по теме работы было выявлено, что технологии искусственного интеллекта не применялись ранее для подобной задачи. Было предложено разработать и использовать интеллектуальную систему поддержки принятия решений (СППР). Идея в том, что система должна давать рекомендации при распределении нагрузки между преподавателями кафедры, анализируя их непосредственные заявки до начала распределения и такие факторы как ученая степень, звание, опыт работы, возраст и другие.

Для анализа и принятия решений в СППР используются разные методы:

информационный поиск (information retrieval) – это процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности. Как видно из определения, этот метод используется для СПР, которые работают с уже имеющимся объемом данных. Это означает, что данный метод не подходит для описанной задачи;
интеллектуальный анализ данных (data mining) – это собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретаций знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Этот метод также основан на обработке заранее имеющегося объема информации;
рассуждение на основе прецедентов – метод из области экспертных систем, основанный на анализе ранее известных прецедентов и формирования решения на основе их анализа;
генетический алгоритм – это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, аналогичных естественному отбору в природе;
искусственная нейронная сеть – это математическая модель, а также ее программная или аппаратная реализация, построенная по принципу организации и функционирования биологических нейронных сетей. Нейронные сети не программируются, они обучаются.

В случае, если будет иметь место некорректный результат, то человек, ответственный за процесс распределения, сможет корректировать результаты работы системы. Отсюда вытекает, что необходима возможность обучения системы, чтобы исключить повторение ошибок при следующем ее использовании.

Из описанных выше методов, свойством самообучения обладает лишь искусственная нейронная сеть. Возможность обучения – одно из главных преимуществ нейронных сетей перед традиционными алгоритмами [9]. Оно заключается в нахождении коэффициентов связей между нейронами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными данными и выходными, а также выполнять обобщение. Это значит, что в случае успешного обучения сеть сможет вернуть верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и/или «зашумленных», частично искаженных данных [9].

Взяв во внимание все вышеперечисленное, можно сделать вывод, что наиболее подходящей реализацией системы для решения поставленной задачи, будет система, основанная на искусственной нейронной сети.

С помощью ИНС решаются широкий круг задач:

распознавание образов и классификация;
кластеризация;
прогнозирование;
аппроксимация;
анализ данных;
принятие решений и управление.

Во всех, описанных выше, классах задач на практике успешно применяются персептроны (рис. 1) – это одна из первых моделей нейронной сети, предложенная Френком Розенблаттом в 1957 году [4]. Персептрон обладает высокой степенью универсальности, успешно обучается и может решать широкий круг сложных задач.

Описанная задача, относится к классу задач принятия решений. При ее решении нет необходимости использовать сложные модели нейронных сетей, таких как сеть Элмана, которая используется для решения задач в реальном времени, к примеру, управление движущимся объектом.

Рисунок 1 – Двухслойный персептрон с n входами, скрытым слоем из a нейронов и r выходами

На рисунке 1 изображена классическая структура персептрона. Набор входных данных – вектор X, результат – вектор Y, S-layer (от англ. sensor) – входы сети, их количество зависит от решаемой задачи, A-layer (от англ. association) – ассоциативный или скрытый слой, выбор необходимого количества нейронов этого слоя является основной задачей проектирования нейронной сети, R-layer (от англ. reaction) – выходной слой, или слой реагирования, количество выходов сети зависит от конкретной задачи. Каждый чувствительный элемент S-слоя связан с каждым элементом A-слоя синапсами (межнейронными связями), w_an – отдельно взятый синапс из множества между слоями S и A, аналогичным образом происходит коммуникация нейронов между слоями A и R.

Персептрон может быть и однослойным (если убрать слой A и сенсоры подключить к выходному слою), скрытых же слоев может быть несколько, на практике применяются сети с одним, или двумя скрытыми слоями.

Персептрон был открыт в однослойном виде, такая структура позволяла очень просто его обучать с помощью правил Хебба и дельта-правила формулы (1) и (2), но с его помощью решался узкий круг задач [4].

Formula 1 (1)

Formula 2 (2)

Формула (1) описывает изменение весовых коэффициентов при обучении сети с использованием правил Хебба, в ней используются следующие обозначения:

Δw_ij – изменение весового коэффициента соответствующего синапса;
δ_i – ошибка i-го выхода сети;
η – коэффициент скорости обучения;
r – количество выходов сети;
n – количество входов сети.

Формула (2) описывает вычисление ошибки выхода сети (дельта-правило), в ней используются следующие обозначения:

δ_i – ошибка i-го выхода сети;
e_i – ожидаемое значение выхода сети (expected);
y_i – фактическое значение выхода;
r – количество выходов сети.

Построение многослойных сетей резко расширяло круг решаемых задач, но вставала проблема их обучения. Обучение однослойного персептрона проходило путем подачи входных воздействий и вычисления погрешности на выходе (дельта-правило), после чего происходила корректировка весовых коэффициентов по правилам Хебба. Этот простой и элегантный метод невозможно применить к скрытым слоям сети, так как невозможно вычислить ошибку, не зная какие значения выходных сигналов скрытого слоя являются правильными [2].

Эффективным способом обучения многослойных персептронов является алгоритм обратного распространения ошибки [1]. На каждой итерации алгоритма обратного распространения весовые коэффициенты нейронной сети модифицируются так, чтобы улучшить решение одного примера. Таким образом, в процессе обучения циклически решаются однокритериальные задачи оптимизации [7]. Идея состоит в том, чтобы ошибка от выходов сети распространялась в обратном направлении ко входам и учитывалась при изменении весовых коэффициентов [8]. Математически это описано в формуле (3), погрешность скрытых слоев выражается через произведение суммы ошибок выходного слоя и весовых коэффициентов соответствующих синапсов [2].

Formula 3 (3)

Используя формулы (1) и (2), подставив (3) в (2), имеем для скрытого слоя [2]:

Formula 4 (4)

Formula 5 (5)

Обозначения в формулах (3), (4), (5) имеют тот же смысл, что и в формулах (1), (2).

То есть, метод обучения многослойных сетей по алгоритму обратного распространения ошибки является модификацией метода обучения однослойного персептрона, учитывающей особенности архитектуры многослойной сети.

Рисунок 2 – Обучение персептрона методом обратного распространения ошибки

Рисунок 2 – Обучение персептрона методом обратного распространения ошибки
(анимация: 7 кадров, 10 циклов повторения, размер 509x540, 138 КБ)

ИНС классифицируются по следующим параметрам:

тип входной информации:
- аналоговая (вход ИНС принимает информацию в форме чисел);
- двоичная (вход ИНС принимает информацию в двоичном виде);
способ обучения:
- обучение с учителем (Производится на основе набора исходных данных и корректных результатов для них. Правильно спроектированная и обученная сеть обладает свойством обобщения, что означает корректную реакцию на наборы входных данных, которых не было в обучающей выборке.);
- обучение без учителя (Пригодно для задач, в которых известны множества объектов, и требуется обнаружить внутренние взаимосвязи, зависимости, закономерности, существующие между ними, то есть при отсутствии правильных ответов.);
- обучение с подкреплением (Частный случай обучения с учителем, но учителем выступает некая среда, или ее модель, она реагирует на принятые решения, формируя сигналы подкрепления.);
по характеру настройки синапсов:
- с фиксированными связями (весовые коэффициенты константны);
- с динамическими связями (в процессе обучения происходит настройка весовых коэффициентов связей между нейронами) [9].

В рамках решаемой задачи информация о преподавателе и дисциплине может быть представлена в разных видах (как в булевом, так и в числовом). По типу входной информации проектируемая ИНС аналого-цифровая [3]. Обучение сети базируется на основании выборки за последние годы, это способ обучения с учителем. Так как взаимосвязь между наборами входных данных и выходных не известна, то перед обучением весовые коэффициенты необходимо задать случайными малыми значениями. Результатом обучения должна стать сеть со значениями весовых коэффициентов, которые обеспечат корректный выходной вектор при определенном входном. Данную сеть можно классифицировать как сеть с динамическими связями.

Планируемые практические результаты

Результатом работы станет система поддержки принятия решений, основанная на обученной искусственной нейронной сети. После окончания процесса обучения для каждого синапса сети установится некоторый весовой коэффициент. Величину весового коэффициента можно расценивать как уровень влияния того или иного входного параметра на результат работы отдельных нейронов и сети в целом. Благодаря свойству обобщения присущему искусственным нейронным сетям после успешного обучения, возможно проведение эксперимента для выявления значимости отдельных параметров на результат. В рабочем режиме на вход подается обучающий вектор с одним измененным параметром, величина погрешности будет отображать влияние соответствующего параметра на результат [5]. Эти данные позволят нам выделить из множества используемых параметров наиболее важные для распределяемой дисциплины и наиболее важные характеристики преподавателей при формировании нагрузки.

Обзор исследований и разработок по теме

В интернет встречается информация о программных продуктах, которые по своей сути являются аналогами отдельных модулей, функционирующих в составе АСУ ДонНТУ. Это проекты разных разработчиков и исследователей, которые создавались для решения своих определенных задач и научных исследований в области построения учебного процесса, формирования нагрузки в учебных заведениях и т.д. Чаще всего встречаются программы-аналоги контингента студентов, формирования расписания, приемной комиссии, учебных планов. Все они выполнены разными авторами и используют разный подход в хранении, передаче и обработке данных, что не позволяет использовать их вместе. Все эти продукты были созданы в учебных целях.

В 2006 году было проведено исследование по теме формирования нагрузки преподавателей кафедры [6]. В работе рассмотрены модели и алгоритмы поддержки принятия решений при распределении учебной нагрузки. Предложены функциональная и математическая модели. Рассмотрена укрупненная схема решения задачи принятия решений при распределении нагрузки. Дальнейший поиск работ данных авторов не дал результатов по данной теме, их исследования в области формирования учебного процесса были завершены этой работой.

Внимания заслуживает программный комплекс для учебных заведений от лаборатории математического моделирования и информационных систем (ММиИС). Разработчиками комплекса преследовалась цель создать универсальный продукт для широкого спектра учебных заведений, которую они достигли по их заверениям.

Состав и название модулей комплекса, указанные на сайте разработчика, позволяют судить о том, что их полный набор обеспечивает автоматизацию всех процессов функционирования современного учебного заведения. Это прием абитуриентов на конкурсной основе с помощью модуля приемной комиссии, формирование учебных планов, графиков, нагрузки, расписания, учет успеваемости, выдача дипломов.

Главным недостатком является очень большая стоимость данного продукта (суммарная стоимость всех модулей составляет примерно 300 тысяч рублей), закрытый исходный код и, соответственно, невозможность оперативного внесения правок в соответствии с изменившимися требованиями. Изменения выполняются через техническую поддержку, что происходит очень долго.

Заключение

Определены цели и задачи магистерской работы. Для разработки программного комплекса автоматизации формирования нагрузки кафедры было принято решение использовать систему поддержки принятия решений, основанную на искусственной нейронной сети. Проведен обзор подобных разработок, который показал, что технологии искусственного интеллекта ранее не применялись для решения задачи формирования нагрузки.

Список литературы

Джонс М.Т. Программирование искусственного интеллекта в приложениях / М. Тим Джонс; Пер. с англ. Осипов А.И. – М.: ДМК Пресс, 2004. – 312 с.
Ясницкий Л.Н. Введение в искусственный интеллект: учебное пособие для студ. высш. учеб. заведений / Л.Н. Ясницкий – 2-е изд., испр. – М.: Издательский центр «Академия», 2008. – 176с.
Ясницкий Л.Н. Использование методов искусственного интеллекта в изучении личности серийных убийц / Л.Н. Ясницкий, С.В. Ваулева, Д.Н. Сафонова, Ф.М. Черепанов // Криминологический журнал Байкальского государственного университета экономики и права. – 2015. – Т. 9, № 3. – С. 423-430.
Хайкин С. Нейронные сети: полный курс, 2-е издание. : Пер. с англ. – М. : Издательский дом «Вильямс», 2006. – 1014 с.
Ясницкий Л.Н., Михалева Ю.А., Черепанов Ф.М. Возможности методов искусственного интеллекта для выявления и использования новых знаний на примере задачи управления персоналом // International Journal of Unconventional Science. Журнал Формирующихся Направлений Науки. 2014. Вып. 6; URL: http://www.unconv-science.org/n6/yasnitsky/
Султанова С.Н., Тархов С.В. Модели и алгоритмы поддержки принятия решений при распределении учебной нагрузки преподавателей // Вестник УГАТУ. Уфа: УГАТУ, 2006 T. 7, №3 (16). C. 107-114; URL: http://cyberleninka.ru/article/n/modeli-i-algoritmy-podderzhki-prinyatiya-resheniy-pri-raspredelenii-uchebnoy-nagruzki-prepodavateley
Википедия свободная энциклопедия. Метод обратного распространения ошибки // Википедия. [Эелектронный ресурс] – Режим доступа: https://ru.wikipedia.org/wiki/Метод_обратного_распространения_ошибки
Пользователь Noonv. Нейронная сеть – обучение ИНС с помощью алгоритма обратного распространения. // RoboCraft [Электронный ресурс] – Режим доступа: http://robocraft.ru/blog/algorithm/560.html
Википедия свободная энциклопедия. Искусственная нейронная сеть // Википедия. [Эелектронный ресурс] – Режим доступа: https://ru.wikipedia.org/wiki/Искусственная_нейронная_сеть
Калюжный Н.В. Анализ процесса распределения учебной нагрузки профессорско-преподавательского состава на кафедрах // Science Time. – 2015. – № 6 (18) / 2015. – С. 199-202. URL: http://cyberleninka.ru/article/n/analiz-protsessa-raspredeleniya-uchebnoy-nagruzki-professorsko-prepodavatelskogo-sostava-na-kafedrah

Важное замечание

При написании данного реферата-обзора по теме, магистерская работа еще не завершена. Защита работы состоится летом 2017 года, полный текст можно будет получить у автора или руководителя после ее защиты.