Назад в библиотеку

УДК 004.85

ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ОПТИМИЗАЦИИ СОСТАВЛЕНИЯ РАСПИСАНИЯ В ОБРАЗОВАТЕЛЬНЫХ ОРГАНИЗАЦИЯХ

 

 

Пащенко Д.А., Маслова Е.А.

Донецкий национальный технический университет

кафедра искусственного интеллекта и системного анализа

E–mail: pashektor77@gmail.com

 

Аннотация:

Пащенко Д.А., Маслова Е.А. Использование методов интеллектуального анализа данных для оптимизации составления расписания в образовательных организациях. Рассмотрен процесс анализа данных, определены его основные характеристики, а также выявлены возможности применения на практике для оптимизации составления и работы с расписанием.

Annotation:

Pashchenko D.A., Maslova E.A. Using data mining techniques for optimizing scheduling in educational organizations. The process of data analysis was described, its main characteristics were determined, and the practical applications for optimizing the compilation and working with the schedule were identified.

Общая постановка проблемы

Одной из важнейших проблем качественной организации учебного процесса в образовательных организациях является задача формирования учебного расписания. Правильно и точно составленное расписание обеспечивает равномерную загрузку студенческих групп и профессорско–преподавательского состава.

Таким образом, необходимо найти способ для создания наиболее оптимального расписания и возможность его редактирования при необходимости.

Цель статьи

Определить наиболее подходящие для составления и редактирования расписания методы интеллектуального анализа данных.

Актуальность данной статьи

Проблема усовершенствования учебного процесса образовательной организации за счет планирования проведения занятий является известной, ее решением занимались многие ученые и практики по созданию автоматизированных систем. В настоящее время эта проблема остается открытой. Актуальность задачи определяется ростом требований к качеству обучения, планированию работы студентов в условиях дефицита аудиторного фонда и др. При создании плана расписания занятий необходимо учитывать множество противоречивых и нечетко определенных факторов: занятость преподавателей, аудиторного фонда, наличие основных и альтернативных занятий, a при назначении лабораторных занятий – занятость соответствующих лабораторий.

Составление расписания учебных занятий является одной из важнейших задач управления учебным процессом. В связи с этим проблема автоматизации составления расписаний учебных занятий в образовательных системах массового обучения по–прежнему остается одной из актуальных проблем организации учебного процесса.

Интеллектуальный анализ данных

Интеллектуальный анализ данных – это обработка информации и выявление в ней моделей и тенденций, которые помогают принимать решения. Принципы интеллектуального анализа данных известны в течение многих лет, но с появлением больших данных они получили еще более широкое распространение.

Большие данные привели к росту популярности более широких методов интеллектуального анализа данных, отчасти потому, что информации стало гораздо больше, и она по самой своей природе и содержанию становится более разнообразной и обширной. При работе с большими наборами данных уже недостаточно относительно простой и прямолинейной статистики. Имея большое количество подробных записей о каждом проводимом занятии, недостаточно знать место и время их проведения. Чтобы лучше удовлетворить потребности преподавателей и студентов необходимо учитывать тип занятий, расстояние между корпусами и многие другие аспекты.

Эти требования привели от простого поиска и статистического анализа данных к более сложному интеллектуальному анализу данных. Для решения задач требуется такой анализ данных, который позволяет построить модель для описания информации и в конечном итоге приводит к созданию результирующего отчета. Этот процесс иллюстрирует рисунок 1.

Рис. 1. Схема распространения информации в сети

Процесс анализа данных, поиска и построения модели часто является итеративным, так как в процессе работы возникает необходимость в выявлении дополнительных сведений, которые могут быть получены из дополнительных источников. Необходимо также понимать, как связать, преобразовать и объединить их с другими данными для получения результата. После обнаружения дополнительных элементов и характеристик, подход к выявлению источников и видов данных, с последующей их обработкой и получением требуемого результата, может измениться.

Ассоциация

Ассоциация (или отношение), вероятно, наиболее известный, знакомый и простой метод интеллектуального анализа данных. Для выявления моделей делается простое сопоставление двух или более элементов, часто одного и того же типа. Например, отслеживая последовательность занятий, можно заметить, что сначала проводят лекционные занятия, а потом лабораторные или практические.

Классификация

Классификацию можно использовать для получения представления о типе объектов, описывая несколько атрибутов для идентификации определенного класса. Например, студентов легко классифицировать по специальностям, определив читаемые для него дисциплины. Те же принципы можно применить и к преподавателям, например, классифицируя их по принадлежности к факультетам.

Кроме того, классификацию можно использовать в качестве входных данных для других методов. Например, для определения классификации можно применять деревья принятия решений. Кластеризация позволяет использовать общие атрибуты различных классификаций в целях выявления кластеров.

Кластеризация

Исследуя один или более атрибутов, или классов, можно сгруппировать отдельные элементы данных вместе, получая структурированное заключение. На простом уровне при кластеризации используется один или несколько атрибутов в качестве основы для определения кластера сходных результатов. Кластеризация полезна при определении различной информации, потому что она коррелируется с другими примерами, так что можно увидеть, где подобия и диапазоны согласуются между собой. Метод кластеризации работает в обе стороны. Можно предположить, что в определенной точке имеется кластер, а затем использовать свои критерии идентификации, чтобы проверить это.

Прогнозирование

Прогнозирование – это широкая тема, которая простирается от предсказания отказов компонентов оборудования до выявления мошенничества и даже прогнозирования прибыли компании. В сочетании с другими методами интеллектуального анализа данных прогнозирование предполагает анализ тенденций, классификацию, сопоставление с моделью и отношения. Анализируя прошлые события или экземпляры, можно предсказывать будущее.

Например, используя данные о количестве поступавших студентов за последние 5 лет можно сделать вывод о необходимости расширения или уменьшения аудиторного фонда.

Деревья решений

Дерево решений, связанное с большинством других методов (главным образом, классификации и прогнозирования), можно использовать либо в рамках критериев отбора, либо для поддержки выбора определенных данных в рамках общей структуры. Дерево решений начинают с вопроса, который может иметь несколько ответов. Каждый ответ приводит к следующему вопросу, помогая классифицировать и идентифицировать данные или делать прогнозы.

При создании базы данных генерирующей расписание занятий образовательной организации использование методов интеллектуального анализа данных, обеспечивает удобный доступ к систематизированной и упорядоченной информации.

Учебный процесс, с точки зрения управления объектами в условиях ограниченных ресурсов, может быть разделен на три основных этапа.

Первый этап – этап планирования, этот этап может быть разделен на две составных части – планирование учебной нагрузки, т.е. закрепление учебных занятий в группах за конкретными преподавателями, и планирование поведения процесса, т. е. распределение этих занятий во времени (составление расписания). На втором этапе выполняется учебный процесс.

В период выполнения этого этапа возможны отклонения от начального значения состава преподавателей, аудиторного фонда, групп студентов. Управление на этом этапе сводится к минимизации потерь от этих отклонений без изменения общего расписания. Минимизация этих потерь может быть спланирована на этапе составления расписания при учете критериев устойчивости расписания к таким отклонениям.

На третьем этапе производится оценка результатов планирования и выполнения учебного процесса. Эта оценка имеет две составляющих: оценка достижения цели обучения и оценка качества расписания.

В первом случае оценивается учебный план и принимается решение о качестве обучения. Во втором – оценивается само расписание с точки зрения эргономических показателей, устойчивости и т. п. и могут быть выработаны критерии для построения расписания на следующий период работы.

В соответствии с предложенной схемой управления учебным процессом можно выделить две области, где возможна автоматизация управления, это этап составления расписания и расчет частных и обобщенной оценок результата учебного процесса. На рисунке 2 приведен процесс составления расписания.

Рис. 2. Процесс составления расписания

Для решения существующих проблем при составлении расписания для образовательных организация требуется построение гибкой и легко адаптируемой базы данных на основе новых принципов, с использованием современных компьютерных технологий. На рисунке 3 приведена схема потоков данных базы данных «Расписание занятий».

Рис. 3. Схема потоков данных БД «Расписание занятий»

Выводы

Интеллектуальный анализ данных – это не только выполнение некоторых сложных запросов к данным, хранящимся в базе данных. Независимо от того какими средствами обрабатывается информация, необходимо работать с данными, форматировать или реструктурировать их. Требуется определить формат информации, на котором будет основываться последующий анализ и алгоритм реализации. Затем, когда информация будет сформирована в нужном формате, можно применять различные методы, не зависящие от требуемой базовой структуры данных или набора данных.

Данный анализ может успешно применяться в задачах составления расписания, учитывая большие объемы и разнообразную структуру обрабатываемой в этих задачах информации.

Литература

  1. Симбирская Л.М. Компьютерная система планирования учебной работы ВУЗа: Сборник научных трудов / Л.М. Симбирская, И.В. Клитная. – Харьков: Ранок, 2002. – 137 с.
  2. Арвачева А.Э. Разработка информационной системы «Расписание занятий» для учреждений высшего образования / Молодой ученый, 2016. – 50–52 с.
  3. Методы интеллектуального анализа данных [Электронный ресурс]. – Режим доступа: https://www.ibm.com/developerworks/ru/library/ba-data-mining-techniques/index.html – Загл. с экрана