Инструментальные средства обработки и хранения гетерогенных данных в системах дистанционного обучения

Введение

      Современное состояние науки и образования в Украине, обусловленное экономическими факторами, характеризуется повышением требований к качеству подготовки специалистов и определяет постоянный поиск новых методов и средств повышения эффективности образовательного процесса. В настоящее время одним из путей повышения эффективности учебного процесса является разработка и внедрение систем дистанционного обучения (СДО) на базе интегрированной информационной системы управления качеством всех рабочих процессов университета.
      Дистанционное обучение, представляющее собой информационно-образовательную систему удаленного доступа, основанную на современных информационных технологиях, и направлено на реализацию концепции опережающего образования, ориентированного на условия существования человека в информационном обществе. Дистанционное обучение при соответствующих условиях может обеспечить доступность качественного высшего образования широким слоям населения, независимо от места проживания и условий работы; гибко реагировать на запросы рынка труда; полнее использовать педагогический, научный, кадровый потенциал вузов; экономить финансовые средства.
      Системы дистанционного образования обеспечивают адаптацию процесса обучения к индивидуальным характеристикам обучаемых, освобождают преподавателей от ряда трудоемких и часто повторяющихся операций по представлению учебной информации и контролю знаний, способствуют разработке объективных методов контроля знаний и облегчают накопление учебно-методического опыта.

Актуальность темы

      Увеличение количества студентов за счет контрактной формы обучения, рост популярности диплома бакалавра и, как следствие, раннее трудоустройство студентов ставят следующие проблемы очной формы обучения: увеличение плановой лабораторной нагрузки, рост плановых потребностей в учебных помещениях; снижение учебной активности студентов. Опыт показывает, что к пятому курсу студенты одновременно с изучением материала, непосредственно связанного с выбранной специальностью, начинают работать, и при росте плановой снижается реальная нагрузка на преподавателей и учебные аудитории. Этот период обучения имеет следующие особенности: незначительное количество дисциплин, однородность дисциплин (все они связаны со специальностью); практическая направленность обучения (преобладают курсовые работы, проекты, дипломное проектирование). Студент этого периода характеризуется самостоятельностью, целенаправленностью в действиях, опытностью в учебном процессе и в использовании средств информационных технологий. В дополнение к этому дома или на работе он имеет компьютер и доступ в Интернет. Принимая во внимание указанные особенности периода обучения и характеристику студента, для решения перечисленных проблем предлагается дистанционное завершение обучения [6].
      Информационно-обучающая среда ДО представляет собой системно-организованную совокупность средств передачи данных, информационных ресурсов, протоколов взаимодействия, аппаратно-программного и организационно-методического обеспечения, ориентированную на удовлетворение образовательных потребностей пользователей дистанционного образования. Составными частями информационно-обучающей среда СДО выступают гетерогенные, т. е.- имеющие разнородную структуру и содержание, информационные потоки. Актуальной проблемой является способ хранения и представления гетерогенных данных в системах дистанционного обучения.

Цели и задачи магистерской работы

      Целью магистерской работы является исследование и разработка способов эффективной интеграции программных продуктов различных производителей и создание на их основе технологии и инструментария для управления гетерогенными данными в СДО.
      Для достижения указанной цели необходимо решить следующие задачи:

  1. Методами системного анализа провести исследование современных технологий дистанционного обучения, обработки и хранения гетерогенных данных.
  2. На основе проведенного анализа разработать модель обмена гетерогенными данными в системах дистанционного обучения.
  3. Разработать инструментальные средства обработки и хранения гетерогенных данных в СДО.
  4. Представить модель информационных потоков с использованием графов.

      Вышеуказанные задачи должны быть выполнены с учетом оптимизации работы СДО по следующим критериям:
      - связного поиска информации;
      - интеграции с другими системами;
      - повторного использования;
      - скорости доступа к контенту;
      - удобства доступа к контенту.

Предполагаемая научная новизна

      Предполагаемая научная новизна магистерской работы заключается в следующих положениях:

  1. На основе существующих систем предложены инструментальные средства обработки и хранения гетерогенных данных в системе дистанционного обучения.
  2. Определен новый подход к повышению эффективности управления гетерогенными данными в корпоративных информационных системах, обеспечивающий сокращение времени передачи информации и повышение ее достоверности.

Практическое значение результатов работы

      Практическая ценность магистерской работы заключается в повышении эффективности управления гетерогенными данными в СДО за счет улучшения методов обмена и интеграции данных, а также - сокращения времени их передачи между информационными подсистемами.
      Практическое значение результатов и их внедрение, разработанные в магистерской работе модели и созданные на их основе программные средства, дадут возможность усовершенствовать процесс дистанционного обучения.

Обзор исследований и разработок по теме

      Массивы знаний огромны и их способ представления занимает основное место в формировании учебного Web-контента. Учебный Web-контент — это содержательное наполнение образовательных сайтов, порталов дистанционного обучения и других Интернет-систем, использующиеся для передачи знаний пользователям (тексты, графика, мультимедиа). В Web-сайтах для конечного пользователя контент организуется в виде страниц средствами гипертекстовой разметки. Возникает вопрос с выбором модели представления данных в таких системах. Модель данных представляет собой множество структур данных и взаимосвязи между ними.
      Выделим основные требования, предъявляемые модели представления данных в СДО. Модель должна удовлетворять следующим требованиям:
      — иерархическое и многоуровневое представление больших объемов контента по разным предметным областям;
      — поддержка межпредметных и разнообразных внутрипредметные связей;
      — наличие широких возможностей в тематическом и ассоциативном группировке и сортировке контента;
      — поддержка эволюционного развития образовательного портала как необходимая составляющая в условиях «информационного взрыва», доступность функциональности даже при условии неполного описания;
      — повторное использование контента и организация новых учебных курсов на основе существующей информации;
      — поддержка процесса управления знаниями в процессе непрерывного обучения.
      В ходе исследований были рассмотрены следующие основные модели представления данных, используемых в различных СДО: иерархической, сетевой и реляционной.
      В иерархической модели данные представляются в виде древовидной (иерархической) структуры. Дерево представляет собой иерархию элементов, называемых узлами. Под элементами понимается совокупность атрибутов, описывающих объекты. В модели имеется корневой узел (корень дерева), который находится на самом верхнем уровне и не имеет узлов, стоящих выше него. К достоинствам иерархической модели данных относятся эффективное использование памяти ЭВМ и неплохие показатели времени выполнения операций над данными. Недостатком иерархической модели является ее громоздкость для обработки информации с достаточно сложными логическими связями [2]. Непосредственный доступ возможен лишь к объекту самого высокого уровня, а к другим объектам доступ осуществляется только по связям от объекта на вершине модели [1].
      Сетевая модель (или семантическая сеть) в инженерии знаний представляется направленным графом, узлы которого соответствуют понятиям и объектам, а дуги — отношениям между ними. В сетевых моделях непосредственный доступ обеспечивается к любому объекту независимо от уровня его расположения в модели, а также по связям к другим объектам. Основное достоинство семантической сети — это универсальность и удобство представления как декларативных, так и процедурных знаний. Имеют место и два недостатка:
      — громоздкость и сложность построения и изменения большой сети;
      — потребность в значительном количестве и разнообразии процедур обработки, связанная с различными типами дуг и вершин.
      Несмотря на присущие этой модели недостатки, она является одой из наиболее эффективных моделей представления знаний [1].
      Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Любая таблица реляционной базы данных состоит из строк (называемых также записями) и столбцов (называемых также полями). Достоинство реляционной модели данных заключается в простоте, понятности и удобстве физической реализации на ЭВМ. К основным недостаткам реляционной модели относятся отсутствие стандартных средств идентификации отдельных записей и сложность описания иерархических и сетевых связей [2].
      Исходя из постановки задачи, а также учитывая тот факт, что СДО включает данные различных типов, возникает необходимость совмещения моделей представления знаний различных концепций, так как основные модели данных, в силу своих ограничений, не в полной мере удовлетворяют выдвинутым требованиям. В ходе исследований была рассмотрена статья [3], предлагающая модель учебного контента Tree-Net как альтернативное решение существующей проблемы.
      Tree-Net — иерархически сетевая модель данных, которая является основой для формализации и структурирования информации образовательных порталов для поддержки непрерывного обучения, представляет собой совокупность двух иерархических структур - дерева элементов контента и дерева тематических групп (рис. 1,2).



Рисунок 1. — Схематическое изображение Tree-Net модели: дерево контента.



Рисунок 2. — Схематическое изображение Tree-Net модели: дерево тематических групп.

      Структура Tree-net с одной стороны является иерархической, а с другой имеет черты семантической сети. Между элементами контента могут устанавливаться бинарные связи, что позволяет, кроме иерархии, связать контент в сеть на основе ассоциативности.
      Дерево контента указывает на физическое расположение контента, это основная навигационная модель контента сайта. Задача дерева тематических групп — подать иерархию тем предметных областей. Элементы контента могут быть отнесены к одной или более тематическим группам. Таким образом, Tree-Net обеспечивает как общее структурирование Web-контента образовательного портала, так и представление его семантики, благодаря моделированию предметных областей [3].

Математическая постановка задачи

      В рассмотренной модели существует недостаток, заключающийся в жесткой семантике в пределах одной предметной области. Для решения данной проблемы с помощью теории нечетких множеств существует возможность отнесения элемента контента к той или иной тематической группе с определенной долей вероятности. Для этого подробнее рассмотрим понятие «тематической группы» и способ представления контента с использованием теории нечетких множеств.
      Тематические группы предназначены для организации разнообразных межпредметных и внутрипредметные связей между элементами контента. Тематические группы используются для моделирования предметных областей, каталогизации, группировки и выборки ассоциативного контента. Организация тематических групп происходит в иерархической структуре. Это позволяет выстраивать таксономии предметных областей. Каждый элемент контента может принимать участие в произвольном количестве тематических групп, на основе которых определяются связи ассоциативности между элементами контента [3]. Множество G указывает на тематические или ассоциативные группы, в которых могут участвовать элементы контента.

(1)

      где nG — количество тематических групп контента.
      Простейшим элементом контента является представление (vi), которое соответствует одной Web-странице сайта. Заметим, что задачей Web-страницы является представление логически завершенной порции контента с точки зрения ее сущности, тогда как основные настройки визуального оформления задаются централизованно для всего портала с помощью соответствующих Web-технологий. Множество всех элементов контента

(2)

      Каждый элемент контента может принимать участие в произвольном количестве тематических групп с вероятностью попадания элемента в ту или иную тематическую группу. Применим теорию нечетких множеств для представления множества G тематических групп:

(3)

      где — функция принадлежности, которая ставит в соответствие каждому элементу контента vj, принимающее участие в тематической группе gi, некоторое действительное число из [0,1].
      Матрица задает это отношение, вместе с тем сохраняя степень соответствия или релевантности данного элемента группе. Так, столбцы матрицы соответствуют элементам контента v1, v2, ..., vn, а строки - группам g1, g2, ..., gm. Таким образом для каждого элемента vj задается множество групп {gi} , в которых данный элемент участвует, при этом ненулевые элементы матрицы указывают на степень соответствия элемента группе с некоторой вероятностью.
      Организация тематических групп происходит в иерархической структуре. Иерархия групп определяется отражением, которое ставит в соответствие каждой группе gi множество ее дочерних элементов. Заметим, что каждая тематическая группа может иметь только одну родителейскую группу.
      Иерархически сетевая модель данных Tree-Net является основой формализации и структуризации информации Интернет-систем, в том числе для образовательных порталов. Опишем иерархическую составляющую структуры контента Tree-Net-модели.
      Иерархическая структура контента определяется тем, что каждый элемент может иметь дочерние элементы, которые, в свою очередь, также могут иметь дочерние элементы, и так далее.

(4)

      Множество непосредственных дочерних элементов для данного элемента контента а обозначается

(5)

      Сетевая структура контента состоит в том, что каждый элемент, кроме связей иерархии, может иметь дополнительные связи с другими элементами. Семантическая роль таких сетевых связей - отношение ассоциативности. Таким образом, каждый элемент имеет совокупность связанных с ним элементов. Такая сетевая структура задается отношением

(6)

      Данное отношение задается квадратной (nV * nV) матрицей строки и столбцы которой, соответствуют элементам контента. Элемент матрицы — числовое выражение связи элементов vi и vj. Если = 0, считаем, что связь между vi с vj отсутствует, .

(7)

      Элемент v может иметь прямые, обратные и взаимные связи с другими элементами. При этом взаимосвязь может быть симметричной. Прямая связь элементов vk и vl существует, если (vk, vl) N. Обратная связь этих элементов существует, если (vl, vk) N. Взаимосвязь элементов vk и vl существует, если (vk, vl) N & (vl, vk) N. Взаимосвязь этих элементов является симметричной, если элементы матрицы равны.

Заключение

      Тенденции развития мира в направлении глобализации и информатизации требуют от университетского образования радикального изменения образовательной парадигмы современной культуры обучения. Современные учебные среды на основе мультимедийных систем и телекоммуникационных сетей способны вмещать огромные объемы информации, предоставлять возможность работы с различными ее видами: текстовой, графической (статическими и динамическими изображениями) и звуковой.
      Предложенная модель представления знаний позволит комплексно подойти к решению задач обучения и управления знаниями в организациях и учреждениях различного характера.

Литература

  1. Модели решения функциональных и вычислительных задач [Электронный ресурс]. – Режим доступа: http://www.scriru.com/....
  2. Модели представления данных. Иерархическая, сетевая, реляционная модели даннях [Электронный ресурс]. – Режим доступа: http://www.dmtsoft.ru/....
  3. Титенко С.В., Гагарін О.О. Формування навчального контенту на основі моделі даних Tree-Net // Матеріали Всеукраїнської науково-технічної конференції "Комп'ютерна математика в інженерії, науці та освіті" (CMSEE-2007), м. Полтава, 28-30 листопада 2007 р. - Полтава: Вид-во ПолНТУ, 2007 - 42с.
  4. Гагарін О.О., Титенко С.В. Дослідження і аналіз методів та моделей інтелектуальних систем безперервного навчання // Наукові вісті НТУУ "КПІ". – 2007. – № 6(56). – С. 37-48.
  5. Куликов С.С. Дистанционное обучение — образовательная среда XXI века: Сб. науч. материалов V МНМК. Минск, БГУИР. 10–11 ноября 2005 г. Минск, 2005. С. 347–350.
  6. Д. А. Лидер, Дакак Хальдун. Портал для завершения высшего образования в области информационных технологий [Электронный ресурс]. – Режим доступа: http://eprints.isofts.kiev.ua/...
  7. Mihai Stefan Nistorescu, Luciana Carabaneanu, Ion Mierlus-Mazilu. Distance education and interactive technology [Электронный ресурс]. – Режим доступа: http://www.codewitz.net/...
  8. Seifedine Kadry, Hussam Kassem. Web service technology for distance and open learning [Электронный ресурс]. – Режим доступа: http://www.jatit.org/...
  9. Технологии дистанционного образования [Электронный ресурс]. – Режим доступа: http://cdo.bseu.by/...
  10. Кофман А. Введение в теорию нечетких множеств: Пер с франц. – М.: Радио и связь, 1982. – 432 с., ил.
  11. А. Б. Николаев, Н. И. Пресняков, Н. Н. Пресняков, П. С. Рожин. Программные комплексы и методика применения дистанционных образовательных технологий для строительных вузов [Электронный ресурс]. – Режим доступа: http://www.ict.edu.ru/...

      При написании данного автореферата магистерская работа еще не завершена. Окончательное завершение: 1 декабря 2011 г. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.