Інструментальні засоби обробки та зберігання гетерогенних даних в системах дистанційного навчання

Введення

      Сучасний стан науки та освіти в Україні, що зумовлено економічними чинниками, характеризується підвищенням вимог до якості підготовки фахівців і визначає постійний пошук нових методів і засобів підвищення ефективності освітнього процесу. В даний час одним із шляхів підвищення ефективності навчального процесу є розробка та впровадження систем дистанційного навчання (СДН) на базі інтегрованої інформаційної системи управління якістю всіх робочих процесів університету.
      Дистанційне навчання, що представляє собою інформаційно-освітню систему віддаленого доступу, засновану на сучасних інформаційних технологіях, і спрямоване на реалізацію концепції випереджаючої освіти, орієнтованого на умови існування людини в інформаційному суспільстві. Дистанційне навчання при відповідних умовах може забезпечити доступність якісної вищої освіти широким верствам населення, незалежно від місця проживання і умов роботи; гнучко реагувати на запити ринку праці; повніше використовувати педагогічний, науковий, кадровий потенціал вузів; зменшити фінансові кошти.
      Системи дистанційної освіти забезпечують адаптацію процесу навчання до індивідуальних характеристик учнів, звільняють викладачів від ряду трудомістких і часто повторюваних операцій за поданням навчальної інформації і контролю знань, сприяють розробці об'єктивних методів контролю знань і полегшують накопичення навчально-методичного досвіду.

Актуальність теми

      Збільшення кількості студентів за рахунок контрактної форми навчання, зростання популярності диплома бакалавра і, як наслідок, раннє працевлаштування студентів ставлять такі проблеми очної форми навчання: збільшення планової лабораторної навантаження, зростання планових потреб у навчальних приміщеннях; зниження навчальної активності студентів. Досвід показує, що до п'ятого курсу студенти одночасно з вивченням матеріалу, безпосередньо пов'язаного з обраною спеціальністю, починають працювати, і при зростанні планової знижується реальна навантаження на викладачів та навчальні аудиторії. Цей період навчання має такі особливості: незначна кількість дисциплін, однорідність дисциплін (всі вони пов'язані зі спеціальністю); практична спрямованість навчання (переважають курсові роботи, проекти, дипломне проектування). Студент цього періоду характеризується самостійністю, цілеспрямованістю в діях, досвідченістю в навчальному процесі та у використанні засобів інформаційних технологій. На додаток до цього будинку або на роботі він має комп'ютер і доступ в Інтернет. Беручи до уваги зазначені особливості періоду навчання і характеристику студента, для вирішення перерахованих проблем пропонується дистанційне завершення навчання [6].
      Інформаційно-освітнє середовище ДН є системно-організованою сукупністю засобів передачі даних, інформаційних ресурсів, протоколів взаємодії, апаратно-програмного і організаційно-методичного забезпечення, орієнтовану на задоволення освітніх потреб користувачів дистанційної освіти. Складовими частинами інформаційно-навчального середу СДН виступають гетерогенні, тобто — що мають різнорідну структуру та зміст, інформаційні потоки. Актуальною проблемою є спосіб зберігання і подання гетерогенних даних у системах дистанційного навчання.

Цілі і завдання магістерської роботи

      Метою магістерської роботи є дослідження і розробка способів ефективної інтеграції програмних продуктів різних виробників і створення на їх основі технології та інструментарію для управління гетерогенними даними в СДН.
      Для досягнення зазначеної мети необхідно вирішити такі завдання:

  1. Методами системного аналізу провести дослідження сучасних технологій дистанційного навчання, обробки та зберігання гетерогенних даних.
  2. На основі проведеного аналізу розробити модель обміну гетерогенними даними в системах дистанційного навчання.
  3. Розробити інструментальні засоби обробки та зберігання гетерогенних даних в СДН.
  4. Представити модель інформаційних потоків з використанням графів.

      Вищевказані завдання повинні бути виконані з урахуванням оптимізації роботи СДН за наступними критеріями:
      - зв'язкового пошуку інформації;
      - інтеграції з іншими системами;
      - повторного використання;
      - швидкості доступу до контенту;
      - зручності доступу до контенту.

Передбачувана наукова новизна

      Передбачувана наукова новизна магістерської роботи полягає в наступних положеннях:

  1. На основі існуючих систем запропоновано інструментальні засоби обробки та зберігання гетерогенних даних у системі дистанційного навчання.
  2. Визначено новий підхід до підвищення ефективності управління гетерогенними даними в корпоративних інформаційних системах, що забезпечує скорочення часу передачі інформації та підвищення її достовірності.

Практичне значення результатів роботи

      Практична цінність магістерської роботи полягає у підвищенні ефективності управління гетерогенними даними в СДН за рахунок поліпшення методів обміну та інтеграції даних, а також — скорочення часу їх передачі між інформаційними підсистемами.
      Практичне значення результатів та їх впровадження, розроблені в магістерській роботі моделі і створені на їх основі програмні засоби, дадуть можливість удосконалити процес дистанційного навчання.

Огляд досліджень і розробок по темі

      Масиви знань величезні і їх спосіб представлення займає основне місце у формуванні навчального Web-контенту. Навчальний Web-контент — це змістовне наповнення освітніх сайтів, порталів дистанційного навчання та інших Інтернет-систем, що використовуються для передачі знань користувачам (тексти, графіка, мультимедіа). У Web-сайтах для кінцевого користувача контент організується у вигляді сторінок засобами гіпертекстової розмітки. Виникає питання з вибором моделі представлення даних в таких системах. Модель даних представляє собою безліч структур даних і взаємозв'язку між ними.
      Виділимо основні вимоги, які пред'являються моделі представлення даних в СДН. Модель має відповідати наступним вимогам:
      — ієрархічне і багаторівневе представлення великих обсягів контента по раз-ним предметних областях;
      — підтримка міжпредметних і різноманітних внутрішньопредметні зв'язків;
      — наявність широких можливостей у тематичному і асоціативному угрупованні та сортування контенту;
      — підтримка еволюційного розвитку освітнього порталу як необхідна складова в умовах «інформаційного вибуху», доступність функціональності навіть за умови неповного опису;
      — повторне використання контенту та організація нових навчальних курсів на основі існуючої інформації;
      — підтримка процесу управління знаннями в процесі безперервного навчання.
      У ході досліджень були розглянуті наступні основні моделі представлення даних, що використовуються в різних СДН: ієрархічної, мережевої та реляційної.
      В ієрархічній моделі дані представляються у вигляді дерева (ієрархічної) структури. Дерево представляє собою ієрархію елементів, званих вузлами. Під елементами розуміється сукупність атрибутів, що описують об'єкти. У моделі є кореневий вузол (корінь дерева), який знаходиться на самому верхньому рівні і не має вузлів, що стоять вище за нього. До достоїнств ієрархічної моделі даних ставляться ефективне використання пам'яті ЕОМ і непогані показники часу виконання операцій над даними. Недоліком ієрархічної моделі є її громіздкість для обробки інформації з досить складними логічними зв'язками [2]. Безпосередній доступ можливий лише до об'єкта самого високого рівня, а до інших об'єктів доступ здійснюється тільки по зв'язках від об'єкту на вершині моделі [1].
      Мережева модель (або семантична мережа) в інженерії знань представляється спрямованим графом, вузли якого відповідають поняттям і об'єктів, а дуги — відносинам між ними. У мережевих моделях безпосередній доступ забезпечується до будь-якого об'єкту незалежно від рівня його розташування в моделі, а також у зв'язках до інших об'єктів. Основна перевага семантичної мережі — це універсальність і зручність подання як декларативних, так і процедурних знань. Мають місце і два недоліки:
      — громіздкість і складність побудови і зміни великої мережі;
      — потреба у значній кількості та різноманітності процедур обробки, пов'язана з різними типами дуг і вершин.
      Незважаючи на властиві цій моделі недоліки, вона є однією з найбільш ефективних моделей представлення знань [1].
      Реляційна модель орієнтована на організацію даних у вигляді двовимірних таблиць. Будь-яка таблиця реляційної бази даних складається з рядків (званих також записами) і стовпців (званих також полями). Гідність реляційної моделі даних полягає в простоті, зрозумілості та зручності фізичної реалізації на ЕОМ. До основних недоліків реляційної моделі належать відсутність стандартних засобів ідентифікації окремих записів і складність опису ієрархічних і мережевих зв'язків [2].
      Виходячи з постановки задачі, а також враховуючи той факт, що СДН включає дані різних типів, виникає необхідність поєднання моделей подання знань різних концепцій, тому що основні моделі даних, в силу своїх обмежень, не повною мірою задовольняють висунутим вимогам. У ході досліджень була розглянута стаття [3], що пропонує модель навчального контенту Tree-Net як альтернативне рішення існуючої проблеми.
      Tree-Net — ієрархічно-мережева модель даних, яка є основою для формалізації і структурування інформації освітніх порталів для підтримки безперервного навчання, являє собою сукупність двох ієрархічних структур - дерева елементів контенту і дерева тематичних груп (рис. 1,2).



Рисунок 1. — Схематичне зображення Tree-Net моделі: дерево контенту.



Рисунок 2. — Схематичне зображення Tree-Net моделі: дерево тематичних груп.

      Структура Tree-net з одного боку є ієрархічною, а з іншого має риси семантичної мережі. Між елементами контенту можуть встановлюватися бінарні зв'язку, що дозволяє, крім ієрархії, зв'язати контент в мережу на основі асоціативності.
      Дерево контенту вказує на фізичне розташування контенту, це основна навігаційна модель контенту сайту. Завдання дерева тематичних груп — подати ієрархію тим предметних областей. Елементи контенту можуть бути віднесені до однієї або більше тематичними групами. Таким чином, Tree-Net забезпечує як загальне структурування Web-контенту освітнього порталу, так і подання його семантики, завдяки моделюванню предметних областей [3].

Математична постановка задачі

      У розглянутій моделі існує недолік, що полягає в жорсткій семантиці в межах однієї предметної області. Для вирішення даної проблеми за допомогою теорії нечітких множин існує можливість віднесення елемента контенту до тієї чи іншої тематичної групи з певною часткою ймовірності. Для цього докладніше розглянемо поняття «тематичної групи» та спосіб представлення контенту з використанням теорії нечітких множин.
      Тематичні групи призначені для організації різноманітних міжпредметних та внутрішньопредметні зв'язків між елементами контенту. Тематичні групи використовуються для моделювання предметних областей, каталогізації, угруповання та вибірки асоціативного контенту. Організація тематичних груп відбувається у ієрархічній структурі. Це дозволяє вибудовувати таксономії предметних областей. Кожен елемент контенту може брати участь у довільній кількості тематичних груп, на основі яких визначаються зв'язку асоціативності між елементами контенту [3]. Множина G вказує на тематичні або асоціативні групи, в яких можуть брати участь елементи контенту.

(1)

      де nG — кількість тематичних груп контенту.
      Найпростішим елементом контенту є подання (vi), яке відповідає одній Web-сторінці сайту. Зауважимо, що завданням Web-сторінки є подання логічно завершеною порції контенту з точки зору її сутності, тоді як основні налаштування візуального оформлення задаються централізовано для всього порталу за допомогою відповідних Web-технологій. Множина всіх елементів контенту

(2)

      Кожен елемент контенту може брати участь у довільній кількості тематичних груп з вірогідністю влучення елемента в ту чи іншу тематичну групу. Застосуємо теорію нечітких множин для подання множини G тематичних груп:

(3)

      де — функція належності, яка ставить у відповідність кожному елементу контенту vj, що приймає участь у тематичній групі gi, деякий дійсне число з [0,1].
      Матриця задає це відношення, разом з тим зберігаючи ступінь відповідності або релевантністю даного елемента групі. Так, стовпці матриці відповідають елементам контенту v1, v2, ..., vn, а рядки - групам g1, g2, ..., gm. Таким чином для кожного елемента vj задається безліч груп {gi}, в яких цей елемент бере участь, при цьому ненульові елементи матриці вказують на ступінь відповідності елемента групі з деякою ймовірністю.
      Організація тематичних груп відбувається у ієрархічній структурі. Ієрархія груп визначається відображенням, яке ставить у відповідність кожній групі gi безліч її дочірніх елементів. Зауважимо, що кожна тематична група може мати тільки одну батьківську групу.
      Ієрархічно-мережева модель даних Tree-Net є основою формалізації і структуризації інформації Інтернет-систем, в тому числі для освітніх порталів. Опишемо ієрархічну складову структури контенту Tree-Net-моделі.
      Ієрархічна структура контенту визначається тим, що кожен елемент може мати дочірні елементи, які, у свою чергу, також можуть мати дочірні елементи, і так далі.

(4)

      Множина безпосередніх дочірніх елементів для цього елемента контенту а позначається

(5)

      Мережева структура контенту полягає в тому, що кожен елемент, крім зв'язків ієрархії, може мати додаткові зв'язки з іншими елементами. Семантична роль таких мережевих зв'язків — відношення асоціативності. Таким чином, кожен елемент має сукупність пов'язаних з ним елементів. Така мережева структура задається відношенням

(6)

      Дане відношення задається квадратною (nV * nV) матрицей срядки і стовпці якої, відповідають елементам контенту. Елемент матриці — числове вираження зв'язку елементів vi і vj. Якщо = 0, вважаємо, що зв'язок між vi з vj відсутний, .

(7)

      Елемент v може мати прямі, зворотні і взаємні зв'язки з іншими елементами. При цьому взаємозв'язок може бути симетричною. Прямий зв'язок елементів vk і vl існує, якщо (vk, vl) N. Зворотній зв'язок цих елементів існує, якщо (vl, vk) N. Взаємозв'язок елементів vk и vl існує, якщо (vk, vl) N & (vl, vk) N. Взаємозв'язок цих елементів є симетричною, якщо елементи матриці рівні.

Висновок

      Тенденції розвитку світу в напрямку глобалізації та інформатизації вимагають від університетської освіти радикальної зміни освітньої парадигми сучасної культури навчання. Сучасні навчальні середовища на основі мультимедійних систем та телекомунікаційних мереж здатні вміщати величезні обсяги інформації, надавати можливість роботи з різними її видами: текстової, графічної (статичними і динамічними зображеннями) і звуковий.
      Запропонована модель подання знань дозволить комплексно підійти до вирішення завдань навчання та управління знаннями в організаціях та установах різного характеру.

Список літератури

  1. Модели решения функциональных и вычислительных задач [Электронный ресурс]. – Режим доступа: http://www.scriru.com/....
  2. Модели представления данных. Иерархическая, сетевая, реляционная модели даннях [Электронный ресурс]. – Режим доступа: http://www.dmtsoft.ru/....
  3. Титенко С.В., Гагарін О.О. Формування навчального контенту на основі моделі даних Tree-Net // Матеріали Всеукраїнської науково-технічної конференції "Комп'ютерна математика в інженерії, науці та освіті" (CMSEE-2007), м. Полтава, 28-30 листопада 2007 р. - Полтава: Вид-во ПолНТУ, 2007 - 42с.
  4. Гагарін О.О., Титенко С.В. Дослідження і аналіз методів та моделей інтелектуальних систем безперервного навчання // Наукові вісті НТУУ "КПІ". – 2007. – № 6(56). – С. 37-48.
  5. Куликов С.С. Дистанционное обучение — образовательная среда XXI века: Сб. науч. материалов V МНМК. Минск, БГУИР. 10–11 ноября 2005 г. Минск, 2005. С. 347–350.
  6. Д. А. Лидер, Дакак Хальдун. Портал для завершения высшего образования в области информационных технологий [Электронный ресурс]. – Режим доступа: http://eprints.isofts.kiev.ua/...
  7. Mihai Stefan Nistorescu, Luciana Carabaneanu, Ion Mierlus-Mazilu. Distance education and interactive technology [Электронный ресурс]. – Режим доступа: http://www.codewitz.net/...
  8. Seifedine Kadry, Hussam Kassem. Web service technology for distance and open learning [Электронный ресурс]. – Режим доступа: http://www.jatit.org/...
  9. Технологии дистанционного образования [Электронный ресурс]. – Режим доступа: http://cdo.bseu.by/...
  10. Кофман А. Введение в теорию нечетких множеств: Пер с франц. – М.: Радио и связь, 1982. – 432 с., ил.
  11. А. Б. Николаев, Н. И. Пресняков, Н. Н. Пресняков, П. С. Рожин. Программные комплексы и методика применения дистанционных образовательных технологий для строительных вузов [Электронный ресурс]. – Режим доступа: http://www.ict.edu.ru/...

      При написанні даного автореферату магістерська робота ще не завершена. Остаточне завершення: 1 грудня 2011. Повний текст роботи та матеріали по темі можуть бути отримані у автора або його керівника після зазначеної дати.