Факультет: Комп`ютерних наук і технологій
Спеціальність: Системне програмування
Тема випускної роботи: Розробка та організація підсистеми баз даних розподіленого паралельного моделюючого середовища (РПМС)
Керівник:
професор, д.т.н. Святний В.А.
Реферат на тему магістерської роботи
Розробка та організація підсистеми баз даних розподіленого паралельного моделюючого середовища (РПМС)
Вступ:
Наука і технології не стоять на місці — вони стрімко розвиваються в усіх сферах людської діяльності. При цьому майже будь-яка розробка або дослідження потребують експериментальне підтвердження своїх результатів. Часто технічно неможливо або не доцільно проводити експерименти. Тоді в цьому випадку необхідна побудова моделі і проведення її моделювання в певному середовищі.
Багато напрямків науки і техніки досягли вже такого рівня розвитку, що звичайні моделюючі середовища не можуть впоратися з часовими або деталізуючими вимогами моделювання.
Таким чином — необхідно впровадження нових методів моделювання та побудови моделюючих середовищ. Однією з систем, яка виконує більшість з технологічних запитів, є — Розподілене паралельне моделююче середовище (РПМС)..
Цілі та задачі досліджень:
Метою даної магістерської роботи є розробка та організація підсистеми баз даних розподіленого паралельного моделюючого середовища (РПМС).
Дана проблема потребує аналізу і всебічного розгляду, а також вирішення наступних завдань:
- Аналіз РПМС, її декомпозиція на підсистеми.
- Визначення функцій, особливостей підсистеми баз даних РПМС.
- Розробка та дослідження структури підсистеми баз даних.
- Інтеграція підсистеми баз даних з іншими підсистемами.
- Імплементація проекту.
- Експериментальне дослідження.
Актуальність:
Вирішення задач моделювання складних динамічних об'єктів є складним процесом, який при використанні звичайних послідовних (не паралельних) методів, часто призводить до великих часових витрат. Таким чином, необхідно вдатися до застосування інших методів для зменшення часу моделювання, що можливо досягти завдяки паралельним моделюючим середам.
Розробки та дослідження в області розподілених паралельних моделюючих середовищ є актуальними в даний момент. Дослідженнями і модернізацією РПМС в даний момент всебічно займається велике число дослыдників. Проведена декомпозиція РПМС на підсистеми допомагає розділити всі дослідження на незалежні напрямки, які все переслідують спільну мету — розробку та вдосконалення РПМС.
При збільшенні складності моделі — різко зростає обсяг інформації, що підлягає обміну, зберіганню або обробці. Тому операції з інформацією — це дуже важлива складова загальної структури РПМС і саме підсистема баз даних відповідає за цей напрямок роботи. Отже — розробка та організація підсистеми баз даних у РПМС є актуальним та необхідним завданням, що дозволить оптимізувати операції пов'язані з інформацією, мінімізувати часові та апаратні витрати.
Передбачувана наукова новизна:
Новизною даної роботи є — реалізація підсистеми баз даних для розподіленого паралельного моделюючого середовища (РПМС), можливість застосування для цього різновидність баз даних з вільною структурою, семантичних баз даних, які можуть замінити поширену реляційну структуру баз даних, пошук оптимального співвідношення "продуктивності-витрати".
Ще одним напрямком робіт, який може внести новий аспект, це розгляд всього комплексу РПМС як «носій» баз даних. Аналіз зв'язків між підсистемами, що складають декомпозицію РПМС так само може внести новизну, так як методи інформаційної взаємодії можуть істотно відрізнятися.
Так само можлива інтеграція в загальну обчислювальну систему, що включає в себе кластер розташований в ДонНТУ, а також кластерів в обчислювальному центрі Штуттгартського університету (Німеччина).
Планові практичні результати:
Розроблена підсистема баз даних у структурі РПМС допоможе мінімізувати витрати на обробку інформаційних потоків у всьому моделюючому середовищі. Так само необхідна реалізація зв'язків з іншими розробниками, що здійснюють дослідження РПМС, для комплексної роботи та інтеграції всієї системи.
Огляд досліджень та розробок по темі:
Локальний пошук (по матеріалами викладачів, аспірантів і магістрантів ДонНТУ). Розглядом проблем, пов'язаних з реалізацією розподілених паралельних моделюючих середовищ і баз даних, займалися:
Фельдман Л.П., Святний В.А. , Аноприенко О.Я., Молдованова О.В., Солонін О.М., Надєєв Д.В.
Розрабками в цьому напрямку також занймалися магістри ДонНТУ: Войтов А.В., Войтенко А.В., Степанов І.С., Скворцов П.В., Назаренко К.С., Зима К.М., Ронсаль Є.Є.
При пошуку розробок по даній темі на національному рівні були знайдені наступні автори:
Томашевський В.Н., Жданова Є.Г., Жолдаков А.А., які в своїх работах розглядають практичні задачі комп'ютерного моделювання (у т.ч. СДС).
На світовому рівні знайдені наступні автори з публікаціями за темою зв'язаною з випускною роботою:
Фельдман Л.П., Святний В.А., Реш М. (нем. M. Resch), Цайтц М. (нем. M.Zeitz), К. Дж. Дейт, Rajive Bagrodia, Richard Meyer, Mineo Takai, Yu-an Chen, Xiang Zeng, Jay Martin та інщі.
Описання розподіленого паралельного моделюючого середовища (РПМС):
Ще в 1992 році, в рамках наукового співробітництва факультету ОТІ (нині КНТ) ДонНТУ та інституту паралельних та розподілених систем (IPVS) Штуттгартського університету (Німеччина), була запропонована основна концепція розподіленого паралельного моделюючого середовища для складних динамічних систем з зосередженими (ДСЗП) та розподіленими параметрами (ДСРП). Ця концепція була викладена в доповіді на ASIM-симпозіумі в 1994 [1] і була далі розвинута в роботах [2, 3] та інш.
РПМС являє собою таку системну організацію спільного функціонування паралельних апаратних ресурсів, системного та моделюючого програмного забезпечення, яка підтримує всі етапи розробки, реалізації та використання паралельних моделей складних динамічних систем [2].
Розроблені зразки РПМС будувалися на основі доступу до паралельних ресурсів Штуттгартского університету. За цей період було придбано практичний досвід реалізації паралельних моделей на системах MasPar (16K процесорних елементів), Intel Paragon, CRAY T3E. З січня 2005 РПМС підключена до ресурсів системи NEC SX8 (576 вузлів). Сьогодні існує можливість тестування РПМС на кластері, розташованому в 4-му навчальному корпусі ДонНТУ.
РПМС відповідає концептуальній структурі, що показана на рисунку 1.
Рисунок 1 — Структура РПМС
Грунтуючись на структурі РПМС, зображеної на рисунку 1, можна здійснити декомпозицію на наступні підсистеми, згідно функцій покладених на них [3]:
1. Підсистема діалогу — використовується для відображення та презентації РПМС. Вона здійснює діалог і навчання розробника та користувача, а також взаємодію з усіма ресурсами середовища. До того ж проводиться узгодження завдань симулювання, планування та управління цим процесом.
2. Підсистема топологічного аналізу — виконує вербальне та графічне описання кодування для первинних топологій. Потім проводиться декомпозиція і апроксимація отриманих вторинних топологій, формування актуальних векторів і матриць, перетворення топологічних даних у форму, придатну для генерування рівнянь і на завершення — передача результатів аналізу топології.
3. Підсистема генерування рівнянь — здійснює комунікацію з підсистемою топологічного аналізу, перетворення результатів її роботи в векторно-матричний вигляд. Потім система виконує генерування дискретних моделей симулювання для вирішення засобами, які має в своєму розпорядженні середовище. Наприкінці проводиться візуалізація результатів.
4. Підсистема віртуальних паралельних симуляційних моделей — надає засоби для інтерактивного відображення ієрархії віртуальних паралельних симуляційних моделей в залежності від можливих варіантів розпаралелювання. Топології, створені в підсистемі топологічного аналізу, приводяться у відповідність рівням віртуальної паралельної симуляційної моделі, здійснюється формування систем рівнянь для всіх рівнів моделі, а потім інтерактивна підготовка способів реалізації дискретної віртуальної паралельної симуляційної моделі.
5. Підсистема паралельного розв'язання рівнянь — виконується взаємодія з підсистемами топологічного аналізу та віртуальної паралельної симуляційної моделі. Саме тут обчислюється рішення систем рівнянь за допомогою паралельних бібліотек, визначення збіжності, стабільності, точності, оптимізація змінних параметрів, а також перетворення результатів розв’язання для наочного подання.
6. Підсистема обміну даними — включає список компонент і ресурсів РПМС. Виконує обмін даними по запиту від компонент, відображення потоків даних за ініціативою користувача. Надається можливість оптимізації паралельної програми за допомогою операцій обміну.
7. Підсистема балансування навантаження — визначення і керування рівнем навантаження між віртуальними процесами і процесорами. Можливий порівняльний аналіз підходів розпаралелювання за критеріями розподілу навантаження.
8. Підсистема візуалізації — інтеграція з підсистемою діалогу (GUI) і підсистемою розв’язання рівнянь. Виконується підготовка результатів симуляції для візуалізації, інтерактивне відображення графіків під час і після проведення симуляції.
9. Підсистема баз даних — взаємодіє з усіма підсистемами і зберігає всю можливу інформацію про середовище:
- дані про ПЗ;
- апаратну архітектуру;
- дані користувача;
- дані про моделювання та перетворення;
- дані про тести, заплановані експерименти;
- архівація результатів.
10. Підсистема IT-підтримки — організація розподілених обчислювальних, комунікаційних і симуляційних ресурсів згідно з технологіями сучасних мереж. Функціонування схеми «WEB-клієнт (розробник моделі) — WEB-сервер — PARSIMULATOR (паралельний симулятор)» та «WEB-клієнт (розробник моделі) — WEB-сервер — DATABASE (сервер баз даних)».
Загальна структура апаратного забезпечення РПМС представлена на рисунку 2.
Рисунок 2 — Апаратне забезпечення РПМС
Розробка підсистеми баз даних:
Можна виділити основні завдання проектування:
- Забезпечення зберігання в БД всієї необхідної інформації.
- Забезпечення можливості одержання і обміну даними по всім необхідним запитам.
- Мінімізація надлишковості та дублювання даних.
- Забезпечення цілісності даних (правильності їх змісту): виключення суперечностей у змісті даних, виключення їх втрати і т.д.
- Інтеграція з іншими підсистемами.
У загальному вигляді основні етапи проектування баз даних можна розділити на наступні пункти [5]:
1. Концептуальне (інфологічне) проектування — побудова формалізованої моделі предметної області. Така модель будується з використанням стандартних мовних чи графічних засобів. Така модель будується без орієнтації на якусь конкретну СКБД.
Основні елементи даної моделі:
- Опис об'єктів предметної області та зв'язків між ними.
- Опис інформаційних потреб користувачів (опис основних запитів до БД).
- Опис документообігу. Опис документів, що використовуються як вихідні дані для БД і документів, що складаються на основі БД.
- Опис алгоритмічних залежностей між даними.
- Опис обмежень цілісності, тобто вимог до допустимих значень даних і до зв'язків між ними.
На етапі інфологічного проектування в ході збору інформації про предметну область потрібно з'ясувати:
- основні об'єкти предметної області (об'єкти, про яких повинна зберігатися інформація в БД);
- атрибути об'єктів;
- зв'язки між об'єктами;
- основні запити до БД.
2. Логічне (даталогічне) проектування — відображення інфологічної моделі на модель даних, яка використовується у конкретній СКБД, наприклад на реляційну модель даних. Для реляційних СКБД даталогічна модель — набір таблиць, звичайно з зазначенням ключових полів, зв'язків між таблицями. Цей етап може бути в значній мірі автоматизований.
3. Фізичне проектування — реалізація даталогічної моделі засобами конкретної СКБД, а також вибір рішень, пов'язаних з фізичним середовищем зберігання даних: вибір методів управління дисковою пам'яттю, методів доступу до даних, методів стиснення даних і т.д. — Ці завдання вирішуються в основному засобами СКБД і приховані від розробника БД.
Висновки:
Запропонована концепція розподіленого паралельного моделюючого середовища як форми системної організації засобів моделювання ДСЗП і ДСРП відкриває позитивні перспективи ефективного використання наявних сучасних паралельних обчислювальних ресурсів та комплексного вирішення проблеми [4].
Важливу роль у комплексному функціонуванні РПМС грає підсистема баз даних, так як вона оперує всіма даними системи, які необхідно обробляти або аналізувати. Таким чином, дослідження і розробка цієї підсистеми — це ще один крок постійного розвитку РПМС і систем моделювання в цілому.
Робота ще знаходиться в стадії розробки, дослідження буде продовжено, з їх результатами можна буде ознайомитися у грудні 2010 року.
Список літератури:
1. Anoprienko A.J., Svjatnyj V.A., Braunl T., Reuter A., Zeitz M.: Massiv parallele Simulationsumgebung fur dynamische Systeme mit konzentrierten und verteilten Parametern. 9. Symposium ASIM’94, Tagungsband, Vieweg, 1994, S. 183-188.
2. Святний В.А. Паралельне моделювання складних динамічних систем // Моделирование — 2006: Международная конференция. Киев, 2006 г. — Киев, 2006. — С. 83–90.
3. Forschungsgebiet: parallele Simulationstechnik [Електронний ресурс] / L. P. Feldmann, V. A. Svjatnyj, M. Resch, M. Zeitz — Електрон. даны — Режим доступу: http://www.nbuv.gov.ua/portal/natural/Npdntu/Pm/2008/08flpfps.pdf, вільний. — Загл. з екрану.
4. Стан та перспективи розробок паралельних моделюючих середовищ для складних динамічних систем з розподіленими та зосередженими параметрами [Електронний ресурс] / В.А Святний, О.В. Молдованова, А.М. Чут // «Паралельне моделювання 2008» — Електрон. даны — Режим доступу: http://www.nbuv.gov.ua/portal/natural/Npdntu/2008/ikot/08svasgt.pdf , вільний. — Загл. з екрану.
5. Введение в базы данных [Електронний ресурс] / Ю. А. Зеленков — Електрон. даны — Режим доступу: http://mstu.edu.ru/education/materials/zelenkov/ch_5_1.htm , вільний. — Загл. з екрану.
6. Аноприенко А. Я., Святный В. А. Универсальные моделирующие среды // Сборник трудов факультета вычислительной техники и информатики. Вып.1. — Донецк: ДонГТУ. — 1996. — С. 8-23.
7. Автореферат магистерской работы по теме «Разработка параллельного MIMD-симулятора, 2 уровень распараллеливания» [Електронний ресурс] / А.В. Войтов — Електрон. даны — Режим доступу: http://masters.donntu.ru/2009/fvti/voitov/diss/index.htm, вільний. — Загл. з екрану.
8. Розподілене паралельне моделююче середовище [Електронний ресурс] / И.С. Степанов — Електрон. даны — Режим доступу: http://masters.donntu.ru/2001/fvti/stepanov/thesis/index.htm, вільний. — Загл. з екрану.
9. Разработка и исследование решателя уравнений параллельной моделирующей среды на основе OpenMP-стандарта [Електронний ресурс] / П.В. Скворцов — Електрон. даны — Режим доступу: http://www.masters.donntu.ru/2007/fvti/skvortsov/diss/index.htm, вільний. — Загл. з екрану.
10. Parsec: A Parallel Simulation Environment for Complex Systems [Електронний ресурс] / Rajive Bagrodia, Richard Meyer, Mineo Takai, Yu-an Chen, Xiang Zeng, Jay Martin, Ha Yoon Song — Електрон. даны — Режим доступу: http://scalable-networks.com/pdf/parsec.pdf, вільний. — Загл. з екрану.
11. Дейт, К. Дж. Введение в системы баз данных, 8-е издание.: Пер. с англ. — М.: Издательский дом "Вильяме", 2005. — 1328 с.: ил. — Парал. тит. англ.