Факультет: Компьютерных наук и технологий
Специальность: Системное программирование
Тема выпускной работы: Разработка и организация подсистемы баз данных распределенной параллельной моделирующей среды (РПМС)
Руководитель:
профессор, д.т.н. Святный В.А.
Реферат по теме выпускной работы
Разработка и организация подсистемы баз данных распределенной параллельной моделирующей среды (РПМС)
Введение:
Наука и технологии не стоят на месте — они стремительно развиваются во всех областях человеческой деятельности. При этом почти любая разработка или исследование нуждаются в экспериментальном подтверждении своих результатов. Часто технически невозможно или не целесообразно проводить эксперименты. В этом случае необходимо построение модели и моделирование в определенной среде.
Многие области науки и техники достигли уже такого уровня развития, что обычные однопоточные моделирующие среды не могут справиться с временными или детализирующими требованиями моделирования.
Таким образом — необходимо внедрение новых методов моделирования и построения моделирующих сред. Одной из систем, которая выполняет большинство технологических запросов, является — Распределенная параллельная моделирующая среда (РПМС).
Цели и задачи исследования:
Целью данной магистерской работы является разработка и организация подсистемы баз данных распределённой параллельной моделирующей среды (РПМС).
Данная проблема требует анализа и всестороннего рассмотрения, а также решения следующих задач:
- Анализ РПМС, её декомпозиция на подсистемы.
- Определение функций, особенностей подсистемы баз данных РПМС.
- Разработка и исследования структуры подсистемы баз данных.
- Интеграция подсистемы баз данных с другими подсистемами.
- Имплементация проекта.
- Экспериментальное исследование.
Актуальность:
Решение задач моделирования и симуляции сложных динамических объектов является сложным процессом, который при использовании обычных последовательных (не параллельных) методов, часто приводит к неприемлемым временным затратам. Таким образом, необходимо прибегнуть к применению иных методов для уменьшения времени моделирования, что возможно достичь благодаря параллельным моделирующим средам.
Разработки и исследования в области распределенных параллельных моделирующих сред являются актуальными в данный момент. Исследованиями и модернизацией РПМС в данный момент всесторонне занимается большое число исследователей (разработчиков). Проведенная декомпозиция РПМС на подсистемы помогает разделить все исследования на независимые направление, которые все преследуют общую цель — разработку РПМС.
При увеличении сложности модели — резко возрастает объем информации, подлежащей обмену, хранению или обработке. По этому операции с информацией — это весьма важная составляющая общей структуры РПМС и именно подсистема баз данных отвечает за это направление работы. Следовательно — разработка и организация подсистемы баз данных в РПМС является актуальной и необходимой задачей, что позволит оптимизировать операции связанные с информацией, минимизировать временные и аппаратные затраты.
Предполагаемая научная новизна:
Новизной данной работы является — реализация подсистемы баз данных для распределённой параллельной моделирующей среды, возможность применения для этого разновидность баз данных со свободной структурой, семантических баз данных, которые могут заменить распространенную реляционную структуру баз данных, а также поиск оптимального соотношения "производительность-затраты".
Еще одним направлением работ, которое могжет внести новый аспект — это рассмотрение всего комплекса РПМС как «носитель» баз данных. Анализ связей между подсистемами образующими декомпозицию РПМС так же может внести новизну, так как методы информационного взаимодействия могут существенно различаться.
Так же возможна интеграция в общую вычислительную систему, включающую в себя кластер расположенный в ДонНТУ, а также кластера в вычислительном центре Штуттгартского университета (Германия).
Планируемые практические результаты:
Разработанная подсистема баз данных в структуре РПМС поможет минимизировать затраты на обработку информационных потоков во всей моделирующей среде. Так же необходима реализация связей с другими разработчиками, осуществляющими исследования РПМС, для комплексной работы и интеграции всей системы.
Обзор исследований и разработок по теме:
Локальный поиск (по материалам преподавателей, аспирантов и магистрантов ДонНТУ). Рассмотрением проблем, связанных с реализацией распределённых параллельных моделирующих сред и баз данных, занимались:
Фельдман Л.П., Святный В.А. , Аноприенко А.Я., Молдованова О.В., Солонин А.М., Надеев Д.В.
Разработками в этом направлении также занимались магистры ДонНТУ: Войтов А.В., Войтенко А.В., Степанов И.С., Скворцов П.В., Назаренко К.С., Зима К.М., Ронсаль Е.Е.
При поиске разработок по данной теме на национальном уровне были найдены следующие авторы:
Томашевский В.Н., Жданова Е.Г., Жолдаков А.А., которые в своих работах рассматривают практические задачи компьютерного моделирования (в т.ч. СДС).
На мировом уровне найдены следующие авторы с публикациями по теме выпускной работы:
Фельдман Л.П., Святный В.А., Реш М. (нем. M. Resch), Цайтц М. (нем. M.Zeitz), К. Дж. Дейт, Rajive Bagrodia, Richard Meyer, Mineo Takai, Yu-an Chen, Xiang Zeng, Jay Martin и другие.
Описание распределенной параллельной моделирующей среды (РПМС):
Еще в 1992 году, в рамках научного сотрудничества факультета ВТИ (ныне КНТ) ДонНТУ и института параллельных и распределенных систем (IPVS) Штуттгартского университета (Германия), была предложена основная концепция распределенной параллельной моделирующей среды для сложных динамических систем с сосредоточенными (ДССП) и распределенными параметрами (ДСРП). Эта концепция была изложена в докладе на ASIM-симпозиуме в 1994 [1] и была дальше развита в работах [2, 3] и др.
РПМС представляет собой такую системную организацию совместного функционирования параллельных аппаратных ресурсов, системного и моделирующего программного обеспечения, которая поддерживает все этапы разработки, реализации и использования параллельных моделей сложных динамических систем [2].
Разрабатываемые образцы РПМС строились на основе доступа к параллельным ресурсам Штуттгартского университета. За этот период был приобретен практический опыт реализации параллельных моделей на системах MasPar (16K процессорных элементов), Intel Paragon, CRAY T3E. С января 2005 года РПМС подключена к ресурсам системы NEC SX8 (576 узлов). Сегодня существует перспектива тестирования РПМС на кластере, расположенном в 4-м учебном корпусе ДонНТУ.
РПМС отвечает концептуальной структуре, показанной на рисунке 1.
Рисунок 1 — Структура РПМС
Основываясь на структуре РПМС, изображенной на рисунке 1, можно произвести декомпозицию на следующие подсистемы, согласно функций возложенных на них [3]:
1. Подсистема диалога — используется для отображения и презентации РПМС. Она осуществляет диалог и обучение разработчика и пользователя, а также взаимодействие со всеми ресурсами среды. К тому же производится согласование задач симулирования, планирования и управления этим процессом.
2. Подсистема топологического анализа — выполняет вербальное и графическое описание кодировки для первичных топологий. Затем производится декомпозиция и аппроксимация полученных вторичных топологий, формирование актуальных векторов и матриц, преобразование топологических данных в форму, пригодную для генерирования уравнений и в завершение — передача результатов анализа топологии.
3. Подсистема генерирования уравнений — осуществляет коммуникацию с подсистемой топологического анализа, преобразование результатов ее работы в векторно-матричный вид. Затем выполняет генерирование дискретных моделей симулирования для решения средствами, которыми располагает среда. В конце проводится визуализация результатов.
4. Подсистема виртуальных параллельных симуляционных моделей — предоставляет средства для интерактивного отображения иерархии виртуальных параллельных симуляционных моделей в зависимости от возможных вариантов распараллеливания. Топологии, созданные в подсистеме топологического анализа, приводятся в соответствие уровням виртуальной параллельной симуляционной модели, производится формирование систем уравнений для всех уровней модели, а затем интерактивная подготовка способов реализации дискретной виртуальной параллельной симуляционной модели.
5. Подсистема параллельного решения уравнений — выполняется взаимодействие с подсистемами топологического анализа и виртуальной параллельной симуляционной модели. Именно здесь производится решение систем уравнений с помощью параллельных библиотек, определение сходимости, стабильности, точности, оптимизация варьируемых параметров, а также преобразование результатов решения для наглядного представления.
6. Подсистема обмена данными — включает список компонент и ресурсов РПМС. Выполняет обмен данными по запросу от компонент, отображение потоков данных по инициативе пользователя. Возможность оптимизации параллельной программы с помощью операций обмена.
7. Система балансировки нагрузки — определение и управление уровнем нагрузки между виртуальными процессами и процессорами. Возможен сравнительный анализ подходов распараллеливания по критериям распределения нагрузки.
8. Подсистема визуализации — интеграция с подсистемой диалога (GUI) и подсистемой решения уравнений. Выполняется подготовка результатов симуляции для визуализации, интерактивное отображение графиков во время и после проведения симуляции.
9. Подсистема баз данных — взаимодействует со всеми подсистемами и хранит всю возможную информацию о среде:
- данные о ПО;
- аппаратную архитектуру;
- пользовательские данные;
- данные о моделировании и преобразованиях;
- данные о тестах, запланированных экспериментах;
- архивация результатов.
10. Подсистема IT-поддержки — организация распределенных вычислительных, коммуникационных и симуляционных ресурсов согласно технологиям современных сетей. Удаленное WEB-базированное приложение для моделирования. Функционирование цепей «WEB-клиент (разработчик модели) — WEB-сервер — PARSIMULATOR (параллельный симулятор)» и «WEB-клиент (разработчик модели) — WEB-сервер — DATABASE (сервер баз данных)».
Общая схема взаимодействия аппаратного обеспечения РПМС представлена на рисунке 2.
Рисунок 2 — Cхема взаимодействия аппаратного обеспечения РПМС (анимация, 184 Кб, 4 кадра, задержка 1 сек, воспроизведение циклическое, создано с помощью MP Gif Animator )
Разработка подсистемы баз данных:
Можно выделить основные задачи проектирования:
- Обеспечение хранения в БД всей необходимой информации.
- Обеспечение возможности получения и обмена данными по всем необходимым запросам.
- Сокращение избыточности и дублирования данных.
- Обеспечение целостности данных (правильности их содержания): исключение противоречий в содержании данных, исключение их потери и т.д.
- Интеграция с другими подсистемами.
В общем виде основные этапы проектирования баз данных можно разделить на следующие пункты [5]:
1. Концептуальное (инфологическое) проектирование — построение формализованной модели предметной области. Такая модель строится с использованием стандартных языковых или графических средств. Такая модель строится без ориентации на какую-либо конкретную СУБД.
Основные элементы данной модели:
- Описание объектов предметной области и связей между ними.
- Описание информационных потребностей пользователей (описание основных запросов к БД).
- Описание документооборота. Описание документов, используемых как исходные данные для БД и документов, составляемых на основе БД.
- Описание алгоритмических зависимостей между данными.
- Описание ограничений целостности, т.е. требований к допустимым значениям данных и к связям между ними.
На этапе инфологического проектирования в ходе сбора информации о предметной области требуется выяснить:
- основные объекты предметной области (объекты, о которых должна храниться информация в БД);
- атрибуты объектов;
- связи между объектами;
- основные запросы к БД.
2. Логическое (даталогическое) проектирование — отображение инфологической модели на модель данных, используемую в конкретной СУБД, например на реляционную модель данных. Для реляционных СУБД даталогическая модель — набор таблиц, обычно с указанием ключевых полей, связей между таблицами. Этот этап может быть в значительной степени автоматизирован.
3. Физическое проектирование — реализация даталогической модели средствами конкретной СУБД, а также выбор решений, связанных с физической средой хранения данных: выбор методов управления дисковой памятью, методов доступа к данным, методов сжатия данных и т.д. — эти задачи решаются в основном средствами СУБД и скрыты от разработчика БД.
Заключение:
Предложенная концепция распределенной параллельной моделирующей среды как формы системной организации средств моделирования ДССП и ДСРП открывает позитивные перспективы эффективного использования имеющихся современных параллельных вычислительных ресурсов и комплексного решения проблемы [4].
Немаловажную роль в комплексном функционировании РПМС играет подсистема баз данных, так как она оперирует всеми данными системы, которые необходимо обрабатывать или анализировать. Таким образом, исследование и разработка этой подсистемы — это еще один шаг постоянного развития РПМС и систем моделирования в целом.
Работа находится в стадии разработки, исследования будут продолжаться, с их результатом можно будет ознакомиться в декабре 2010 года.
Список использованной литературы:
1. Anoprienko A.J., Svjatnyj V.A., Braunl T., Reuter A., Zeitz M.: Massiv parallele Simulationsumgebung fur dynamische Systeme mit konzentrierten und verteilten Parametern. 9. Symposium ASIM’94, Tagungsband, Vieweg, 1994, S. 183-188.
2. Святний В.А. Паралельне моделювання складних динамічних систем // Моделирование — 2006: Международная конференция. Киев, 2006 г. — Киев, 2006. — С. 83–90.
3. Forschungsgebiet: parallele Simulationstechnik [Электронный ресурс] / L. P. Feldmann, V. A. Svjatnyj, M. Resch, M. Zeitz — Электрон. дан. — Режим доступа: http://www.nbuv.gov.ua/portal/natural/Npdntu/Pm/2008/08flpfps.pdf, свободный. — Загл. с экрана.
4. Стан та перспективи розробок паралельних моделюючих середовищ для складних динамічних систем з розподіленими та зосередженими параметрами [Электронный ресурс] / В.А Святний, О.В. Молдованова, А.М. Чут // «Паралельне моделювання 2008» — Электрон. дан. — Режим доступа: http://www.nbuv.gov.ua/portal/natural/Npdntu/2008/ikot/08svasgt.pdf , свободный. — Загл. с экрана.
5. Введение в базы данных [Электронный ресурс] / Ю. А. Зеленков — Электрон. дан. — Режим доступа: http://mstu.edu.ru/education/materials/zelenkov/ch_5_1.htm , свободный. — Загл. с экрана.
6. Аноприенко А. Я., Святный В. А. Универсальные моделирующие среды // Сборник трудов факультета вычислительной техники и информатики. Вып.1. — Донецк: ДонГТУ. — 1996. — С. 8-23.
7. Автореферат магистерской работы по теме «Разработка параллельного MIMD-симулятора, 2 уровень распараллеливания» [Электронный ресурс] / А.В. Войтов — Электрон. дан. — Режим доступа: http://masters.donntu.ru/2009/fvti/voitov/diss/index.htm, свободный. — Загл. с экрана.
8. Розподілене паралельне моделююче середовище [Электронный ресурс] / И.С. Степанов — Электрон. дан. — Режим доступа: http://masters.donntu.ru/2001/fvti/stepanov/thesis/index.htm, свободный. — Загл. с экрана.
9. Разработка и исследование решателя уравнений параллельной моделирующей среды на основе OpenMP-стандарта [Электронный ресурс] / П.В. Скворцов — Электрон. дан. — Режим доступа: http://www.masters.donntu.ru/2007/fvti/skvortsov/diss/index.htm, свободный. — Загл. с экрана.
10. Parsec: A Parallel Simulation Environment for Complex Systems [Электронный ресурс] / Rajive Bagrodia, Richard Meyer, Mineo Takai, Yu-an Chen, Xiang Zeng, Jay Martin, Ha Yoon Song — Электрон. дан. — Режим доступа: http://scalable-networks.com/pdf/parsec.pdf, свободный. — Загл. с экрана.
11. Дейт, К. Дж. Введение в системы баз данных, 8-е издание.: Пер. с англ. — М.: Издательский дом "Вильяме", 2005. — 1328 с.: ил. — Парал. тит. англ.