
Щеглов Максим Игоревич
Факультет: Вычислительной техники и информатики
Специальность: Программное обеспечение автоматизированных систем
Тема магистерской диссертации: "Анализ и оценка эффективности параллельных многошаговых блочных методов решения ОДУ на кластере"
Научный руководитель: Фельдман Лев Петрович профессор, д.т.н.
Библиотека
Автор: И.А. Назарова
Донецкий национальный технический университет
Украина, 83001, Донецк, ул. Артема, 66.
Повышение эффективности параллельного численного решения жестких задач на основе неявных блочных одношаговых методов
Abstract
Nazarova I.A. Rise of efficiency for parallel numerical decision of stiff tasks on basis implicit block one-step methods. In the article parallel block one-step methods with control of local error on the basis of extrapolations idea are discussed. The potential system and algorithm parallelism is exploited. Obtained algorithms are realized on parallel structures with ring, mesh and hypercube topolosrsy. The estimations of the execution time, acceleration and efficiency parallel solution are defined.
Введение
Исследование методов решения динамических задач с сосредоточенными параметрами показало, что параллельные свойства таких методов во многом определяются видом лежащей в их основе численной схемы. Наименее трудоемкими являются явные методы, однако присущие этим схемам недостатки, в частности условная устойчивость, существенно ограничивают область их применения. В этой связи значительный интерес представляют неявные схемы, которые, несмотря на большую вычислительную сложность, не имеют альтернативы среди одношаговых методов при решении жестких задач [1-6].
Данная статья посвящена разработке, обоснованию параллельных алгоритмов решения задачи Коши с встроенными способами оценки локальной погрешности на основе неявных одношаговых блочных многоточечных методов, а также построению и исследованию эффективности их отображений на реальные параллельные системы SIMD, MIMD-архитектуры и кластерные системы с распределенной памятью.
Параллельные одношаговые блочные методы с дублированием шага
Рассматривается численное решение задачи Коши, ассоциируемое с решением СОДУ первого порядка с известными начальными условиями:
(1)
(2)
(3)
Общее время последовательной реализации блочных методов с правилом Рунге состоит из суммы времени вычисления решения с одинарным шагом в блоке n плюс времена решения c половинным шагом в n -том и (n + 1)-вом блоках. Поскольку для получения каждого из трех решений реализуется свой итерационный процесс, введем следующие обозначения. Пусть Li,i = 1,3 − предельное количество итераций для нахождения аппроксимации решения ( 1 ) yn,i , ( 2 ) yn,i и ( 2 ) yn+1,i . Тогда, соответственно, текущее число итераций, обеспечивающее достаточную для каждой из данных задач точность, обозначим: li, li ≤ Li, i = 1,3 .
Параллельный блочный k -точечный метод с контролем локальной апостериорной погрешности по правилу Рунге использует максимальную степень параллелизма, равную Dop = k , то есть каждый процессор вычисляет решение в одном узле сетки. Для каждой из задач последовательно выполняются вычисления нулевой и последующих итераций. При этом нулевая итерация состоит из следующих шагов: вычисление нулевого приближения параллельно в каждом узле нового блока по первой формуле системы (3); вычисление правой части ОДУ от нулевого приближения; множественный обмен вычисленными значениями правой части по типу “все-всем”. Затем li раз выполняется аналогичная группа операций для последующих итераций:
1) вычисление очередного приближения в каждом узле нового блока по второй формуле (3), базовой операцией является умножение матрицы A на вектор значений правых частей ОДУ;
2) вычисление правой части ОДУ от полученного приближения и множественный обмен значениями правой части “все-всем”.
Потенциальные характеристики параллелизма предложенного метода можно оценить по числу обращений к правой части ОДУ. При TF » top : S pot ≈ k; Epot ≈ Spot / p ≈1, то есть имеет место практически линейное ускорение и единичная эффективность. Такие же потенциальные характеристики могут быть получены и в случае, когда правая часть по времени вычисления соизмерима со временем выполнения одной операции с плавающей точкой. Анализ теоретического выполнения и вычислительный эксперимент показывают, что для выполнения групповых обменных операций в предложенном алгоритме эффективными являются топологии гиперкуб и тор (рис. 1), худший вариант соединения процессоров – кольцо.
Кроме топологии соединения, на величину времени межпроцессорных обменов и динамические характеристики параллелизма существенное влияние оказывают тип параллельной архитектуры и определяемые им машинно-зависимые константы обмена, такие, как латентность и время передачи одного слова (рис. 2).
Заметим, что с ростом величины латентности коммуникационной среды время на реализацию обменов увеличивается, а ускорение и эффективность алгоритма уменьшаются. Из временных характеристик алгоритма и исходной задачи качество параллелизма наиболее чувствительно к необходимому объему вычислений на реализацию правой части (1) и количеству точек в одном блоке. Зависимости реальных коэффициентов ускорения и эффективности параллельного процесса контроля локальной погрешности на основе правила Рунге от числа точек блока при росте сложности правых частей ОДУ представлены с помощью графиков рис. 3 и 4.
Очевидно, чем сложнее правая часть ОДУ, тем лучше характеристики параллелизма и, одновременно, чем больше размерность блока, совпадающая с числом процессоров, тем больше ускорение и меньше эффективность рассматриваемого метода:
Таким образом, наилучшие характеристики параллелизма при решении нелинейной задачи Коши для одного уравнения блочными методами с контролем локальной погрешности по правилу Рунге достигаются для любых параллельных архитектур, большой размерности задачи, сложной правой части и высокоскоростных сетей передачи информации.
Технология локальной экстраполяции на основе одношаговых блочных методов для ОДУ
Реализация технологии локальной
экстраполяции Ричардсона для блочных методов
требует многократных вычислений на одном и
том же интервале интегрирования с
использованием опорного блочного k0 -точечного
метода порядка r0 на сгущающихся равномерных
сетках:
а) с шагом h1=h/n1
в N1 блоках;
б) с шагом h2 =h/ n2
в N2 блоках;
в) с шагом hk = h / nk в
Nk блоках, где k − число строк
экстраполяционной таблицы.
Базовый шаг интегрирования равен h1=h,
n1=1, то есть основой счета является сетка: Ωh .
Для генерации вспомогательных сеток выбирается
гармонический ряд P1 ={n2,...,nk ,...}={2,3,4,5,...},
как наименее затратный в случае опорного метода
произвольного типа. Блочный опорный метод
должен иметь малый порядок точности:
Заключение
Предложены и теоретически обоснованы новые параллельные методы оценки локальной апостериорной погрешности численного решения жестких задач Коши для одного дифференциального уравнения на основе блочных неявных одношаговых разностных схем: блочный k -точечный метод с правилом дублирования шага и локальная экстраполяция с блочным опорным методом. Построены итерационные параллельные алгоритмы численного решения нелинейной разностной задачи Коши, позволяющие получать результаты с заданной степенью точности. Приведены сравнительные характеристики численного решения тестовых задач и оценки параллелизма. Решение тестовых задач показало, что экспериментальные оценки ускорения и эффективности близки к потенциальным. Исследована эффективность полученных вычислительных схем отображения параллельных алгоритмов на структуры ВС в зависимости от размерности СОДУ, количества процессоров, типа параллельной ВС (SIMD, MIMD и кластерные системы), латентности и времени передачи данных в сетях различных топологий. Перспективным направлением исследований является проведение сравнительного анализа эффективности неявных одношаговых методов решения общей задачи Коши на основе блочных k -точечных методов и традиционных методов интегрирования жестких задач одного и того же порядка точности и требований к устойивости.
Литература
- Дж. Холл, Дж. Уатт. Современные численные методы решения обыкновенных дифференциальных уравнений. - М.: Мир, 1979. – 312с.
- Хайрер Э., Нёрсет С., Ваннер. Г. Решение обыкновенных дифференциальных уравнений. Нежесткие задачи. - М.: - Мир, 1990.-512с.
- Хайрер Э., Ваннер. Г. Решение обыкновенных дифференциальных уравнений. Жесткие задачи. - М.: Мир, 1999.- 685с.
- Молчанов И.Н. Введение в алгоритмы параллельных вычислений. АН УССР, Инст. Кибернетики им. В.М. Глушкова. Киев: Наукова думка. 1990. -128с.
- Worland P.B. Parallel methods for the numerical solution of ordinary differential equations //IEEE Trans. Comp. C. – 25, 10(1976). – P.1045-1048.
- Молчанов И.Н. Введение в алгоритмы параллельных вычислений. – Киев: Наукова думка, 1990. – 128с.
- Фельдман Л.П. Сходимость и оценка погрешности параллельных одношаговых блочных методов моделирования динамических систем с сосредоточенными параметрами // Научн. тр. ДонГТУ. Серия: Iнформатика, кiбернетика та обчислювальна технiка, выпуск 15:- Донецк: -ДонГТУ,2000, С. 34-39.
- Фельдман Л.П. Сходимость и оценка погрешности параллельных одношаговых блочных методов моделирования динамических систем с сосредоточенными параметрами // Наукові праці ДонДТУ. Серія: Iнформатика, кiбернетика та обчислювальна технiка, випуск 15, Донецьк: ДонДТУ, 2000. – С.34-39.
- Фельдман Л.П., Дмитриева. О.А. Разработка и обоснование параллельных блочных методов решения обыкновенных дифференциальных уравнений на SIMD-структурах // Наукові праці ДонДТУ. Серія: Проблеми моделювання та автоматизації проектування динамічних систем, випуск 29:-Донецьк: ДонДТУ, 2001. – С.70-79.
- Feldman L., Dmitriewa O.A., Gerber S. Abbildung der blockartigen Algoritmen auf die Parallelrechnerarchitekture / Simulationstechnik, 17. Symposium in Magdeburg, Sept. 2003: SCS-Europe BVBA (ISBN 3-936150-27-3), Magdeburg, Germany, 2003. – P.359-364.
- Feldman L., Svjatnyj V., Dmitriewa O.A. Stabilitat von parallelen Simulationsverfahren fur dynamische Systeme mit konzentrierten Parametern / Simulationstechnik, 17. Symposium in Magdeburg, Sept. 2003: SCS-Europe BVBA (ISBN 3-936150-27-3), Magdeburg, Germany, 2003. – P.105-110.
- Фельдман Л.П. Общие линейные блочные многошаговые методы решения //Наукові праці ДонНТУ. Серія: Інформатика,кібернетика і обчислювальна техніка, випуск 8(120): – Донецьк: ДонНТУ, 2007. – C.282-297.
- Фельдман Л.П., Назарова И.А. Параллельные алгоритмы численного решения задачи Коши для систем обыкновенных дифференциальных уравнений // Математическое моделирование, том 18, №6, 2006. - С. 17-31.