Решение
задачи
построения изоповерхностей на базе CPU и GPU
Титаренко
К.К.
рук.
Бабков В.С.
Источники
исходных данных
![slide.tif](slae1.gif)
Математическая
постановка задачи
![](slae2.jpg)
Обеспечение
нетривиальности решения
![](slae3.jpg)
Методы
решения СЛАУ
Рассматриваемые:
• прямые:
LDLT
• итерационные:
Якоби
Реализации:
• LDLT-CPU
• LDLT-CPU-MT
• LDLT-CUDA
• LDLT-CUDA-2
•
JACOBI-CUDA
Кратко
о CUDA
![Безымянный.png](slae4.jpg)
LDLT-CUDA, LDLT-CUDA-2
![](slae5.gif)
LDLT-CUDA-2: хронология использования GPU
![ldlt_cuda_2_chronology.png](slae6.jpg)
LDLT-CUDA, LDLT-CPU
![](slae7.gif)
LDLT-CUDA: хронология использования GPU
![ldlt_cuda_2_chronology.png](slae8.jpg)
LDLT-CPU, JACOBI-CUDA
![](slae9.gif)
LDLT-CPU, JACOBI-CUDA
![](slae10.gif)
Выигрыш
в производительности (в разах) при использовании JACOBI-CUDA над LDLT-CPU
![](slae11.gif)
Максимальная
ошибка
![](slae12.gif)
Выводы
Эффективная реализация
возможна:
•
GPU: итерационные методы
•
CPU: прямые методы
Стоит рассмотреть:
•
Возможные модификации исходной СЛАУ
•
Итерационные методы, для которых выполняются условия сходимости
для исходной СЛАУ