Коммуникационно-зависимое балансировки нагрузки для параллельных приложений на кластерах

Xiao Qin, Hong Jiangy, Adam Manzanaresz, Xiaojun Ruan, Shu Yinyy

Перевод с английского: Щигров Д.С.



Оценка производительности

Для оценки эффективности предлагаемой схемы балансировки, мы провели обширные трассирующие моделирования. В этом разделе описывается наша имитационная модель, условия нагрузки и показатели эффективности.
32-узловой кластер был смоделирован в различных условиях нагрузки. Прежде чем представить показатели производительности в деталях, мы кратко опишем имитационную модель в первую очередь. Для изучения динамической балансировки нагрузки, Хархол-Балтер и Дауни [13] реализовали симулятор распределенной системы с шестью узлами, где изучается политика балансировки загрузки на основе CPU. Жанг и др..[31] расширили, включив симулятор памяти ресурсов. Мы добавили новые возможности для этого симулятора. Во-первых, новая коммуникационная схема балансировки. Во-вторых, полностью подключены сети моделирования и размер кластера моделирования является переменным. Моделирующийся кластер настраивается с помощью различных параметров, перечисленных в таблице 1. Параметры процессора, памяти, диска и сети соединения выбирается  таким образом, что они напоминают типичные узлы кластера.
Понятно, что производительность кластера системы зависит от нагрузки приложенной к системе. Таким образом, разработка реалистичной нагрузки играет важную роль в нашей оценке эффективности. Для оценки эффективности воздействия коммуникационной схемы балансировки нагрузки, необходимо экстраполировать следы от тех, в работе [12] [30]. Следует отметить, что оригинальные следы получаются путем записи информации о представлении одной станции через разные промежутки времени [13]. В частности, следы в наших экспериментах, состоят из времени прибытия, узла прибытия, востребованного размера памяти, время работы, I / O скорость доступа, средний размер данных ввода / вывода , скорость поступления сообщений, средний размер сообщения, а также количество задач, в каждой параллельной работе. Для имитации многопользовательской среды с разделением времени, следы должны содержать набор параллельных задач. Для общности, рассмотрим сначала неполный синхронный стиль связи (см. раздел 3), где временной интервал между двумя последовательными фазами синхронизации определяется по скорости прибытия сообщения. Результаты эксперимента, сообщенные в разделе 6.5 подтверждают наш аргумент, что коммуникационная схема нагрузки может применяется приложений с интенсивным использованием коммуникаций с различными коммуникационными моделями.
Для работ, которые содержат требования к коммуникации, сообщения, выдаваемые по каждой задаче, моделируется как процесс Пуассона и имеют среднюю скорость прибытия . Размер сообщения генерируется случайным образом в соответствии с гамма-распределением со средним размером 512 Кбайт, которое отражает типичные данные для многих приложений, таких как рендеринг перспективы3D [16].Длительности и запросы памяти работ определены в файлах трассировки, а также требование коммуникации каждого задания является случайным. Хотя это упрощение ослабляет любую корреляцию между коммуникационными потребностями и других рабочими характеристиками, мы еще в состоянии управлять коммуникационными запросами в качестве входного параметра и изучить влияние изменения интенсивности коммуникаций на производительность системы (см. разделы 6.1 и 6.3). Для проверки результатов на основе синтетических параллельных приложений, мы промоделируем пять реальных научных приложений [8], которые имеют различные вычисления, память, дисковые операции ввода / вывода и коммуникационные потребности (см. раздел 6.5).
Цель предложенной схемы балансировки - улучшение выполнения работы, на представленных местах как таковых. Нам нужно выбрать хорошие показатели, чтобы интуитивно оценить скорость работы задач, выполняемых на кластере. Первый показатель нашей схемы- время обработки разворота. Время обработки разворота, это время, которое прошло от передачи заявки до ее выполнения. Время обработки разворота является естественным показателем производительности, т.к. оно способно отражать пользователю явное время выполнения заявки.
Вторым важным показателем производительности является замедление. Замедление параллельной работы на  невыделенном кластере является широко используемым показателем производительности[13]. Замедление работы определяется по формуле: Sp=T’p/Tp, где T’p является временем разворота задачи в среде с разделенными ресурсами, а Тр время разворота в той же системе, но без совместного использования ресурсов. Обратите внимание, что ТР может быть оценена либо с помощью (3) (см. раздел 3) или в автономном режиме с несколькими входами, а T’p может быть измерен во время выполнения.

Ссылки