Селютин А.В.
Донецкий национальный технический университет.
Проблематика построения кластерных систем.
Тезисы доклада на IV международной научной конференции студентов, аспирантов и молодых учёных "Компьютерный мониторинг и информационные технологии", Донецк, ДонНТУ, 14 мая 2008 г.


Проблематика построения кластерных систем

Впервые в классификации вычислительных систем термин "кластер" определила компания Digital Equipment Corporation (DEC). По определению DEC, кластер - это группа вычислительных машин, которые связаны между собою и функционируют как один узел обработки информации.

Требования для построения кластерных систем, следующие: высокая готовность, высокое быстродействие, общий доступ к ресурсам, масштабирование, удобство обслуживания.

В общем случае кластер функционирует как мультипроцессорная система. В рамках программно-аппаратных ресурсов различают три основных вида мультипроцессорных систем: тесно связанные, умеренно связанные, слабо связанные.

По функциональной классификации кластеры можно разделить на "Высокоскоростные системы" (High Performance, HP), "Системы высокой готовности" (High Availability, HA), а также "Смешанные системы".

Рис. 1. Высокоскоростная система (HP)

Рис. 1. Высокоскоростная система (HP)

HP системы (рис. 1) используются для задач, которые требуют значительной вычислительной мощности. Классическими областями, в которых используются подобные системы, являются: обработка изображений (рендеринг, распознавание образов); научные исследования (физика, биоинформатика, биохимия, биофизика); промышленность (геоинформационные задачи, математическое моделирование) и др.

Быстродействие High Performance кластерной системы определяется быстродействием узлов и связей между ними. Причем влияние скоростных параметров этих связей на общую производительность системы зависит от характера выполняемой задачи. Если задача требует частого обмена данными с подзадачами, тогда быстродействию коммуникационного интерфейса следует уделять максимум внимания. Естественно, чем меньше взаимодействуют части параллельной задачи между собою, тем меньше времени потребуется для ее выполнения, что диктует определенные требования также и на программирование параллельных задач.

Проблемы при обмене данными между подзадачами возникают из-за того, что быстродействие передачи данных между центральным процессором и оперативной памятью узла значительно превышает скоростные характеристики систем межкомпьютерного взаимодействия, а также разница в быстродействии кэш-памяти процессоров и межузловых коммуникаций.

Рис. 2. Система высокой готовности (HA) Рис. 3. Смешанная система


Рис. 2. Система высокой готовности (HA)


Рис. 3. Смешанная система

HA системы (рис. 2) используются везде, где стоимость возможного простоя превышает стоимость затрат, необходимых для построения кластерной системы, например: биллинговые системы, банковские операции, электронная коммерция, управление предприятием.

High Availability кластерная система является воплощением технологий, которые обеспечивают высокий уровень отказоустойчивости при самой низкой стоимости. Отказоустойчивость кластера обеспечивается дублированием всех жизненно важных компонент. Максимально отказоустойчивая система должна не иметь ни единой точки, то есть активного элемента, отказ которого может привести к потере функциональности системы. Такую характеристику, как правило, называют - NSPF (No Single Point of Failure, - отсутствие единой точки отказа).

При построении систем высокой готовности, главная цель - обеспечить минимальное время простоя. Для того чтобы система обладала высокими показатели готовности, необходимо:

  1. чтобы ее компоненты были максимально надежными;
  2. чтобы она была отказоустойчивая, желательно, чтобы не имела точек отказов, а также важно;
  3. чтобы она была удобна в обслуживании и разрешала проводить замену компонент без остановки.

Смешанные системы (рис. 3) объединяют в себе особенности как HP, так и HA. Следует отметить, что кластер, который обладает параметрами как High Performance, так и High Availability, обязательно проиграет в быстродействии системе, ориентированной на высокоскоростные вычисления, и в возможном времени простоя системе, ориентированной на работу в режиме высокой готовности.


Литература

  1. Владимир Савяк, "Эффективные кластерные решения", статья информационного портала, http://www.ixbt.com
  2. Материалы портала разработчиков кластерных систем, http://linover.ru
  3. Материалы обсуждений форума портала о распределенных вычислениях, http://distributed.ru/forum/?a=topic&topic=231

Селютин А.В.
Донецкий национальный технический университет.
Проблематика построения кластерных систем.
Тезисы доклада на IV международной научной конференции студентов, аспирантов и молодых учёных "Компьютерный мониторинг и информационные технологии", Донецк, ДонНТУ, 14 мая 2008 г.