ДонНТУ | Портал магистров ДонНТУ
 o Автобиография
 o Реферат
 o Библиотека
 o Ссылки
 o Отчет о поиске
 o Индивидуальное задание

Магистр ДонНТУ Чумак Дмитрий Юрьевич

Чумак Дмитрий Юрьевич

Факультет: Вычислительной техники и информатики

Специальность: Программное обеспечение автоматизированных систем

Тема выпускной работы:

Исследование распределенных баз данных на кластерной вычислительной сети

Руководитель: Ладыженский Юрий Валентинович


Библиотека

СИСТЕМЫ РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ


Автор: M. Tamer Ozsu


Источник: http://softbase.uwaterloo.ca/~ddbms/publications/ozsu/EIC/eic.pdf

Развитие технологии систем управления базами данных (СУБД) совпало с важными разработками в областях компьютерных сетей и технологий распределенных вычислений. Конечным результатом этого является возникновение систем управления распределенными базами данных (СУРБД). Эти системы становятся главными инструментами для приложений, манипулирующих большими объемами данных.

Распределенная база данных (РБД) – это набор многочисленных, логически связанных баз данных, распределенных по компьютерной сети. Система управления распределенными базами данных – это программное обеспечение, которое позволяет управлять распределенными базами данных и делает распределение прозрачным для пользователей. Термин ‘распределенная система баз данных’ обычно используется применительно к комбинации распределенных базам данных и распределенных систем управления базами данных. Эти определения указывают на два идентифицирующих архитектурных принципа. Первый принцип – система состоит из (возможно пустого) набора узлов запросов и непустого набора узлов данных. У узлов данных есть возможности для хранения данных, а узлы запросов – нет. На последних только запускаются процедуры пользовательского интерфейса, чтобы управлять доступом к узлам данных. Второй принцип – каждый узел (запросов или данных) состоит из одного независимого компьютера. Таким образом, на каждом узле есть свое первичное и вторичное хранилище, операционная система (которая может быть одинаковой или разной на различных узлах) и возможность выполнять приложения. Узлы соединяет компьютерная сеть.

Распределенная база данных физически распределена по узлам данных с помощью фрагментации и репликации данных. Фрагментация делит каждое отношение на горизонтальные и вертикальные разделы. Горизонтальная фрагментация отношения выполняется с помощью операции выборки, которая помещает каждый кортеж отношения в разные разделы, основываясь на предикате фрагментации. Вертикальная фрагментация делит отношение на набор фрагментов, выполняя над его атрибутами операцию проекции. Фрагментация желательна, поскольку она делает возможным размещение данных в близости к месту их использования, таким образов потенциально снижаются затраты на передачу данных и это сокращает размеры данных, используемых в запросах пользователей. Основываясь на пользовательских моделях доступа, каждый фрагмент также может быть реплицирован. Это желательно, когда одни и те же данных используются приложениями на разных узлах. В этом случае, возможно, более выгодно дублировать данные на нескольких узлах, чем постоянно перемещать их между ними.

У архитектуры распределенных СУБД есть много возможных альтернатив. Самая простая – это клиент-серверная архитектура, когда несколько клиентских машин получают доступ к одному серверу баз данных. Самая простая клиент-серверная система включает единственный сервер, к которому получает доступ несколько клиентов (она называется много клиентов - один сервер). В этом случае проблемы управления базой данных существенно упрощаются так как база данных хранится на единственном сервере. Проблемы включают управление клиентскими буферами, кэширование данных и блокировки. Управление данными выполняется централизованно на единственном сервере. Более распределенной и более гибкой является архитектура много клиентов – много северов, при которой база данных распределена по многим серверам, которые взаимодействуют друг с другом в соответствии с пользовательскими запросами. Каждая клиентская машина имеет “домашний” сервер, которому клиент направляет запросы. Взаимодействие серверов между собой является прозрачным для пользователей. Большинство современных СУБД реализуют один или другой тип клиент-серверной архитектуры. Настоящая распределенная СУБД не делает различий между клиентской и серверной машинами. В идеале, каждый узел может выполнять функции клиента и сервера. Такие архитектуры называются пиринговыми и требуют сложных протоколов для управления данными, которые распределены по многим узлам. Сложность требуемого программного обеспечения задержала предложение пиринговых распределенных СУБД.

ЛИТЕРАТУРА

1. M. Tamer Ozsu. DISTRIBUTED DATABASE SYSTEMS.


ДонНТУ | Портал магистров ДонНТУ