Чумак Дмитрий Юрьевич
Факультет: Вычислительной техники и информатики
Специальность: Программное обеспечение автоматизированных систем
Тема выпускной работы:
Исследование распределенных баз данных на кластерной вычислительной сети
Руководитель: Ладыженский Юрий Валентинович
Библиотека
СИСТЕМЫ УПРАВЛЕНИЯ РАСПРЕДЕЛЕННЫМИ БАЗАМИ ДАННЫМИ И СЕТИ ДАННЫХ
Автор: Heinz Stockingera
Источник: http://storageconference.org/2001/2001CD/01stocki.pdf
Grid-вычисления происходят от высокопроизводительных вычислений,
супер-вычислений и кластерных вычислений, где несколько процессоров или рабочих станций объединены через высокоскоростное соединение, чтобы выполнять общие программы. Область исследования сетей может быть разделена на две подобласти: вычислительные сети и сети данных. Вычислительная сеть – это продолжение прежних кластерных компьютеров, где объемные вычислительные задачи должны вычисляться на распределенных вычислительных ресурсах. Сеть данных имеет отношение к эффективному управлению, размещению и репликации больших объемов данных. Необходимость в сетях данных возникает из того факта, что научные приложения, такие как анализ данных в физике высоких энергий (HEP), моделирование климата или наблюдение за Землей являются информационно-емкими и большое количество ученых по всей Земле хотят получить доступ к этим данным.
Распределенная СУБД представляет собой программный комплекс, предназначенный для прозрачного управления распределенной базой данных. Преимущества распределенной СУБД заключаются в том, что она позволяет отразить организационную структуру и повышает возможности совместного использования удаленных данных, а также повышает надежность, доступность и производительность системы, позволяет получить экономию средств и обеспечивает модульное наращивание мощности всей системы. Основными ее недостатками являются более высокая стоимость, сложность, отсутствие стандартов и нехватка опыта разработки и эксплуатации. С точки зрения пользователя распределенная СУБД должна выглядеть точно так же, как и обычная централизованная СУБД, что достигается за счет обеспечения различных типов прозрачности. Благодаря прозрачности размещения пользователи не нуждаются в каких-либо сведениях о существующей в системе фрагментации/репликации данных. Прозрачность транзакций обеспечивает сохранение согласованности глобальной базы даже при наличии параллельного доступа к ней со стороны множества пользователей, а также возникновения в системе различных отказов. Прозрачность выполнения позволяет системе эффективно обрабатывать запросы, включающие обращение к данным на нескольких узлах. Прозрачность использования СУБД позволяет создавать распределенную систему на основе СУБД различных типов.
Научные, информационно-емкие приложения используют большие наборы файлов для хранения данных. В некоторых экспериментах HEP, базы данных должны хранить терабайты и даже петабайты постоянных данных. Использование баз данных до сих пор является уникальной чертой сетей данных. Оптимизация репликации и доступа к данным через WAN не относится полностью к исследованию баз данных.
ЛИТЕРАТУРА
1. Heinz Stockingera. DISTRIBUTED DATABASE MANAGEMENT SYSTEMS AND THE DATA GRID.
|