Автор: Зубрицкая Е.А.
Источник: http://www.masters.donntu.ru/2006/fvti/zubritskaya/diss/index.htm
В деятельности современного предприятия информация становится одним из важнейших производственных ресурсов, выделяясь в самостоятельный фактор успешного бизнеса. Информационная составляющая сейчас является незаменимым звеном в работе любой организации наравне с такими компонентами как кадры, клиенты, каналы сбыта, технологии. Информация не может потребляться непосредственно, поэтому с ростом значения информации возрастает роль средств ее обработки. Если зачастую стоимость информационной базы корпорации оказывается выше производимой ею продукции и услуг, если информация - это всегда деньги, неудивительно, что рынок систем управления базами данных на сегодня оценивается в десятки миллиардов долларов.
В моей выпускной магистерской работе будут исследоваться различные способы организации доступа к данным на WEB-сервере. Задача исследования состоит в том, чтобы выявить наиболее эффективные и работоспособные, в зависимости от тех или иных требований к конкретной задаче по организации доступа к данным, системы связки "платформа - http-сервер - СУБД". Предполагаются субъективные оценки, вытекающие из результатов тестирования работы этих систем каждой в отдельности и сравнение их по критичным показателям. В дополнение разработка программного модуля оптимизирующего данную систему к необходимым требованиям.
Предполагается, что существует определенная база данных, к которой необходимо обеспечить доступ определенному кругу пользователей по сети. Для того чтобы сделать доступным какой-либо объект, находящийся на компьютере, подключенном к сети, необходимо, чтобы на ресурсе, который исполняет роль Сервера, обеспечивался централизованный организованный способ предоставления доступа к сервисам и ресурсам. В том числе и доступ к хранилищу данных - базе данных. В частности, этот доступ к СУБД можно предоставить, используя какой-либо из программных средств именуемых как HTTP-сервер (WEB-сервере).
При исследовании существующих http-серверов необходимо отталкиваться от того, на какой платформе он будет организован. Будем исходить от двух платформ - это системы семейства Microsoft Windows и Unix/Linux-системы. По объективной оценке великой доли пользователей, а по большей части администраторов и разработчиков, надежность, гибкость, требования к аппаратному обеспечению, безопасность, наконец, стоимость платформ семейства Windows в значительной мере уступают Unix-подобным системам, это подтверждается временем непрерывной работы без сбоев серверов, обеспечивающих круглосуточный доступ к ресурсам по сети. Из ОС Windows - системы, которые предоставляют возможности для организации WEB-сервера и системы управления базами данных - Windows NT/XP/2k. Из Linux-систем наиболее популярны, такие как RedHat, ASPLinux, Fedora, Debian и некоторые другие. Отдельным пунктом можно сказать, что весьма надежной и функциональной для серверных решений является платформа FreeBSD.
В ходе работы предполагается выявление наиболее эффективной и работоспособной, в зависимости от тех или иных требований к конкретной задаче, системы доступа к данным. Система подразумевает собой целое, состоящее из универсальных популярных компонент, что является ключевым, потому что изобретение "колеса" в виде комплексного программного обеспечения, никому не нужно, это себя не оправдывает и не может является универсальным. А анализ связанной работы компонент конструктора под названием "доступ к данным" из универсальных, уже зарекомендовавших себя в процессе работы элементов конкретной системы, может быть полезным. Под элементами понимаются различные вариации веб-сервера, СУБД и операционной системы под которую эти элементы работают.
Такая ценность предполагается в возможности использовать средство тестирования систем доступа к данным в практических целях.
Такой проект будет иметь определенную ценность для новичков в этой области, или тех, в чьи непосредственные обязанности не входит сопровождение программного обеспечения. Если есть необходимость корпоративного доступа к какой-либо информации, а информация обычно хранится упорядоченно, т.е. скорее всего это будет какая-то база данных, будет удобно не тратить время на самостоятельное тестирование в процессе реальной работы,что, безусловно, не ограждает от возможных ошибок и ущербов, если система работает не в соответствии с предъявляемыми к ней требованиями. Используя теоретический обзор можно понять из каких элементов должна состоять система пригодная именно для поставленных целей, а средство тестирования, поможет увидеть способность работы системы наглядно.
Существует ряд технологий предоставляющих доступ к источникам данных из приложений СУБД. Раньше, когда базы данных только начинали использовать, разработчикам достаточно было знать только те базы данных, с которыми они работали непосредственно. Но базы данных и их технологии развивались довольно быстро - от реляционных баз данных к нереляционным информационным хранилищам, таким, как электронная почта и файловые системы. С появлением клиент-серверных и многоуровневых архитектур разработчикам приходится разбираться во всем многообразии технологий баз данных.
В большинстве систем проектирования баз данных приложения основываются на одном типе баз данных. В таких простых схемах разработчик приложения может программировать напрямую, используя системный интерфейс базы данных. Хотя подобный подход обеспечивает быстрый и эффективный доступ к данным, могут возникать проблемы, когда задача расширяется, и разработчику приходится дорабатывать программу. При данном подходе это означает, что каждая готовая программа должна иметь различные версии с поддержкой всевозможных типов баз данных. Если компании расширяются или объединяются одна с другой, приложение должно получить доступ к базам данных, основанным на различных платформах.
Технология ODBC обеспечивает общий интерфейс для доступа к разнородным базам данных стандарта SQL. ODBC использует язык SQL как стандарт для доступа к данным. Его интерфейс очень удобен: одно приложение может обращаться к различным базам данных SQL через общий набор команд. Таким образом, разработчик может создавать и распространять приложения, не привязываясь к конкретной базе данных.
Можно также добавить драйвер базы данных, чтобы приложение могло работать с базой данных по выбору пользователя. Менеджер драйверов является промежуточным звеном между приложением и базами данных. Интерфейс ODBC содержит набор функций, который управляет каждым инструментом базы данных. Если приложению нужно сменить используемую базу, разработчик просто заменяет один драйвер другим, и приложение может работать как обычно, без необходимости модификации кода программы.
Спустя несколько лет ODBC становится стандартом для клиент-серверного доступа к базам данных. ODBC обеспечивает стандартный интерфейс, который требует функций SQL и оптимизирован под методы SQL. Однако что произойдет, если нужно будет обратиться к нереляционной базе данных, в которой не используются принципы SQL (например, Microsoft Exchange Server, хранилище которого не содержит данные реляционно).
Моя работа не затрагивает механизмов работы нереяционных баз данных, т.к. в основе их работы лежат несколько другие законы и механизмы. Поэтому все что представлено в работе, имеет отношение и может использовано только в отношении реляционных баз данных.
На данный момент разработан cgi-скрипт, который олицетворяет собой механизм "общения" клиента с сервером. Он, таким образом, является основой для тестирования взаимодействия элементов системы доступа к данным. Скрипт написан на pelr, он организует sql-запросы к СУБД, используя универсальный интерфейс DBI, обрабатывает возможные ошибки от веб-сервера и от СУБД и контролирует скорость выполнения запросов к базе.
Также создан веб-интерфейс, который привязан к вышеописанному скрипту, он является своего рода его "человеческим лицом", представленным пользователю для удобства и показательности.
Планируемым результатом моей выпускной работы будет выявление наиболее эффективной и работоспособной, в зависимости от тех или иных требований к конкретной задаче, системы связки "платформа (ОС) - HTTP-сервер - СУБД". Предполагаются субъективные оценки, вытекающие из результатов тестирования работы этих систем каждой в отдельности и сравнение их по критичным показателям.
Также предполагается что результатом будет разработка универсального средства тестирования для систем доступа к данным, не зависящего от конкретной СУБД, веб-сервера и платформы на которой установлено данное программное обеспечение.
Технологии доступа к базам данных постоянно развиваются. Пока осваивается одна технология, уже появляется другая. Только одно остается неизменным: базы данных играют все более важную роль при разработке приложений. Знание новейших технологий и эволюционных изменений, которые они вызывают, поможет найти оптимальную технологию для текущей задачи и сделать обоснованный выбор в случае необходимых изменений.