004.6
РОЗРОБКА МЕТОДУ ДОСЛІДЖЕННЯ БАЗИ ДАНИХ ТА ЇЇ ПІДГОТОВКИ ДЛЯ СТВОРЕННЯ КОНВЕРТОРА

Матвієнко І.В., Бойко В.В.
Донецький національний технічний університет

Метою даної доповіді є вироблення методу підготовки структури даних для створення конвертора бази даних (БД).

До засобів відносяться: існуюча БД, програма моніторингу SQL-запитів UIBSQLMonitor, клієнтська програма взаємодії з бібліотечною БД, сервер БД InterBase, менеджер баз даних IB Expert.

1. Актуальність створення конвертора

Наведена БД є унікальною в своєму роді. Вона була створена для збереження специфічних даних за бібліотечними стандартами систематизації цих даних [1]. Існуюча БД працює під управлінням InterBase сервера, в той час як нова проектується для MSSQL.

Враховуючи необхідність збереження даних, що вже накопичені впродовж роботи з БД, постає необхідність у міграції даних з вихідної БД до нової. Загальноприйнята практика міграції даних з однієї системи керування базами даних(СКБД) до іншої полягає у використанні автоматизованих засобів та програмних продуктів. Для більшості СКБД такі рішення вже створені у вигляді закінчених програмних продуктів, але для розглядуваного випадку необхідне створення власного конвертора.

Необхідність створення власного конвертора зумовлена перш за все тим, що в новій БД буде реалізовано відмінну від поточної реляційну модель, тому не можна виконати міграцію шляхом простого копіювання даних з таблиць вихідної БД до нової СКБД без врахування логічних зв’язків між ними.

Для реалізації конвертора необхідно певним чином підготувати дані, що потребують переносу до нової БД. Ця підготовка полягає у написанні правильних та раціональних запитів до вихідної БД.

2. Опис існуючої бази даних

Існуюча база даних має велику кількість інформації, що була накопичена в процесі роботи з нею. Цю інформацію обов’язково необхідно зберегти для нової БД.

Існуюча БД бібліотеки активно експлуатується її працівниками, в неї щодня заноситься велика кількість службової інформації та її робота є невід’ємною частиною роботи бібліотеки. Проте ця БД має певну кількість суттєвих недоліків через які її ефективна подальша експлуатація стає неможливою.

По-перше, структура існуючої БД не документована. З цим пов’язана неможливість подальшого ефективного розвитку БД та внесення змін до логіки її роботи.

По-друге, наведена БД є ненормалізованою та неоптимальною, через це в ній присутня надмірність, що збільшує кількість логічних помилок при роботі [2]. В результаті нормалізації та оптимізації було створено нова реляційна архітектура.

По-третє, майбутня БД проектується для роботи під керуванням MSSQL сервера, а існуюча БД спроектована для середовища InterBase.

3. Послідовність виконання методу

Пропонований метод розв’язання задачі полягає у моніторингу та подальшому аналізі SQL-запитів до БД, що виконує клієнтська програма під час імітації повсякденної роботи працівника бібліотеки.

Послідовність роботи за методом описана нижче.

1. Створюється порожня копія вихідної БД. тобто тільки структура БД, а усі поля, що не містять службової інформації є порожніми.

2. Визначається який з розділів бібліотечної бази даних буде аналізуватися(нові надходження видань до бібліотеки, облік видань чи інше).

3. Запускається програма моніторингу (UIBSQLMonitor) для слідкування за SQL-запитами до БД від клієнтської програми.

4. Виконуються запити до БД через клієнтську програму так само як це робить працівник бібліотеки. Одночасно з цим відслідковується лістинг запитів до БД від програми. Уся інформація має одразу ж фіксуватися. А саме має бути зафіксовано які дії в програмі(по роботі з книжковим фондом) до яких полів вимагають звернень і яка саме інформація в них внесена при цьому.

Лістинг кожного з таких SQL-запитів є сенс зберегти в окремому файлі для подальшого аналізу, щоб не виконувати одну й ту саму операцію кілька разів.

5. Усі поля, що стосуються книжкового фонду мають номери, що відповідають міжнародним стандартам бібліотечних асоціацій [1] і з цього випливає, ще одна важлива особливість методу. Безпосередньо в поля можна вносити їх найменування, або номери, тим самим явно позначаючи, яка інформація в них вноситься. Згідно стандартів організації бібліотечних даних [1] враховуються правила внесення даних у поля.

6. Виконується аналіз запитів до БД та формування кінцевих об’єднаних запитів для кожної з операцій над БД [2].

6.1 Окремі частини отриманих запитів перевіряються безпосередньо за допомогою SQL-консолі. Через те, що частина запитів отриманих по закінчені моніторингу при аналізі певного розділу не несуть корисної інформації для формування запитів для конвертора.

6.2 Виконується пошук логічних зв’язків між таблицями БД.

6.3 Формування кінцевих запитів для отримання даних, що мають бути конвертовані.

За таким самим принципом з’ясовуються дані і про усі поля бібліотечної інформації.

Висновки: Наведена методика дослідження баз даних є дієвою та ефективною при необхідності дослідження баз даних, структура яких не є явною або є суттєві складнощі при спробах дослідження бази даних методом простої перевірки значень полів у таблицях.

Напрямок подальшої діяльності – нормалізація та міграція ненормалізованих даних до нормалізованої структури.

Література:

[1] Формат RUSMARC представления библиографических данных. http://www.rba.ru/rusmarc/rusmarc/index.html

[2] Питер Роб, Карлос Коронел. Системы баз данных: проектирование и управление. Санкт-Петербург 2004.