Реферат за темою магістерської роботи

Дослідження та проектування оптимальної структури бази даних Розробка АРМів "Прийом справ абітурієнтів" та "Рекомендація" в межах АСК ВНЗ для приймальної комісії ДонНТУ

1 Актуальність і наукова новизна теми
2. Мета і завдання дослідження, плановані результати
3. Огляд досліджень та розробок
3.1 Огляд міжнародних джерел
3.2 Огляд національних джерел
3.3 Огляд локальних джерел
4 Проектування БД
5 Підхід до побудови оптимальної з точки зору продуктивності структури БД
Висновки
Література

1. Актуальність і наукова новизна теми


Реляційні бази даних (БД) і системи зберігання даних (СЗД), побудовані на їх основі, займають домінуюче становище на ринку СГД. За результатами досліджень 89% діючих і розроблюваних програмних продуктів використовують реляційні БД [1]. Можна зробити висновок, що задача дослідження і проектування оптимальної структури БД буде актуальною до тих пір, поки реляційні БД будуть популярними.

Проведення вступної кампанії є однією з найважливіших завдань вузу і вимагає безліч людських і часових ресурсів, тому автоматизація всіх видів робіт приймальної комісії вузу завжди актуальна і економічно доцільна.

Необхідність нової розробки полягає в тому, що існуюча автоматизована система (АС) приймальної комісії Донецького національного університету (ДонНТУ) була розроблена з використанням застарілих технологій та правил прийому абітурієнтів. Відсутність технічної документації для раніше розробленого продукту значно ускладнює підтримку системи, додавання нового або зміна поточного функціоналу АС.

2. Мета і завдання дослідження, плановані результати


Мета роботи – розробка програмного комплексу, що реалізує введення, збереження, редагування, обробку інформації про абітурієнтів та їх справах, а також формування списків рекомендованих до зарахування абітурієнтів в автоматичному і ручному режимах, і забезпечує мінімізацію трудовитрат працівників приймальної комісії.

В рамках розробки планується дослідити вплив структури БД на її продуктивність і розробити оптимальну з точки зору продуктивності структуру БД АС "Приймальна комісія".

3. Огляд досліджень та розробок


Існує безліч способів розробки оптимальної структуру бази даних, дослідженнями яких займаються від інститутів до провідних компаній, що працюють з базами даних.

Автоматизація процесу проведення вступної компанії внз є досить поширеною завданням для навчальних закладів. Відповідно розробок у цій галузі чимало.

3.1 Огляд міжнародних джерел


У світі існує безліч робіт і публікацій на тему "Оптимальної структури БД" і "Автоматизація приймальної комісії вузу". Нижче наведено список найбільш популярних публікацій:

Публікація Lavon R. Frazier An Admissions Process Transformed with Technology // EDUCAUSE. В даній роботі розглянуті сучасні засоби автоматизації проведення адміністратора компанії внз [2].

Публікація Praful Gavaskar, Sachin Gupta, Diksha Patil, Vikas More. College Office Automation System // International Journal of Current Engineering and Technology. У даній роботі розглянуті основні завдання приймальної комісії коледжу і сформований підхід до автоматизації [3].

Публікація S. Finkelstein, M. Schkolnick, P. Tiberio Physical Database Design for Relational Databases // IBM Almaden Research Center. В даній роботі розглянуті проблеми фізичного етапи проектування БД, представлені фундаментальні принципи проектування БД [4].

3.2 Огляд національних джерел


В Росії та Україні також безліч вчених займається дослідженнями в області оптимізації структури бази даних і автоматизації приймальної комісії навчального закладу. Список найбільш популярних публікацій буде наведено нижче.

Публікація Мартинов В. В., Прошкін Е. Н. Підхід до аналізу характеристик продуктивності БД // Вісник УТАТУ. Управління, ВТ і І. У даній роботі сформовано підхід до оцінки продуктивності програмно-апаратного комплексу системи управління базою даних (СУБД), запропоновано теоретичний підхід до вирішення проблем продуктивності БД [5].

Публікація Ивутин А. Н., Терьохін В. С. Підвищення надійності і продуктивності баз даних за допомогою реплікацій // Известия ТулГУ. Технічні науки. В роботі розглянуті типи реплікацій, завдання, які вирішуються ними, а також вплив використання репликаий на продуктивність і надійність БД [6].

Публікація Белош В. В., Бистров В. В., Дмитрієв С. В., Програмний модуль автоматизованої обробки документів приймальні комісії внз // Праці Кольського наукового центру РАН. Розглядається розробка програмного модуля на основі сучасних веб-технологій, здатного автоматизувати збір заяв абітурієнтів і зберігати їх персональну інформацію, для подальшого побудови списку попереднього зарахування, на базі приймальної комісії КФ ПетрГУ [7].

3.3 Огляд локальних джерел


Студентів, які в рамках ДонНТУ займалися розробками в області автоматизації приймальної комісії ДонНТУ не було знайдено, але були схожі теми, проте є студенти, які займалися дослідженнями в області оптимізації БД.

Робота магістра ДонНТУ Бабич К. К. Оптимізації для високонавантажених реляційних БД та альтернативні рішення. Робота присвячена створенню високонавантаженої веб-системи і застосуванні оптимізації реляційних баз даних, для вирішення завдання множинного доступу і високої відвідуваності [8].

Робота магістра ДонНТУ Афонова В. В. Дослідження властивостей розподілених систем зберігання даних. У роботі досліджуються існуючі моделі продуктивності реплицированных і розподілених баз даних. [9].

Робота магістра ДонНТУ Мошколи А. Я. WEB – орієнтована комплексна система управління факультетом. В роботі проектується web – орієнтована комплексна система управління факультетом в який входить керування рухом контингенту студентів [10].

4. Проектування БД


Сховищем даних АС "Приймальна комісія". є база даних. В якості СУБД для даної системи обраний Microsoft SQL Server 2012, оскільки він використовується для вирішення інших завдань у рамках діючої АСУ ДонНТУ.

Проектування бази даних розроблюваної системи виконуватиметься у три етапи:

1) Концептуальне проектування.

2) Логічне проектування.

3) Фізичне проектування.

На першому етапі необхідно побудувати інформаційні моделі об'єктів, дані про яких буде зберігатися в БД (наприклад, абітурієнт). Такі моделі створюються без урахування використовуваної СУБД. У результаті виходить концептуальна модель бази даних, яка включає в себе:

- опис інформаційних об'єктів і зв'язків між ними;

- опис обмежень цілісності, тобто вимог до допустимих значень даних і зв'язків між ними;

На етапі логічного проектування створюється схема бази даних з урахуванням специфіки конкретної моделі даних, в даному випадку – реляційної. Для реляційної моделі даних логічна модель – набір схем відносин з зазначенням первинних ключів, а також зв'язків між відносинами, що представляють собою зовнішні ключі. На цьому етапі також виконується нормалізація – процес приведення структури БД до виду, що забезпечує мінімальну логічну надлишковість, і не має на меті зменшення або збільшення продуктивності роботи або ж зменшення або збільшення фізичного обсягу бази даних.Кінцевою метою нормалізації є зменшення потенційної суперечливості збереженої в базі даних інформації [11].

На етапі фізичного проектування створюється схема даних для конкретної СУБД. Її специфіка може включати в себе обмеження на назви об'єктів бази даних, обмеження на підтримувані типи даних і т. п. Крім того, специфіка конкретної СУБД при фізичному проектуванні включає вибір рішень, пов'язаних з фізичним середовищем зберігання даних (вибір методів управління дисковою пам'яттю, поділ БД за файлів і пристроїв, методів доступу до даних), створення індексів і т. д.

5. Підхід до побудови оптимальної з точки зору продуктивності структури БД


Зазвичай, продуктивність бази даних вимірюється в термінах продуктивності транзакцій. Для вирішення завдання підвищення продуктивності потрібно сформувати транзакції, які можуть існувати в базі даних, але в більшості практичних випадків сформувати спочатку повністю прописані транзакції до бази даних є досить складною організаційною завданням. До того ж, частина проблем, пов'язана з продуктивністю, може бути виявлена лише на стадії тестування та дослідної експлуатації бази даних [12].

Для того щоб визначити транзакції, які використовуються в АС "Приймальна комісія", слід розглянути реалізується ними функціонал. АС "Приймальна комісія" включає в себе наступні функції:

1) Зберігання даних всіх абітурієнтів університету в єдиній базі.

2) Персоналізований доступ до інформації з розмежуванням прав користувачів у відповідності з посадовими повноваженнями.

3) Реєстрація анкетних даних, паспортних даних, фотографій і заяв абітурієнтів.

4) Редагування даних анкет і заяв абітурієнтів, які подали документи.

5) Облік документів, поданих вступником.

6) Формування і контроль плану набору.

7) Формування необхідного пакету документів для абітурієнта (розписки, заява, анкета і т. д.).

8) Формування списку рекомендованих до зарахування до внз.

9) Зарахування абітурієнтів (формування списків, протоколів та наказів на зарахування).

10) Формування статистичної звітності для аналізу даних про абітурієнтів, поданих заявах і результати вступних випробувань в розрізі факультетів, спеціальностей, форм навчання, видів фінансування та ін.

Також, необхідно визначити основні об'єкти моделі даних АС "Приймальна комісія":

1) Персона – описує модель персональних даних абітурієнта;

2) Справа – описує модель даних заяви вступника;

3) Об'єкт довідкової інформації – описує модель даних одиниці довідкової інформації.

Об'єкт "Персона" є складовим і складається з декількох подобъектов:

1) Фото.

2) Паспортні дані.

3) Адреси і контактні дані.

4) Документи про освіту.

На основі функціонала АС "Приймальна комісія" та основних об'єктів моделі даних можна скласти список основних транзакцій БД:

1) Додавання нової персони.

2) Додавання фото для персони.

3) Введення паспортних даних персони.

4) Редагування паспортних даних персони.

5) Додавання адресних та контактних даних персони.

6) Редагування адресних та контактних даних персони.

7) Додавання документа про освіту персони.

8) Редагування даних документа про освіту персони.

9) Додавання нової справи.

10) Редагування даних справи.

11) Отримання довідкової інформації.

12) Отримання списку справ з прив'язкою до даних персони.

13) Отримання статистики щодо поданих справах з угрупуванням по різним параметрам.

Найбільш пріоритетними завданнями для АС "Приймальна комісія" є введення, облік, зберігання даних абітурієнтів та заяв поданих ними, а найважливішим етапом проведення адміністратора компанії ДонНТУ є прийом справ абітурієнтів в ході якого частота введення нових даних і редагування наявних буде максимальною. Отже, структура БД повинна бути орієнтована на забезпечення максимальної продуктивності транзакцій запису і оновлення.

Виходячи з документації MS SQL Server 2012 для підвищення продуктивності транзакцій вставлення та оновлення даних висуваються наступні вимоги [13]:

- Короткі транзакції для мінімізації довгострокових блокувань і поліпшення паралелізму.

- Висока нормалізація бази даних.

- Мінімізація історичних і статистичних даних або повна їх відсутність.

- Мінімізація використання індексів.

Однак АС "Приймальна комісія" реалізує ще один важливий функціонал – публічний веб-сервіс, який відображає в реальному часі конкурсне положення абітурієнтів. Web-сервер, що забезпечує роботу даного сервісу генерує велику кількість запитів на вибірку багатозв'язних даних за різними параметрами. Для забезпечення максимальної продуктивності виконання даних запитів слід використовувати механізм уявлень, реалізований в MS SQL Server. Принцип роботи уявлень показаний на рисунку 1.

Демонстрація роботи уявлень

Демонстрація роботи уявлень

(анімація: 5 кадрів, 40 кілобайт)

При використанні представлень виграш в продуктивності досягається за рахунок використання механізму кешування запитів, реалізованого в MS SQL Server, що дозволяє скоротити час виконання однакових запитів. Також дана СУБД дозволяє створити індекси для подання, не зачіпаючи при цьому вихідні таблиці.

Висновки


Для створення оптимальної структури БД АС "Приймальна комісія" слід забезпечити зберігання основних об'єктів моделі даних у різних таблицях, уникати надмірності даних за допомогою нормалізації, мінімізувати використання індексів, а для вибірки багатозв'язних даних слід використовувати подання.

Література


1. DB-Engines Ranking [Електронний ресурс] DB-Engines.com // URL: http://db-engines.com/en/ranking дата звернення: 05.06.2015).

2. An Admissions Process Transformed with Technology [Електронний ресурс] educause.edu // URL: http://er.educause.edu/~/media/files/article-downloads/eqm0034.pdf(дата звернення: 05.06.2015).

3. College Office Automation System [Електронний ресурс] inpressco.com // URL: http://inpressco.com/wp-content/uploads/2015/03/Paper47849-851.pdf(дата звернення: 05.06.2015).

4. Physical Database Design for Relational Databases // IBM Almaden Research Center [Електронний ресурс] // URL: http://www.cs.cmu.edu/~natassa/courses/15-823/F02/papers/p91-finkelstein.pdf(дата звернення: 05.06.2015).

5. Подход к анализу характеристик производительности БД [Електронний ресурс] cyberleninka.ru // URL: http://cyberleninka.ru/article/n/podhod-k-analizu-harakteristik-proizvoditelnosti-bd(дата звернення: 05.06.2015).

6. Повышение надежности и производительности баз данных при помощи репликаций [Електронний ресурс] cyberleninka.ru // URL: http://cyberleninka.ru/article/n/povyshenie-nadezhnosti-i-proizvoditelnosti-baz-dannyh-pri-pomoschi-replikatsiy(дата звернення: 05.06.2015).

7. Программный модуль автоматизированной обработки документов приемной комиссии вуза [Електронний ресурс] cyberleninka.ru // URL: (дата звернення: 05.06.2015). http://cyberleninka.ru/article/n/programmnyy-modul-avtomatizirovannoy-obrabotki-dokumentov-priemnoy-komissii-vuza(дата звернення: 05.06.2015).

8. Бабич К. К. Оптимизации для высоконагруженных реляционных БД и альтернативные решения [Електронний ресурс] // Портал Магистров ДонНТУ, 2011г. URL: http://masters.donntu.ru/2013/fknt/babich/diss/index.htm(дата звернення: 24.05.2015).

9. Афонов И. В. Исследование свойств распределённых систем хранения данных [Електронний ресурс] // Портал Магистров ДонНТУ, 2011г. URL: http://masters.donntu.ru/2007/fvti/afonov/diss/index.htm(дата звернення: 24.05.2015).

10. Мошкола А. Я. WEB – ориентированная комплексная система управления факультетом [Електронний ресурс] // Портал Магистров ДонНТУ, 2011г. URL: http://masters.donntu.ru/2009/fvti/moshkola/diss/index.htm(дата звернення: 24.05.2015).


11. Дейт К. Дж. - Введение в системы баз данных - 8-е издание - Москва: Вильямс, 2005 — 1328 с.

12. Создание физической модели базы данных. Учет влияния транзакций [Електронний ресурс] // НОУ Интуит URL: . http://www.intuit.ru/studies/courses/1095/191/lecture/4985(дата звернення: 24.05.2015)

13. Сравнение оперативной обработки транзакций [Електронний ресурс] // Microsoft TechNet URL: https://technet.microsoft.com/ru-ru/library/ms187669(v=sql.105).aspx (дата звернення: 24.05.2015)