Реферат

з теми випускної роботи
"Розробка інформаційної системи візуалізації просторових даних"


Введення
Актуальність
Наукова і практична значимість
Плановані практичні результати
Кластеризація, основні поняття і цілі
Класифікація кластеризації
Міри відстані між об’єктами
Алгоритм кластеризації — k–середніх
Висновки
Список літератури

Введення

Геоінформаційна система призначена для збору, зберігання, аналізу та графічної візуалізації просторових даних і пов’язаної з ними інформації про представлені в ГІС об’єктах. Термін також використовується в більш вузькому сенсі — ГІС як інструмент (програмний продукт), що дозволяє користувачам шукати, аналізувати і редагувати цифрові карти, а також додаткову інформацію про об’єкти.

Але, з ростом обсягу даних, що зберігаються в Інтернеті, виникли проблеми візуалізації великого обсягу просторових даних.

У наш час, найбільш поширеною геоінформаційної системою є Google Maps. Але і в цій системі існують свої проблеми з відображенням великої кількості просторових даних. Відображення геоінформаційних даних може зайняти велику кількість часу — навіть для високошвидкісного Інтернету такі операції можуть стати серйозним випробуванням, не кажучи вже про швидкість підключення у середньостатистичного користувача. Одним з рішень даної проблеми є кластеризація.

Актуальність

На даний момент існує велика кількість методів кластеризації, що використовують різні заходи і міри. Але, незважаючи на це, проблема актуальна, розробляються нові алгоритми та підходи. Дана проблема досить складна, тому повністю не вирішена, тому що для кожного завдання необхідно вибрати відповідний алгоритм і міри відстаней. Вибір метрики повністю лежить на досліднику, оскільки результати кластеризації можуть істотно відрізнятися при використанні різних заходів.

Наукова і практична значимість

У наш час розробки в області кластеризації просторових даних засобами Google Maps практично не ведуться. Так як для цього існують стандартні функції Google Maps API. Але на практиці стандартні засоби кластеризації не відповідають поставленим вимогам. Візуалізація великої кількості просторових даних займає тривалий час.

Дана проблема вирішиться за допомогою вибору більш підходящого методу кластеризації, що дозволить багато в чому поліпшити процес відображення просторових даних і полегшить роботу з ними.

Плановані практичні результати

В процесі роботи над дипломною роботою планується проаналізувати методи і алгоритми кластеризації, розібратися в області застосування кожного з них і вибрати найбільш підходящий для даного завдання. Результатом роботи буде інформаційна система, яка буде вирішувати завдання візуалізації великої кількості просторових даних швидше, ніж стандартні засоби Google Maps.

Кластеризація, основні поняття і цілі

Кластеризація (або кластерний аналіз) — це задача розбиття множини об’єктів на групи, звані кластерами. Усередині кожної групи повинні виявитися "схожі" об’єкти, а об’єкти різних груп повинні бути відмінні один від одного. Головна відміна кластеризації від класифікації полягає в тому, що перелік груп чітко не заданий і визначається в процесі роботи алгоритму[4].

Кластерний аналіз виконує такі основні завдання:

Незалежно від предмета вивчення, застосування кластерного аналізу припускає наступні етапи:

Кластерний аналіз пред’являє наступні вимоги до даних:

Після отримання та аналізу результатів можливе корегування обраної метрики і методу кластеризації до отримання оптимального результату.

Цілі кластеризації: