Реферат

по теме выпускной работы
«Разработка информационной системы
визуализации пространственных данных»


Введение
Актуальность
Научная и практическая значимость
Планируемые практические результаты
Кластеризация, основные понятия и цели
Классификация кластеризации
Меры расстояния между объектами
Алгоритм кластеризации — k–средних
Выводы
Список литературы

Введение

Геоинформационная система предназначена для сбора, хранения, анализа и графической визуализации пространственных данных и связанной с ними информации о представленных в ГИС объектах. Термин также используется в более узком смысле — ГИС как инструмент (программный продукт), позволяющий пользователям искать, анализировать и редактировать цифровые карты, а также дополнительную информацию об объектах.

Но, с ростом объема данных, хранящихся в Интернете, возникли проблемы визуализации большого объема пространственных данных.

В наше время, наиболее распространенной геоинформационной системой является Google Maps. Но и в данной системе существуют свои проблемы с отображением большого количества пространственных данных. Отображение геоинформационных данных может занять большое количество времени — даже для высокоскоростного Интернета такие операции могут стать серьезным испытанием, не говоря уже о скорости подключения у среднестатистического пользователя. Одним из решений данной проблемы является кластеризация.

Актуальность

На данный момент существует большое количество методов кластеризации, использующих разные меры и метрики. Но, несмотря на это, проблема актуальна, разрабатываются новые алгоритмы и подходы. Данная проблема достаточно сложная, поэтому полностью не решена, так как для каждой задачи необходимо выбрать соответствующий алгоритм и меры расстояний. Выбор метрики полностью лежит на исследователе, поскольку результаты кластеризации могут существенно отличаться при использовании разных мер.

Научная и практическая значимость

В наше время разработки в области кластеризации пространственных данных средствами Google Maps практически не ведутся. Так как для этого существуют стандартные функции Google Maps API. Но на практике стандартные средства кластеризации не отвечают поставленным требованиям. Визуализаци большого количества пространственных данных занимает длительное время.

Данная проблема решится с помощью выбора более подходящего метода кластеризации, что позволит во многом улучшить процесс отображения пространственных данных и облегчит работу с ними.

Планируемые практические результаты

В процессе работы над дипломной работой планируется проанализировать методы и алгоритмы кластеризации, разобраться в области применения каждого из них и выбрать наиболее подходящий для данной задачи. Результатом работы будет информационная система, которая будет решать задачи визуализации большого количества пространственных данных быстрее, чем стандартные средства Google Maps.

Кластеризация, основные понятия и цели

Кластеризация (или кластерный анализ) — это задача разбиения множества объектов на группы, называемые кластерами. Внутри каждой группы должны оказаться «похожие» объекты, а объекты разных групп должны быть отличны друг от друга. Главное отличие кластеризации от классификации состоит в том, что перечень групп четко не задан и определяется в процессе работы алгоритма[4].

Кластерный анализ выполняет следующие основные задачи:

Независимо от предмета изучения, применение кластерного анализа предполагает следующие этапы:

Кластерный анализ предъявляет следующие требования к данным:

После получения и анализа результатов возможна корректировка выбранной метрики и метода кластеризации до получения оптимального результата.

Цели кластеризации: