Показатели качества цифровых карт

Серов Алексей Владимирович, ведущий инженер по маркетингу и геоинформационным технологиям "Уралгеоинформ"


Опубликовано на сайте ГИС-Aссоциации 22.02 1999 года. Оригинал http://www.gisa.ru/2165.html



Цифровые карты представляют из себя гибкий инструмент моделирования окружающей среды, поэтому нельзя сказать например «вот эта цифровая карта плохая, а вот эта - хорошая». Для оценки степени применимости цифровой карты для решения определенных задач необходимо учитывать специфику задачи, требования к точности решений (или выводов) которые предполагается получить. Все необходимые сведения для такой оценки желательно иметь в техническом задании на создание ГИС составлению которого надо уделять самое пристальное внимание. Часто бывает так, что разработчик ГИС и изготовитель цифровых карт - разные организации или, например, для создания ГИС приобретается цифровая карта созданная ранее и для других целей. По этой причине проблема унификации независимых от конкретных задач показателей (критериев качества), характеризующих цифровую карту, является весьма актуальной. Дальнейшим развитием задачи унификации является разработка методов и шкал, предназначенных для численной характеристики степени выполнимости критериев.
В итоге мы получим систему описания качества цифровых карт которая может служить решением трёх задач:
Выполнение роли своего рода «языка общения» между заказчиками и изготовителями цифровых карт.
Обеспечение цифровой карты документом, в котором приводятся основные технические характеристики карты как модели местности, которые могут служить ориентировкой при решении вопроса о приобретении карты.
Обеспечение цифровой карты документом, характеризующим ее качество. В этот документ может быть включено так же заключение о степени пригодности цифровой карты для решения каких-либо конкретных задач.
Описание качества показывает степень соответствия цифровой карты некоторым принципам моделирования, выраженным в определенной методологии создания цифровых карт. Далее будут рассматриваться, как наиболее распространенные, только цифровые карты: представленные геореляционной структурой и созданные путем векторизации существующих картматериалов.
В этом случае схема создания цифровой карты выглядит достаточно просто. Во- первых, каждый объект должен быть локализован, т.е. обособлен от остальных объектов и ему должна быть присвоена семантика, полученная путем чтения исходной карты и, во-вторых, для моделирования объекта должен быть выбран примитив соответствующего характера локализации, размещаемый на соответствующем слое (уровне, покрытии) карты. Мы не будем обсуждать критерии качества связанные с этими этапами создания цифровой карты, т.к. они достаточно очевидны. Более интересным является рассмотрение критериев, связанных с "цифровой" природой карты.
Далее мы будем рассматривать в основном такие критерии, а также некоторые другие, которым, как показывает практика, уделяется недостаточно внимания. Их можно разделить на три группы: общие, модельные и специальные критерии.
Первая группа критериев описывает цифровую карту с точки зрения традиционной картографии, как если она применялась только в качестве подложки или по ней производились операции аналогичные по тем, которые проводятся с использованием обычной карты. В нее входят:
Корректность семантики.
Корректность системы идентификации объектов.
«Гладкость», точность векторизации и метрическая информативность.
Контроль деформации исходного материала.
Однородность структуры цифровой карты.
Ко второй группе отнесем критерии, присущие цифровым картам как моделям местности:
Топологические отношения.
Требования к передаче формы объектов.
Учет логики сочетания объектов.
Семантические отношения или связи.
Третья группа включает в себя критерии, которые зависят от предметной области и конкретной задачи. Примером могут служить цифровые карты, предназначенные для анализа потокораспределения (на дорожных сетях, в трубопроводных сетях), или цифровые карты, предназначенные для кадастра инженерных сетей. В последнем случае инженерные сети (если, конечно, не показаны только каналы, как в случае теплопроводов) должны быть разделены на сегменты «разделителями» которых служат вентили, колодцы, безвентильные врезки. В данной статье мы не будем рассматривать критерии подробного рода.

Общие критерии.
Корректность семантики.
Этот критерий весьма значим, поскольку семантика является важнейшей составляющей цифровой карты и ее проверка в большинстве случаев, возможна только путем визуального просмотра. Он включает выполнение двух основных требований:
Корректность интерпретации условных знаков. Каждый объект должен иметь как минимум одну обязательную характеристику: "тип", который получается путем интерпретации соответствующего объекту условного знака и, возможно, некоторых характеристик объекта, отображаемых подписями. Проверка корректности проводится путем сравнения исходного оригинала и цифровой карты. Очень удобно проводить этот контроль с использованием операции тематического выделения (создания тематической карты), отобразив объекты условными знаками в максимальной степени приближенными к топографическим и отобразив характеристики объектов в виде подписей.
Корректность синтаксиса. Все объекты должны быть описаны посредством унифицированной системы характеристик, которая как правило формулируется в виде классификатора. Проверка синтаксиса включает: поиск синтаксических ошибок, «лишних» пробелов в текстовых характеристиках, соответствие кодов характеристик или их расшифровок классификатору (если он имеется). Удобно для этих целей использовать SQL запросы с операцией группировки по полю, контроль которого проводится.
Корректность системы идентификации объектов.
Как известно, большинство ГИС-программ используют для связи метрики и семантики назначаемые пользователем идентификаторы - целые числа. Общее обязательное требование ко всем идентификаторам - уникальность.
В ряде случаев (например, при создании карт различных кадастров), к системе идентификации могут быть предъявлены особые требования: упорядочивание по определенному правилу, (например «слева-направо», «сверху-вниз»), создание сквозной идентификации, выделение диапазонов идентификаторов для каждого листа карты и каждого слоя, отсутствие «пропусков» в идентификаторах. В случае сшитой карты большинство этих требований реализовать нетрудно, но если они предъявляются к карте представленной физически не связанным набором файлов, то требование об уникальности идентификаторов становится труднореализуемым, особенно в случае, если имеется много объектов продолжающихся с листа на лист (т.н. сшивка по идентификаторам).
Проверка уникальности идентификаторов, в случае, если карты представлены в единой системе координат, может осуществляться путем выборочной проверки, с использованием одновременной подгрузки одноименных слоев смежных планшетов и отображения их в рамках одной карты. Большинство распространенных ГИС поддерживают такую возможность.
Проверка уникальности идентификаторов может быть осуществлена с использованием какой-либо внешней или встроенной СУБД путем создания SQL запроса с группировкой по полю, где содержаться идентификаторы и использованием функции COUNT(*).
«Гладкость», точность векторизации и метрическая информативность.
Рассмотрим только линейные объекты. Большинство обсуждаемых вопросов можно без труда отнести и к объектам другого характера локализации.
Ломаная линия, представляющая собой контур линейного объекта, должна во первых быть как можно более «плавной», а во вторых, точно передавать характерные изменения направления объекта, например, прямые углы. Две наиболее распространенные ошибки цифрования порождаемые несоблюдением этих требований это «скошенные углы» и «зубчатая (зигзагообразная) линия» или, в частном случае, - «выброс». Кроме того, линия контура линейного объекта не должна иметь систематических смещений относительно базовой линии, т.е. располагаться ближе к одному из краев растрового изображения линейного объекта.
Случай, когда линия цифрового линейного объекта выходит за пределы его растрового изображения будем считать значительной ошибкой.
Как известно цифровые объекты представляют из себя сегменты ломаных линий, аппроксимирующих изображения (границы) картографических объектов. При этом точность аппроксимации может быть выбрана в широких пределах. Чрезмерное ее уменьшение может уменьшить метрическую точность всей карты в целом (как правило этим страдает дигитайзерный ввод). Чрезмерное же ее увеличение может привести к тому, что объем цифровой карты может значительно возрасти за счет увеличения количества пикетов (или узлов) в ломаных линиях. Такая ситуация оправдывается тем, что пользователь хочет иметь цифровую карту, которая без существенной потери «привлекательности» могла быть масштабируема в широких пределах. При этом не принимается во внимание ухудшение других «эстетических» критериев: времени отрисовки карты, времени выполнения пространственных запросов и операций пространственного анализа.
Примем, что оптимальным значением точности аппроксимации является такая, при которой сохраняется графическая точность цифровой карты (среднеквадратическая ошибка - 0.2 мм), см. Рисунок 1.
В процессе приемки-сдачи работ по созданию цифровых карт целесообразно проконтролировать величину метрической информативности по сканерным изображениям исходных оригиналов. К сожалению, оценить качество цифровой карты по этому параметру можно только визуально.

Контроль деформации исходного материала.
Одна из главных задач изготовителя состоит в том, чтобы не привнести в цифровую карту погрешностей источником которых является плохое качество исходного материала. Наиболее точным является способ создания цифровых карт с исходных расчлененных оригиналов на пластике. Деформация пластика (как и любого другого «жесткого» носителя) очень мала: до 0.1 мм/м, сама же деформация подчиняется простому закону и легко исправима программным способом. Деформация бумаги составляет более 2-3 мм/м (у картона чуть меньше), и кроме того, она распределяется по поверхности картматериала неравномерно («пузырями»), что делает ее трудно исправимой и, самое главное, трудно контролируемой.
Один из способов проверить (и возможно исправить) деформацию бумажных материалов состоит в следующем: необходимо оцифровать имеющиеся на цифровой карте линии координатной сетки (или «кресты» на крупномасштабных материалах) а затем, составить матрицу следующего вида из квадратов которые они образуют:
Заказчик может потребовать наличие такой матрицы для всех карт, которые создавались с бумажных носителей (литооттисков, "калек", "синек", "рыжушек" и т.д.), в качестве составляющей отчетной документации при сдаче работ по договору, т.е. в составе паспорта карты.
В случае, если приращения расстояний подчиняются линейному закону на площади всего листа карты , то такую деформацию сравнительно просто исправить обычными линейными преобразованиями. Исправление подобной деформации, в общем случае («кусочном», нелинейном), представляет из себя сложный процесс с использованием так называемых «локальных преобразований». Но и даже после него нельзя иметь гарантии точности, поскольку ведь могут существовать «минидеформации» и внутри квадратов.
При контроле деформаций жестких носителей достаточно проверить совпадение теоретических и измеренных размеров рамок листов. По опыту работы предприятия «Уралгеоинформ» только у одного-двух планшетов из тысячи (масштабы 1:200000, 1:25 000, расчлененные оригиналы) имеются значимые расхождения (более 0,1 мм/м).
Однородность выполнения правил формирования модели цифровой карты.
При массовом производстве цифровых карт, над одной и той же картой (или группой листов, составляющих карту), работают разные специалисты, имеющие разную квалификацию. Кроме того, технология цифрования, особенно если она создавалась «под заказчика», часто бывает недостаточно методически проработанной. По этой причине цифровые карты могут обладать неоднородностью структуры. К наиболее распространенным ошибкам такого рода принадлежат:

ошибки создания семантики (например, один оператор указывает «стр.», а другой «строящийся») или объект вида «озеро с плотиной» в одном месте может быть указан как просто «озеро», а в другом как «водохранилище»;
ошибки топологии когда, например, один оператор садит "мост не выражающийся в масштабе карты" на пересечение дороги и реки, а другой - только на дорогу, но вблизи реки.
Количество подобных ошибок значительно уменьшается при соответствующей организации работ, при введении на производстве многоступенчатой (и независимой) системы контроля качества. При выборе изготовителя цифровой карты, необходимо обращать на это внимание.

Модельные критерии
Традиционная карта содержит большой объем информации, заданной в неявной форме, которую человек, читающий карту, легко понимает. Цифровая карта, является моделью местности, интерпретируемой программным обеспечением и поэтому должна явным образом содержать описания этой информации. Данный тип информации может быть разделен на 3 группы: фундаментальная, производная и семантическая неявная информация.
К фундаментальной неявной информации отнесем топологические отношения и форму объектов. Эта информация не может быть получена автоматически. Производная неявная информация включает отношения типа «вложение», «частичное вложение», «пересечение» и т.д, которые легко могут быть получены путем выполнения простых вычислительных процедур. Семантическая неявная информация - это отношения между объектами, которые зависят от контекста, от картографической ситуации в данном месте карты (см. далее).
Топологические отношения.
На карте существуют группы объектов между которыми должны быть установлены топологические отношения, хотя они могут находится в различных слоях карты и, следовательно, не могут иметь общих узлов. Устанавливать или не устанавливать топологические отношения зависит от задачи, для которой используется цифровая карта.
Примером может служить ГИС, предназначенная для решения задач маршрутизации на карте дорожной сети. Для решения этих задач дорожная сеть должна быть представлена в виде графа (как минимум), т.е. в цепочно-узловом виде. Все прочие слои карты служат только в качестве подложки, «для ориентирования» и установление топологических отношений между ними может потребовать значительных материальных затрат. Наоборот, в ГИС, предназначенных для решения кадастровых задач, необходимо наличие полной топологии.
В наиболее распространенных геореляционных ГИС, как отмечалось выше, установление топологических отношений возможно только в пределах одного слоя. Чтобы частично обойти это ограничение и сделать возможным использование отношений в этих ГИС, например при помощи графического расширения языка SQL предлагается следующее простое правило: необходимо иметь в местах локализации таких топологических отношений точное совпадение метрики объектов, по принципу «пикет в пикет», или, что менее жестко, по принципу «совпадение с машинной точностью» (т.е. например допустима «посадка на отрезок»).
При установлении топологических отношений оператору так или иначе необходимо корректировать метрику объектов. Важно обратить внимание на то как это сделано. Дело в том, что в традиционной картографии имеется понятие твердых и нечетких контуров. Твердые контура определяются с большей точностью и среднеквадратическая ошибка их положения на карте несколько меньше, чем у нечетких контуров. Цифровая карта должна быть создана так, чтобы объекты, представляющие их себя твердые конура, оставались неподвижными, а нечеткие контура корректировались. Кроме того допуски на точность положения контуров различных типов объектов разные. Пример: лес по берегу реки. Контур реки определяется с большей точностью, поэтому он остается неизменным, а контур леса корректируется.
Проверка корректности топологической структуры в ГИС не поддерживающих топологические отношения между различными слоями (уровнями, покрытиями) производится просмотром выбранных участков при среднем увеличении (2:1, 3:1). Если возникает смещение линий (или точки примыкания) более чем на величину одного пикселя, то считаем это ошибкой.
Установление специального предела (один-два пикселя) продиктовано влиянием на отображение объектов ошибок округления, которые имеют место в некоторых ГИС. Основной критерий их определения прост: ошибки из-за округления не остаются постоянными при изменении увеличения. Например, при проверке межслоевой топологической корректности в процессе наращивания увеличения отклонения ведут себя нелинейно: меняют направление вектора отклонения, в некоторых случаях уменьшается модуль вектора отклонения, возникает чередование уменьшения/увеличения отклонения. Если вы полностью уверены, что ГИС в которой вы работаете свободна от ошибок подобного рода, тогда можно применять абсолютный критерий, т.е. любые ошибки топологии будем считать значительными.
Кроме того, в любом случае мелкие ошибки совмещения дуг в их центральной части для которых выполняется «пиксельный критерий» и которые имеют характерные размеры значительно меньше точности карты (в 10 и более раз) можно считать просто погрешностями.
Требования к передаче формы объектов.
В природе существуют объекты, имеющие "правильную" геометрическую форму это: строения (многоугольники с прямыми углами), заводские трубы (окружности) и т.д. При отображении на традиционной карте их форма искажается вследствие ограниченной графической точности.
При создании цифровой карты этот недостаток можно исправить в разумных пределах: должны строго выполняться критерии описанные в п. "гладкость, точность векторизации и метрическая информативность". Впрочем для этого случая можно слегка увеличить допуск на смещение контура цифрового объекта относительно базовой линии исходного растрового изображения (примерно в полтора раза).
Как правило, выполнение данного критерия значимо только для крупномасштабных карт и планов городских и пригородных территорий, начиная от 1:25 000 и крупнее. При выполнении корректировки формы объектов необходимо принимать во внимание, что на планах очень крупных масштабов - 1:500 и 1:200 "неправильности" формы объекта могут отражать реально существующую ситуацию.
Учет логики сочетания объектов.
На карте существуют объекты, которые не могут сочетаться друг с другом определенным образом (накладываться, пересекаться и т.д.). Например строение не может находится в русле реки без острова или какого либо другого специального указания. Такие отношения мы будем называть недопустимыми. Еще примеры недопустимых отношений: пересечение "лес-озеро", пересечение "болото-озеро", вложение «дом»-«озеро», пересечение «горизонталь»-«горизонталь» и т.п. Перечень недопустимых отношений определяется логикой сочетания объектов карты, но лучше всего если он будет определен явно (например как недопустимые отношения между некоторыми классами объектов) в техническом задании. Для поиска ошибок такого рода удобно применять пространственные запросы (типа графического расширения SQL), такие возможности есть во многих дешевых ГИС.
Логика сочетания объектов выражается, в ряде случаев, также и в регламентировании их взаимного положения и даже их формы. Рассмотрим пример.
Русло реки не выраженное в масштабе карты и горизонтали. Река течет по тальвегу долины, т.е. там где наиболее низко. В силу ограничений накладываемых графической точностью, на цифровой карте реки могут слегка смещаться относительно тальвегов, что очень хорошо видно в местах пересечения реки и горизонтали. Если в цифровой карте эта погрешность исправлена - значит перед вами карта высочайшего качества. Но необходимо помнить, что исправляться должны горизонтали, а не русло реки (см рассуждения выше). Учитывая сложность подобных исправлений, я бы порекомендовал пользоваться «Правилом Роскартографии» - если характерный размер отступа менее 0.2 мм, то считаем, что это нормально.
Семантические отношения или связи.
Появление этой группы отношений обязано прежде всего объектам, которые принято называть "объектами обозначаемыми подписью". К таким объектам относятся: населенные пункты, стройплощадки, карьеры (на крупномасштабных картах), урочища и т.п. Они как правило показывают, что объекты, расположенные на некотором, четко не определенном участке местности, имеют некоторую "общность". В большинстве случаев для формирования этих отношений необходима дополнительная информация, а при помощи чтения карты о них можно судить только с определенной долей вероятности.
Трудность при формировании подобного объекта состоит в том, чтобы определить его метрику. Очевидно, что для каждого типа объектов необходим свой набор соответствующих правил. Но в некоторых случаях, вероятно можно ограничиться и просто размещением подписи (например, для урочищ). Рамки статьи не позволяют дать развернутого изложения этих правил, поэтому мы ограничимся рассмотрением двух случаев, типичных для мелкомасштабных карт.
Граница населенного пункта, дороги и инженерные коммуникации. Сам объект - «граница населенного пункта» это фиктивный контур, который формируется достаточно произвольно и, как правило, только для того, чтобы можно было привязать какую либо семантику ко всему комплексу объектов, которые мы привыкли распознавать как «населенный пункт». На традиционных картах дороги и инженерные коммуникации могут быть не дотянуты до населенных пунктов на некоторое небольшое расстояние - до 0.5 мм (что не является ошибкой). В цифровой карте необходимо сформировать контур населенного пункта так, чтобы дороги пересекали его или были на него «посажены».
Болота. Болота, как известно, отображаются посредством «островков» горизонтальной штриховки. Но как быть, если мы имеем тесную группу таких «болотец», поскольку совершенно непонятно где пространство между ними - небольшой сухой остров, а где - просто условность, особенность отображения. Кроме того, часто такие группы имеют имена собственные - названия болот. В данном случае можно поступить так: оцифровать отдельные острова по границе штриховки и оцифровать фиктивным контуром всю группу. К этому контуру можно присоединить семантику предназначенную в целом для болота. Если установлено, что следует формировать контура болот именно таким образом, то невыполнение данного критерия (отсутствие внешнего контура для группы «болотец», пересечение контура болота и контуров «болотец») будем считать значительной ошибкой.

Проверка качества цифровой карты
Используя приведенные выше критерии можно построить систему проверки качества цифровых карт. Приведем краткую схему алгоритма проверки и примеры создаваемых в ее процессе документов:
Выбираются участки обследования и составляется их схема. Для проверки выбираются несколько участков цифровой карты, таким образом, чтобы они:
имели площадь не менее 1 кв. дм., в масштабе исходного оригинала.
включали в себя все виды территорий: городские и пригородные районы, болотно-речные комплексы, озерные зоны и т.д.
были как можно более сложны по структуре.
Далее проводится проверка по каждому участку и каждому критерию с составлением полного перечня ошибок. Результаты проверки вносятся в таблицу (см. Таблица 1.) При заполнении таблицы желательно указывать всю информацию позволяющую быстро найти обнаруженную ошибку т.е. координаты локализации, номер объекта и т.д. Кроме того необходимо указать степень проявления ошибки (например характерный размер при ошибках топологии).
Таблица 1. Фрагмент рабочей таблицы проверки качества цифровой карты.


Описанный выше подход к оценке качества цифровых карт на основе изложенной системы критериев применялись при создании цифровой карты, предназначенной для Автоматизированной геоинформационной системы комплексного территориального кадастра Республики Коми.
Автор выражает благодарность Ольге Поповой (НТЦ АГИКС РК) и Владимиру Яровых (ЦГИ ИГ РАН), которые, ознакомившись со взглядами автора на проблему оценки цифровых карт, высказали ряд ценных замечаний и предложений.