Оценка точности при сканировании планшетов

А.В. Слесаренко

Опубликовано на сайте ГИС-Aссоциации 12.03 2003 года. Оригинал http://www.gisa.ru/8566.html

Постановка задачи. При создании цифровой топографической подосновы территории с использованием бумажных планшетов в качестве источника точной координированной информации основной задачей является получение адекватного образа планшета в памяти компьютера.
Пусть есть некоторый бумажный или пленочный планшет (БП). Сканированием планшета называется процесс получения его растрового образа (изображения). Растровое изображение — это тройка (M, C, p), где M — матрица целых чисел; C — упорядоченное множество (палитра) цветов, каждый цвет имеет фиксированный номер; p — разрешение. Ячейка матрицы называется пикселом и содержит номер цвета из заданной палитры С. Строки и столбцы матрицы называются строками и столбцами растра. Далее каждый пиксел покрывает квадратный участок исходного изображения; размер квадрата характеризуется величиной в дюймах q = 1/p, таким образом, разрешение — это количество пикселов в одном дюйме.
Матрица формируется таким образом, что соседние пикселы соответствуют соседним участкам исходного изображения. Из палитры цветов выбирается наиболее подходящий для данного участка, и его номер помещается в соответствующую ячейку матрицы. Пара номеров (i, j), где i — номер строки в матрице, j — номер столбца, называется координатами пиксела. Каждая точка БП, имеющая координаты (x, y), при сканировании покрывается некоторым пикселом с координатами в растровом образе (i, j). Таким способом устанавливается соответствие между участками на сканируемом БП и пикселами. Далее при использовании растровой копии считается, что пиксел (i, j) имеет координаты на БП (iЇq, jЇq). Если (x, y) № (iЇq, jЇq), то вектор d = (iЇq, jЇq) – (x, y) называется абсолютной погрешностью координат. Для произвольной точки величина d будет случайной, наилучшую верхнюю оценку для |d| обозначим max(|d|). Величина D = max(|d|) называется погрешностью сканирования. Она возникает под влиянием ряда факторов, которые будут рассмотрены ниже.
Используя бумажный планшет, можно измерять расстояния между двумя его точками и углы между отрезками. Полученные величины используют для вычисления расстояний и углов между точками и отрезками на местности. При этом результаты вычислений будут несколько отличаться от имеющих место в действительности, вследствие неточности изготовления БП.
Обозначим случайной величиной d1 отклонение вычисленной величины от фактической (погрешность вычислений), тогда величина max(|d1|) определяет точность БП относительно местности. Аналогично можно определить точность растрового образа планшета относительно местности как max(|d2|), где d2 – погрешность вычисленной по растровому образу величины на местности по отношению к фактической. Чем меньше величина max(|d2|), тем точнее результаты вычислений, сделанных с помощью растровой копии планшета.
Каждый БП имеет определенную точность max(|d1|), которая указывается в СНиП. Точность растрового образа относительно местности определяется равенством max(|d2|) = max(|d1|) + D, где D > 0. Поэтому она не может быть лучше точности исходного недеформированного БП.
Вычисления, выполняемые компьютером с использованием растрового изображения планшета, выполняются в координатной форме. Например, длина отрезка вычисляется по формуле:



где (x1,y1) и (x2,y2) – координаты концов отрезка в растровом образе. Все вычисления выполняются с сохранением большого числа знаков после запятой, поэтому результат вычислений настолько точен, насколько точны исходные данные, т. е. программное обеспечение в большинстве случаев сохраняет исходную точность, а если это не так, то всегда можно указать верхнюю оценку погрешности. В приведенном примере исходные данные — это координаты концов отрезка.
Факторы, определяющие погрешность сканирования D. Погрешность сканирования D зависит от ряда факторов случайного характера:
1) Неточности сканера;
2) Неплотности прилегания БП к поверхности стекла планшетного сканера;
3) Деформации бумажной или пленочной основы планшета;
4) Поворота планшета относительно линии движения сканирующего луча;
5) Неточности определения оператором точек пересечения линий координатной сетки (крестов), имеющихся на растровом образе фрагмента (рис. 1).
Влияние факторов на погрешность происходит независимо друг от друга. Их можно охарактеризовать независимыми случайными отклонениями координат D1 = (Dx1, Dy1), D2=(Dx2, Dy2), D3 =(Dx3, Dy3), D4 = (Dx4, Dy4), D5 = (Dx5, Dy5) соответственно. Тогда суммарное случайное отклонение координат, обусловленное перечисленными факторами, будет равно:



Таким образом, чем меньше величина D = max(|d|), тем больше растровая копия соответствует исходному БП.
Отметим, что величину max(|D1|) можно уменьшить, выбирая более точный сканер; величины max(|D2|) и max(|D3|) напрямую зависят как от качества исходного планшета, так и от соблюдения оператором техпроцесса сканирования фрагментов, а величина max(|D5|) — от соблюдения оператором техпроцесса определения центральных точек крестов координатной сетки и выбранного при сканировании разрешения растра. Погрешность, обусловленную четвертым фактором, удается компенсировать таким образом, что величина max(|D4|) не превосходит Ц2/(2p) дюймов, где p — выбранное при сканировании разрешение (например, 300х300 dpi).
Выбор сканера. При создании технологии сканирования планшетов наша организация с самого начала ориентировались на возможность использования сканеров произвольного формата. Дело в том, что перечень факторов, определяющих точность растровой копии не зависит от формата сканера. Поэтому для достижения требуемой точности в любом случае необходимо обеспечить компенсацию искажений, а это возможно только при соблюдении определенного техпроцесса.
Такие показатели рабочего места, как производительность, стоимость эксплуатации и начальные вложения, напротив, существенно зависят от выбранного сканера. В качестве сравнения рассмотрим следующие два варианта. Сканер большого формата позволяет сканировать всю рабочую поверхность планшета одним фрагментом. Таким образом, работа оператора со сканером сводится к минимуму. В результате получается единственный файл, который затем обрабатывается. Факторы искажений сохраняются, а значит, требуется их компенсация (см. следующий раздел).
Высокая стоимость оборудования предполагает значительные первоначальные вложения в его приобретение. В случае аренды (лизинга) оборудования повышаются себестоимость изготовления растровых копий. Вложения в дорогостоящее оборудование и его содержание окупятся, если оно будет максимально загружено, т. е. если имеется большое количество материала, нуждающегося в оцифровке.
При использовании планшетного сканера малого формата поверхность сканируется пофрагментно с последующей склейкой фрагментов в единое изображение. Одновременно выполняется частичная компенсация искажений. Точность склеенного изображения выше, чем при использовании широкоформатного сканера, за счет более высокой точности планшетного сканера. Примерная производительность рабочего места 20–25 планшетов масштаба 1:500 в смену. Этот вариант требует на порядок меньших первоначальных затрат за счет возможности использовать дешевые планшетные сканеры с разрешением 300х300 или 600x600 dpi.
Подготовка образа, компенсация искажений. Подготовка растрового образа планшета осуществляется в два этапа. На первом выполняется пофрагментное сканирование всей поверхности рабочей области планшета, в результате получается набор образов фрагментов, которые вместе покрывают рабочую область. На втором этапе полученные фрагменты склеиваются в один образ планшета, для чего из каждого фрагмента последовательно вырезаются все ячейки сетки и вклеиваются на свое место в образ планшета с одновременной компенсацией искажений. Каждая ячейка исправляется отдельно.
Алгоритм компенсации искажений основан на использовании точек пересечения линий координатной сетки (крестов), имеющихся в растровом образе фрагмента. Каждый крест имеет центральную точку, определяемую из естественных соображений (см. рис. 1 и 2). Центральная точка креста имеет координаты, которые считаются его координатами в растровом образе фрагмента. Для каждого креста (каждого фрагмента) известны точные координаты на БП (независимо от его деформации), поэтому получаем для каждого фрагмента множество точек с точно заданными координатами на БП. Это исходная информация для склейки образа планшета. Фрагменты совмещаются по крестам (рис. 3).
Отметим некоторые моменты:
— в окрестности координатных крестов погрешность сканирования равна нулю, поскольку для крестов известны точные координаты на недеформированном БП. Поэтому чем мельче координатная сетка, тем выше точность растровой копии;
— полная компенсация искажений невозможна в силу их случайного характера. Однако имеется возможность компенсировать с хорошей точностью искажения, вызванные поворотом планшета (фактор 4), а также любые линейные искажения и искажения равномерного растяжения (фактор 3);
— факторы 1 и 2 могут быть компенсированы лишь частично и в той мере, в какой они носят равномерный характер;
— фактор 5 не компенсируется, однако его влияние на точность поддается верхней оценке.
Процесс компенсации выполняется последовательно для каждой ячейки сетки всех фрагментов. Растровое изображение ячейки фрагмента преобразуется в растровое изображение ячейки планшета попиксельно следующим образом. Обозначим кресты, образующие ячейку Z, буквами A, B, C, D. Неправильный четырехугольник ABCD будем считать границей ячейки (рис. 4). Пусть в образе планшета данной ячейке соответствует прямоугольник (квадрат) Z’. Пиксел z’ОZ’ задан в Z’ координатами (x’, y’), тогда он является образом пиксела zОABCD, определяемого пересечением прямых L1L3 и L2L4, где точки L1, L2, L3, L4 определяются из соотношений:


при этом цвет пиксела z устанавливается равным цвету z’.
Определенное преобразование неправильного четырехугольника в правильный, примененное для каждого пиксела ячейки, будем называть равномерной деформацией. При таком преобразовании возможны две ситуации:
— разные исходные пикселы переходят в один, тогда его цвет может быть выбран произвольно;
— один исходный пиксел переходит в несколько, цвета всех будут равны.
Нетрудно видеть, что данное преобразование выполняет указанную выше компенсацию.
Пример верхней оценки суммарной погрешности. Допустим несколько идеализированную ситуацию, в которой отсутствуют факторы 1 и 2, влияющие на погрешность сканирования, т. е. D1 = 0, D2 = 0, а растяжения, вызванные фактором 3, имеют строго равномерный характер. Погрешность недеформированного БП относительно местности max(|d1|) положим равной нулю. С этими допущениями оценим сверху абсолютную величину погрешности сканирования D.
Пусть принятое при сканировании разрешение p = 300 dpi (300 пикселов в дюйме). Погрешность, возникающая при равномерной деформации прямоугольника, не превосходит Ц2/(2p) стороны пиксела (полудиагональ пиксела), т.е. max(|D4|) = Ц2/(2p) дюймов. Пусть при определении центральной точки каждого креста пользователь ошибается не более чем на 1 пиксел в сторону, тогда max(|D5|) = 1/p дюймов, поэтому
D = max(|D4|) + max(|D5|) = Ц2/(2p) + 1/p = (2+Ц2)/(2p) » 0,0057 дюймов или » 0,14 мм на поверхности бумажного планшета.
Для масштаба 1:500 ошибка на местности будет не более чем 0,14Ї500 = 70 мм.
Проводя оценку точности сканирования, мы в первую очередь ориентировались на недорогую и общедоступную технику, которую имеет большинство пользователей. Из всего сказанного можно сделать вывод, что информация, обработанная на широкоформатных сканерах, имеет несколько меньшую точность, нежели отсканированная пофрагментно.
Слесаренко А.В.
С автором можно связаться по
тел (3412) 22-47-09 и e-mail: lav@fc.com.ru