Назад в библиотеку

Бинаризация черно-белых изображений: состояние и перспективы развития

Авторы: А. Федоров
Источник: [Электронный ресурс]// Режим доступа: http://it-claim.ru/Library/Books/ITS/wwwbook/ist4b/its4/fyodorov.htm

В последнее десятилетие большинство компаний переходит к безбумажной технологии – подготовке чертежей, схем, карт с помощью компьютера. Созданные ранее чертежи переводятся в электронный вид. При сканировании чертежа формируется растровый файл. Растровый документ может храниться любое время, к нему может быть осуществлен оперативный доступ и в любой момент может быть изготовлено необходимое количество дешевых и качественных копий.

Извлечение информации из растровых документов и их редактирование является трудоемким процессом. Поэтому для редактирования и последующей обработки в системах автоматического проектирования (САПР) используются векторные форматы файлов. Полутоновое изображение содержит несколько слоев объектов. Каждый слой можно превратить в бинарный и затем его векторизовать с помощью программы - векторизатора. Получение нескольких бинарных слоев объектов из одного полутонового изображения называется расслоением.

Предложено большое количество алгоритмов обработки бинарных растров: заливка замкнутых областей растра, утолщение и сужение контуров, получение остова линий, получение огибающих контуров и т.д. Эти алгоритмы являются основой для всех видов обработки бинарных растров и характеризуются высокой надежностью и оперативностью. Хуже обстоит дело с надежностью и оперативностью расслоения растра и получения бинарного изображения. Процесс бинаризации характеризуется искажениями следующего типа: разрывы на символах, текстовых надписях, линиях; размывание изображения линий и текстовых надписей; потеря целостности объектов; появление шума в однородных областях.

Разрывы и потеря целостности объектов изображения возникают вследствие ряда причин, обусловленных структурой изображения: значительной зональной неравномерностью яркости объекта; касанием объектов изображения, когда часть контура объекта теряется при бинаризации, и объект сливается с соседним; наложением объектов изображения.

Большое значение имеет наложение объектов и их касание, как частный случай наложения. В результате бинаризации место наложения объектов может быть интерпретировано как продолжение одного или нескольких объектов. Алгоритмы бинаризации, проверяющие целостность геометрической формы объекта, в месте наложения формируют разрыв объектов. Причина в том, что точное теоретическое решение задачи интерпретации места наложения отсутствует из-за недостатка информации, и вследствие этого на практике используются тривиальные решения: интерпретировать место наложения как фон и как продолжение каждого из прилегающих объектов. Очевидно, что ни то, ни другое решение в общем случае не является удовлетворительным. Каждый тип изображений, подлежащих бинаризации или расслоению, содержит сотни наложений объектов, «разъединение» которых сегодня производится вручную. Это объясняет тот факт, что бинаризация чертежа среднего формата занимает порядка 70% времени подготовки документа.

При бинаризации изображения яркость каждого пикселя B(x,y) сравнивается с пороговым значением яркости BT(x,y); если значение яркости пикселя выше значения яркости порога, то на бинарном изображении соответствующий пиксель будет «белым», или «черным» в противном случае. Необходимость устранения большого числа ошибок процесса бинаризации повлекла за собой появление большого числа методов бинаризации, которые делятся на две группы по принципу построения пороговой поверхности: методы глобальной и локальной бинаризации. Пороговой поверхностью является матрица размерностью M×N, соответствующей размерности исходного изображения, каждая ячейка матрицы задает порог яркости бинаризации для соответствующего пикселя на исходном изображении. В методах глобальной бинаризации пороговая поверхность является плоскостью с постоянным значением пороговой яркости, а в методах локальной бинаризации значение пороговой яркости меняется от точки к точке изображения, и рассчитывается на основе некоторых локальных признаков в окрестности пикселя.

Методики, получившие практическое применение, изложены в [Траер1, 1995; Траер2, 1995].

Метод Отса

Наиболее эффективным из методов глобальной бинаризации, как по качеству (ошибок до 30% и меньше), так и по скорости обработки является метод Отса (см. табл. 1) [Траер1, 1995; Траер2, 1995]. К его недостаткам относится размытие линий, «слипание» объектов, особенно в местах пересечений, потеря тонких линий (см. рис. и ).

Метод использует гистограмму распределения значений яркости пикселей растрового изображения. Строится гистограмма по значениям pi=ni/N, где N – это общее кол-во пикселей на изображении, ni – это кол-во пикселей с уровнем яркости i.

Метод Бернсена

Часто используется метод Бернсена. Для схематических и картографических изображений.

Для каждого пикселя (x;y) выбирается порог яркости B(x;y)=(Bмин-Bмакс)/2, где BминBмакс – соответственно, самый низкий и самый высокий уровень яркости пикселей из квадратной окрестности пикселя (x;y). Если уровень контраста (разность самого высокого уровня и самого низкого уровней) превышает некоторый порог, то пиксель считается либо белым, либо черным. Для всего изображения этот порог контраста является константой и должен подбираться интерактивно.

Имеет ряд недостатков: после обработки монотонных областей яркости формируются сильные паразитные помехи, в некоторых случаях приводит к появлению ложных черных пятен . Недостатки могут быть компенсированы с помощью дополнительной обработки – постпроцессинга . Метод является наиболее быстрым среди остальных , даже в совокупности с этапом постпроцессинга.

Метод Эйквеля

Одним из самых производительных методов является метод Эйквеля. Его часто применяют для обработки четких и контрастных изображений.

Согласно данному методу изображение обрабатывается с помощью двух концентрических окон: маленького – S, и большого L. Обычно форма окон принимается квадратной. Оба окна последовательно слева направо сверху вниз накладываются на изображение с шагом равным стороне маленького окна S. Для окна L рассчитывается порог B так, чтобы поделить пиксели на два кластера. Если математические ожидания уровня яркости в двух кластерах имеют разницу, превышающую некоторый заданный пользователем уровень /μ1-μ2/l, то все пиксели внутри окна S бинаризуются в соответствии с порогом T. В противном случае, яркость пикселей из окна S заменяется некоторым близким значением.

На результирующем изображении в местах низкой контрастности появляются разрывы и ложные черные области, которые можно удалить только с помощью постпроцессинга . При обработке тонких пересекающихся линий могут возникать разрывы, поэтому метод хорош для толстых линий и крупных объектов.

Метод Ниблэка

Простота метода Ниблэка локальной адаптивной бинаризации позволяет достичь высокую скорость обработки изображений. Метод используется на практике для быстрой фильтрации контрастных изображений, на которых отсутствуют сильно зашумленные области с плавными переходами яркости.

Идея данного метода состоит в варьировании порога яркости B бинаризации от точки к точке на основании локального значения стандартного отклонения. Порог яркости в точке (x, y) рассчитывается так:

B(x, y)=m(x, y)+k

Заключение

Существующие алгоритмы бинаризации позволяют проводить обработку изображений со значительной зональной неравномерностью яркости, с монотонными областями яркости, с сильно зашумленными изображениями. Однако остаются нерешенным ряд проблем. К таким проблемам относится обнаружение зон наложения объектов изображения и необходимость автоматической интерпретации данных зон. Другими словами, процесс подготовки документа требует определения конфигурации объекта в местах его наложения с другими объектами. Не является удовлетворительным часто используемый вариант «обрывания» объекта в месте наложения, т. к. на реальных документах, соответствующих обрабатываемым изображениям, объекты образуют большое количество наложений, и «обрывание» приводит к появлению серьезной ошибки – потери целостности объектов. Неудовлетворительным является и вариант, в котором зона наложения считается частью каждого из прилегающих к ней объектов.

Реализовать алгоритм бинаризации, способный решать проблему интерпретации зон наложения объектов без интеграции его с процедурой распознавания образов, невозможно. Подобного рода интеграция определяет дальнейшее развитие методов бинаризации и расслоения.

Литература

Прэтт, 2000 Прэтт У. Цифровая обработка изображений. – Кн. 1,2. – М.: Наука, 2000. – 1024 с.
Розенфельд, 1987 Розенфельд А. Распознавание и обработка изображений. – М.: Мир, 1987. – 274 с.
Траер1, 1995 Траер Д, Такст Т. Оценка эффективности методов бинаризации /URL:http://citeseer.nj.nec.com/cache/papers/cs/4013/ftp:zszzszftp.ifi.uio.nozszpubzsztrierzszeval_tr.pdf/evaluation-of-binarization-methods.pdf, 1995.
Траер2, 1995 Траер Д, Джейн К. Целевая оценка эффективности методов бинаризации // URL:http://citeseer.nj.nec.com/cache/papers/cs/4013/ftp:zszzszftp.ifi.uio.nozszpubzsztrierzszeval_tr.pdf/goal-directed-evaluation-of.pdf, 1995.
Хемминг, 1990 Хемминг Р.В. Цифровые фильтры. – М.: Наука, 1990. – 268 с.
Яншин, 1994 Яншин В., Калинин Г. Обработка изображений на IBM PC, алгоритмы и программы. – М.: Мир, 1994. – 320 с.
Ярославский, 1992 Ярославский Л.П. Введение в цифровую обработку изображений. М.: Мир, 1992. – 344 с.