Назад в библиотеку

Название: Метод предварительной фильтрации изображений для повышения точности распознавания образов

Авторы: Ю.А. Коваль, М.В. Филиппов

Источник:Инженерный журнал: наука и инновации. Электронное научно-техническое издание



Аннотация

Решение задачи распознавания тех или иных объектов на снимках, как правило, затруднено ввиду наличия разного рода искажений. В данной работе рассмотрен метод предобработки изображений с использованием билатерального фильтра и шок-фильтра для последующего распознавания образов методом контурного анализа. Приведена оценка качества распознавания при использовании указанных фильтров и без них. Качество распознавания оценивалось при разных параметрах фильтров.

Введение

Проблема автоматического определения заданных объектов на снимках, известная как распознавание образов, привлекает в последнее время внимание исследователей. Одна из основных трудностей, связанных с решением данной задачи, — низкое качество снимков, обусловленное различными искажениями. Например, на аэрофотографиях, получаемых с помощью летательных аппаратов, часто имеют место случайные помехи типа облачности, тумана, дымки [1], поэтому для задач распознавания объектов целесообразно использовать предобработку изображений. В большинстве случаев для борьбы с такими случайными помехами применяют стандартные фильтры низких частот или медианные фильтры [2]. Однако эти фильтры не только частично устраняют шумы, но и размывают границы объектов, что затрудняет их распознавание. В данной статье рассмотрен метод предобработки изображения с помощью последовательного применения билатерального фильтра и шок-фильтра. Проведено исследование влияния предобработки с использованием данного метода на эффективность и скорость распознавания.

Метод контурного анализа

Для распознавания изображений, не обладающих внутренними деталями, применяется контурный анализ [3]. Этот метод позволяет распознавать объекты с измененным размером, а также с небольшим (до 15°) углом поворота. Возможна модификация для объектов, повернутых под любым углом. Под контуром понимается граница объекта, т. е. совокупность точек (пикселов), отделяющих объект от фона. Контур кодируется последовательностью, состоящей из комплексных чисел. На контуре фиксируется начальная точка. Затем контур обходится в заданном направлении (например, по часовой стрелке), и каждый вектор смещения V записывается комплексным числом V = x + iy. где x — смещение точки по оси X; y — смещение по оси Y. Смещение берется относительно предыдущей точки контура. Смещение первой точки определяется относительно точки (0, 0). Модуль НСП дает меру сходства контуров, а его аргумент - угол поворота контуров относительно друг друга (при сохранении начальной точки контура). Таким образом, можно найти одинаковые контуры на заданном изображении.

Билатеральная фильтрация

Билатеральный фильтр позволяет сглаживать изображения, устраняя шумы [4]. В отличие, например, от медианного фильтра билатеральный фильтр, сглаживая изображения, оставляет объекты достаточно четкими. Однако при этом контур изображения немного расплывается. Основная идея билатерального фильтра — учесть близость между пикселами различных цветов и сделать переход цветов более последовательным, а изображение более сглаженным. Формула для расчета цвета каждого пиксела имеет вид

Интеграл в формуле (1) берется по всем пикселам изображения;

где d — расстояние между текущим пикселом и рассчитываемым; g() — разность цветовых значений текущего и рассчитываемого пиксела; d и r — константы. Поскольку на больших расстояниях от рассчитываемого пиксела функция c() будет стремиться к нулю, вклад в интеграл дают только пикселы, расположенные от этого пиксела не далее заданного радиуса.

Шок-фильтр

Для выделения четкой границы между зонами с разной интенсивностью цвета используется шок-фильтр [5]. Определить близость анализируемой точки к границе можно, вычислив градиент функции интенсивности цвета в этой точке, так как на границе он будет иметь наибольшее значение. Однако градиента недостаточно, чтобы узнать, к какой зоне интенсивности принадлежит пиксел, поскольку большие значения градиента также характеризуют отдельные пикселы, отличающиеся от общего фона. Для того чтобы определить нужную зону, используется оператор Лапласа. Если обозначить через f (x, y) исходное изображение, то выражение для шок-фильтра может быть представлено в виде

где sign — знаковая функция, дельта f – градиент функции, а – константа. На основании формулы (2) можно сделать следующий вывод: если пиксел относится к зоне минимальной интенсивности цвета, его значение будет уменьшено, а в противном случае ? увеличено. Таким образом, создается четкая граница раздела цветовых областей. К недостаткам шок-фильтра относится создание помех в случае большого количества отдельных пикселов и шумов.

Алгоритм предварительной обработки снимков

Применение отдельно шок-фильтра или билатерального фильтра для предобработки нецелесообразно, так как шок-фильтр усиливает шумы, а билатеральный фильтр делает контур сложно выделяемым за счет размытости изображения. Поэтому в работе предложен алгоритм, основанный на последовательном применении сначала билатерального, а потом шок-фильтра. На рис. 1 представлены результаты использования данного алгоритма для предварительной обработки изображений. Исходное изображение самолета (рис. 1, а) имеет размытые края и зашумлено. Применение билатерального фильтра приводит к сглаживанию шумов, но в то же время размывает границы фигуры (рис. 1, б). Шок-фильтр делает границы изображения четкими, но не усиливает шумы, так как они были минимизированы билатеральным фильтром (рис. 1, в).

Рис. 1

Результаты, получаемые при использовании алгоритма, и, соответственно, качество распознавания изображений зависят от констант d и r , входящих в формулу (1) для билатерального фильтра, и от константы a из выражения (2) для шок-фильтра. Далее приведены результаты исследования влияния этих коэффициентов на качество распознавания. На рис. 2, 3 показано влияние коэффициентов d и r билатерального фильтра на качество распознавания (кривая 1). Значения НСП получены в результате контурного анализа, описанного в разд. 1. Чем меньше значение НСП, тем меньше подобие контуров, а значит, возможность распознавания объектов. Для сравнения на графиках показан результат, полученный без применения фильтров вообще (кривая 2).

При увеличении коэффициентов билатерального фильтра цвет объектов приближается к цвету фона и границы становятся менее разборчивыми, за счет чего при считывании контура возникают ошибки. В исходных примерах это особенно сказывается на крыльях самолетов, так как они окружены с двух сторон пикселами другого цвета, каждый из которых влияет на цвет результата. Значения НСП получены в результате контурного анализа, описанного в разд. 1. Поскольку шумы, добавляемые шок-фильтром, не портят границы изображения, резкого снижения качества распознавания при увеличении коэффициента не наблюдается. Однако в отдельных местах может быть затронута граница, за счет чего качество может быть снижено. С использованием подобранных коэффициентов была рассмотрена задача распознавания самолетов на тестовом аэрофотоснимке. Результаты были получены при отсутствии предварительной обработки (рис. 5) и с применением рассмотренного алгоритма фильтрации (рис. 6).

Как видно из этих рисунков, предварительная фильтрация с использованием представленного алгоритма позволяет правильно распознать на 30 % больше объектов.

Выводы

В работе представлен метод предварительной обработки изображений с искаженными границами, основанный на последовательном применении билатерального фильтра и шокфильтра. Показано, что в случае изображения, обработанного указанным способом, вероятность правильного распознавания объектов существенно повышается.

Литература

  1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. Москва, Техно- сфера, 2005, 1072 с.
  2. Красильников Н.Н. Цифровая обработка 2D- и 3D-изображений. Санкт- Петербург, БХВ-Петербург, 2011, 608 с.
  3. Фурман Я.А. Введение в контурный анализ. Москва, ФИЗМАТЛИТ, 2003, 598 с.
  4. Tomasi C., Manduchi R. Bilateral Filtering for Grey and Color Images. Proceedings of the 1998 IEEE International Conference on Computer Vision. Bombay, India, 1998, pp. 839–848.
  5. Weickert J., Coherence-Encahncing Shock Filters. Lecture Notes in Computer Science. Springer, 2003, vol. 2781, pp. 1–8.