Назад в библиотеку

Пороговая обработка для сегментации и выделения протяженных объектов на цифровых изображениях

Авторы: В.Ю. Волков, Л.С. Турнецкий
Источник: i-us.ru/

Аннотация

В.Ю. Волков, Л.С. Турнецкий Пороговая обработка для сегментации и выделения протяженных объектов на цифровых изображениях. Исследуется задача установки порога бинарного квантования для сегментации и выделения объектов на цифровых изображениях. Рассматривается структура цифровой обработки, включающая предварительную фильтрацию, пороговую обработку и логическую фильтрацию. Предложен новый метод динамической установки и регулировки порогового уровня, который основан на анализе изолированных фрагментов, выделенных на изображении в процессе сегментации. Предложенный метод позволяет оптимизировать решение задачи сегментации объектов на цифровых изображениях на фоне гауссова шума.

Ключевые слова: фильтрация, сегментация, выделение объектов, эрозия элементов, порог бинарного квантования.

Введение

Сегментация представляет разделение изображения (оптикоэлектронных или радиолокационных) на отдельные области, в частности, выделение на сложном фоне объектов интереса, имеющих требуемые свойства [1–3]. Во многих случаях полезные объекты на изображениях являются протяженными, и сегментация может использовать это свойство. Данную идею авторы статьи развивают на основе исследования обработки оптикоэлектронных изображений и предлагают новый метод для выделения именно протяженных объектов интереса неизвестного размера на фоне множества зашумляющих изображение локальных яркостных фрагментов, имеющих случайные местоположение и форму и меньшую протяженность, чем объекты интереса.

Общая структура цифровой обработки изображений включает предварительную фильтрацию, бинарное квантование и последующую логическую обработку. Целью статьи является исследование влияния порогового уровня на результаты сегментации и разработка метода для автоматической установки и изменения порога бинарного квантования. Задача автоматической установки порога в автономных информационно–управляющих системах очень важна для сегментации, выделения и распознавания полезных объектов на фоне помех [2]. Хорошо известные методы установки глобальных и локальных порогов обычно используют гистограммы или локальные свойства точки на изображении. Предлагаемый метод для вычисления порога использует результаты сегментации. Этот метод применим для установки как глобального порога, так и локального порога в скользящем окне.

Структура цифровой обработки изображений и предварительная фильтрация

Общая структура цифровой обработки для сегментации и выделения объектов на изображениях (рис.1) содержит после формирования изображения на входном преобразователе предварительную фильтрацию (фильтр F), пороговую обработку (бинарное квантование) и обработку бинарного изображения (фильтр E). Исходное изображение X после регистрации представляется двумерным массивом на прямоугольной сетке точек.

Структура цифровой обработки изображений

Рисунок 1 – Общая структура цифровой обработки изображений

Исследовались два типа фильтров, которые использовали скользящее окно размером 9 x 9:

формула1

Первый фильтр — стандартный линейный лапласиан, где формула2 — выборочное среднее в окне. Второй фильтр — нелинейный, он использует выборочную медиану формула3 вместо выборочного среднего.Здесь k представляет пару координат вокруг точки (i, j), а область формула4 не содержит центрального элемента (i, j).

На примере реального изображения морской сцены (рис. 2, а), полученного с выхода инфракрасной системы наблюдения, приводятся результаты исследования (рис. 2, б). Предварительная фильтрация позволяет сделать изображения однородными (рис. 3, а, б). Гистограммы концентрируются около нулевого уровня. Для визуализации изображений использовались соответствующие преобразования сдвига и масштаба. Хорошо заметно, что использование выборочной медианы приводит к подавлению протяженных границ, в частности, линии горизонта. Этот эффект может быть использован для построения комбинированной обработки изображений.

а) исходное изображение    б) гистограмма интенсивности   

Рисунок 2 – Исходное изображение морской сцены (а) и его гистограмма интенсивности (б)

Результаты предварительной фильтрации

Рисунок 3 – Результаты предварительной фильтрации изображений для двух типов фильтров: а) — с выборочным средним; б) — c выборочной медианой

Пороговая обработка

Бинарное квантование представляет весьма ответственный этап обработки изображений, поскольку может привести к необратимым потерям информации. Предположим, что объекты на изображении светлые, тогда квантование дает высокий уровень (белое) при превышении порога в данной точке и низкий уровень (черное) в противном случае. Влияние уровня квантования на данные изображения иллюстрирует рис. 4, а—в.

Результаты бинарного квантования

Рисунок 4 – Результаты бинарного квантования для скользящего окна 9 x 9: низкий (а), промежуточный (б) и высокий (в) уровни квантования; слева — фильтр с выборочным средним, справа — c выборочной медианой

Слишком низкий порог квантования приводит к трудностям сегментации, поскольку многие объекты сливаются, полезные объекты и помехи практически не различаются по протяженности. С увеличением уровня квантования на изображении начинают проявляться различия в протяженностях для разных объектов. Слишком высокий уровень квантования изображений может привести к разрушению полезных объектов, которые раскалываются на мелкие фрагменты и теряют свои информационные части.

Иерархия изолированных фрагментов на изображении и их сегментация

Наилучший порог бинарного квантования дает максимальные отличия в протяженностях полезных объектов и помех. Это позволяет осуществить эффективную сегментацию и выделение полезных объектов на фоне помех с учетом их формы и протяженности.

Основная идея установки и регулирования порога квантования для эффективного выделения полезных объектов на фоне помех связана с учетом результатов сегментации. Для этого предлагается иерархия изолированных фрагментов, которые образуются на квантованном изображении, по их форме и размерам. Протяженные свойства изолированного фрагмента можно характеризовать минимальной прямоугольной маской, которая полностью его накрывает. Изолированные точки (пикселы) характеризуются маской 1 x 1, изолированные пары точек могут иметь характеризационную маску 1 x 2, 2 x 1 или 2 x 2 в зависимости от их ориентации. Маска 2 x 2 может также характеризовать уголки из трех точек. Более крупные фрагменты из трех точек имеют маски 2 x 3 и 3 x 2. Линии из трех точек могут иметь маски 1 x 3, 3 x 1 или 3 x 3 в зависимости от ориентации. Предлагаемая иерархия фрагментов иллюстрируется на рис. 5 для масок с максимальным размером 3 x 3 (показаны не все фрагменты, а только с малым числом точек (до трех), чтобы пояснить принцип иерархии).

Иерархия мелких изолированных фрагментов на изображении

Рисунок 5 – Иерархия мелких изолированных фрагментов на изображении

Простейшая иерархия фрагментов не учитывает их ориентацию и использует только квадратные характеризационные маски 1 x 1, 2 x 2, 3 x 3 и т. д.

Метод сегментации изображения состоит в последовательном выделении мелких изолированных фрагментов, начиная с изолированных точек, и удалении (эрозии) их из изображения. На первом шаге удаляются изолированные точки, на втором — изолированные фрагменты с характеризационной маской 2 x 2, затем — изолированные фрагменты с маской 3 x 3 и т. д. В данном исследовании применялась эрозия всех изолированных фрагментов изображения, имеющих максимальный размер до маски 9 x 9 (рис. 6).

Результаты выделения протяженных объектов

Рисунок 6 — Результаты выделения протяженных объектов путем эрозии мелких изолированных фрагментов изображения: низкий (а), промежуточный (б) и высокий (в) порог квантования; слева &mdash фильтр с выборочным средним, справа — c выборочной медианой

Число точек, удаленных из изображения на каждом шаге эрозии, является полезным индикатором для установки и изменения порога бинарного квантования. Эти значения зависят от величины порога квантования. Будем считать, что в случае превышения порога бинарного квантования на выходе получается яркая точка.

Пусть после бинарного квантования изображение содержит некоторое количество таких ярких точек. Исходное число точек NIP (number of initial points) зависит от величины порогового уровня. Эти точки распределяются по изолированным фрагментам изображения. Можно составить распределение числа точек по изолированным фрагментам, тогда число исходных изолированных одиночных точек будет NIP1, число точек в изолированных фрагментах с маской 2 x 2 (изолированные пары и уголки из трех точек) —NIP2, в изолированных фрагментах с маской 3 x 3 — NIP3 и т. д. Поскольку числа точек в изолированных фрагментах изображения зависят от порога квантования, то необходимо произвести нормировку и рассматривать относительные значения NIP1/NIP, NIP2/NIP, NIP3/NIP и т. д. Эти значения можно рассматривать как эффективность эрозии квантованного изображения на соответствующем шаге эрозии.

Зависимости компьютерных испытаний эффективности эрозии от значения порога квантования для приведенных выше реальных изображений представлены на рис. 7, а, б.

Эффективность эрозии для характеризационных масок

Рисунок 7 – Эффективность эрозии для характеризационных масок (1 — 1 x 1; 2 — 2 x 2; 3— 3 x 3;
4 — 5 x 5; 5 — 7 x 7; 6 — 9 x 9) в зависимости от значения порога квантования: а — фильтр с выборочным средним; б — фильтр с выборочной медианой.

Кривые имеют максимумы, концентрирующиеся для разных характеризационных масок вблизи одного значения порога квантования и для каждого используемого типа фильтра предварительной обработки в скользящем окне. Это позволяет для конкретного текущего качества изображения и типа наблюдаемой сцены (сюжета) для одной из характеризационных масок определить соответствующее типу предварительной обработки наилучшее значение порога квантования с точки зрения эффективности эрозии (удаления из изображения) мелких изолированных объектов (помеховых) на изображениях и выявления протяженных объектов, представляющих интерес. При этом для текущего обрабатываемого изображения в дальнейшем не требуется на каждом шаге эрозии производить заново адаптивную точную настройку значения порога квантования, что значительно сокращает время обработки изображения. Таким образом, наилучший порог квантования может быть оперативно автоматически установлен по максимуму эффективности эрозии на изображениях помеховых изолированных фрагментов различных типов (размера и формы) при изменении содержания наблюдаемой сцены.

Заключение

1. Предложен метод сегментации на изображениях протяженных объектов, представляющих интерес, включающий в качестве логической фильтрации пошаговое последовательное удаление (эрозию) на квантованном изображении мелких изолированных, различных по размерам и форме типов помеховых фрагментов с помощью набора характеризационных масок различной формы и размера.

2. Введена эффективность эрозии как относительное число удаляемых точек на каждом шаге обработки. Показано, что для каждого из двух рассмотренных типов фильтров предварительной обработки в скользящем окне (с выборочным средним и выборочной медианой) этот показатель имеет максимум при некотором значении порога квантования для применявшихся характеризационных масок.

3. Предложен новый метод установки и регулировки порога бинарного квантования изображения с учетом результатов эрозии изолированных фрагментов. Наилучший порог квантования соответствует максимальной величине эффективности эрозии изолированных объектов для данного типа фильтра предварительной обработки в скользящем окне. Метод опробован на серии изображений морских сцен и показал хорошие практические результаты в тех случаях, когда требовалось выделить протяженные объекты на фоне помех различного вида.

Литература

1.Гонсалес Р., Вудс Р. Цифровая обработка изображений. — М.: Техносфера, 2005. — 1072 c.
2.Weszka J., Rosenfeld A. Threshold evaluation Techniques // IEEE Trans. SMC-8. 1978. P. 622–629.
3.Волков В. Ю., Макаренко А. А., Рогачев В. А., Турнецкий Л. С. Анализ характеристик и цифровая обработка тепловых дискретизированных изображений // Цифровая обработка сигналов и ее применение: Тр. 10-й Междунар. конф. / ИПУ РАН. Вып. X. Т. 2. М., 2008. С. 485–488.