Автор: Стругайло В.В.
Источник: Стругайло В.В. Обзор методов фильтрации и сегментации цифровых изображений // Наука и образование. Электронное научно-технические издание. // Московский автомобильно-дорожный государственный технический университет, 2012. — С. 270–281.
Методы цифровой обработки позволяют преобразовывать изображения для улучшения их визуального восприятия. Также в данной области решаются задачи изменения представления изображений для обеспечения их хранения, передачи, визуализации в электронном виде и дальнейшего анализа заложенной в них информации. Цифровая обработка изображений является бурно развивающейся областью науки. Исследование и разработка методов и алгоритмов обработки и анализа информации представленной в виде цифровых изображений является очень актуальной задачей.
В данной работе осуществляется обзор методов фильтрации и сегментации изображений. Приводятся примеры рассмотренных методов для решения задач улучшения визуального представления и выделения контуров объектов на изображениях.
Цифровые изображения подвержены воздействию различных типов шумов, которые могут возникать от способа получения изображений, технологий передачи информации, методов оцифровывания данных. Процесс устранения различных видов шумов на изображениях, называется фильтрацией.
При осуществлении фильтрации яркостные характеристики каждой точки цифрового изображения, заменяются другим значением яркости, которое признается в наименьшей степени искаженным помехой [1, 2]. Выделяют частотную и пространственную фильтрацию [1].
Частотные методы преобразований изображений [1–6] основываются на идее Фурье преобразования, смысл которого заключается в представлении исходной функции в виде суммы тригонометрических функций различных частот, умноженных на заданные коэффициенты. В случае, если функция является периодической такое представление называется рядом Фурье. Иначе, непериодическая функция, имеющая конечную площадь под графиком, может быть выражена в виде интеграла от тригонометрических функций, умноженных на некоторую весовую функцию [1]. Такой вариант называется преобразованием Фурье и в большинстве практических задач оказывается более полезным, чем ряд Фурье. Важным свойством является то, что функцию, представленную Фурье-преобразованием, после осуществления над ней преобразований можно обратно вернуть к исходному виду. Таким образом, данный подход позволяет обрабатывать функцию в частотной области, после чего без потери информации вернуться к исходному виду. Для решения задач фильтрации изображений преобразование Фурье также могут применяться. В практическом приложении реализация частотных подходов может быть аналогична пространственным методам фильтрации [1].
Пространственные методы улучшения изображений применятся к растровым изображениям, представленным в виде двумерных матриц. Принцип пространственных алгоритмов заключается в применении специальных операторов к каждой точке исходного изображения. В качестве операторов выступают прямоугольные или квадратные матрицы называемые масками, ядрами или окнами [1,7,8]. Чаще всего маска представляет собой небольшой двумерный массив, а методы улучшения, базирующиеся на таком подходе, часто называют обработкой по маске или фильтрацией по маске.
При осуществлении линейной фильтрации отклик маски задается суммой произведений пикселей в области покрытия фильтра. В качестве линейного сглаживающего фильтра используется усредняющий фильтр выходным значением, которого является среднее значение по окрестности маски фильтра [1]. Подобный фильтр используется для задач удаления зернистости изображения вызванной импульсным шумом [9,7]. Общая формула отклика g(x, y) усредняющего фильтра, предназначенного для фильтрации изображения f с размерами M×N, имеет вид [1]:
где w(s, t) — элемент ядра свертки изображения, имеющей размеры m×n, s∈[−m/2, m/2], t∈[−n/2, n/2] — координаты ядра свертки по оси абсцисс и ординат; x=0,1,2,..,M−1, y=0,1,2,..,N−1 — координаты исходного изображения f.
В форме удобной для программного представления подобный фильтр можно представить в виде:
где [Gi,j] — элемент матрицы изображения после фильтрации; [Ws,t] — элемент массива ядра свертки изображения, имеющий размеры m×n; [Ei,j] — элемент матрицы исходного изображения.
В основе адаптивной фильтрации положен винеровский фильтр, являющийся одним из типов линейного фильтра для адаптивной локальной обработки изображений [2]. Если значение среднеквадратичного отклонения интенсивностей пикселей в данной локальной области большое, то винеровский фильтр выполняет небольшое сглаживание и, наоборот, при меньшем отклонении область сглаживания больше [2]. Этот подход часто бывает более эффективным, чем обычная линейная фильтрация. Преимущество адаптивный фильтра еще заключается в том, что он сохраняет края и другие высокочастотные части объектов изображения. Однако, винеровский фильтр требует большего времени для вычислений, чем линейный фильтр [2].
Среднее значение яркости вычисляется для центрального пикселя маски Wi,j, содержащей значения яркости исходного изображения в покрытой маской локальной области изображения по формуле:
Дисперсия маски равна:
В данном алгоритме для каждого нового положения окна маски заново вычисляются соответствующие значения.
Сглаживание шума оценивается через среднее квадратичное отклонение:
На рисунке 1 приведены результаты фильтрации при наложении импульсного шума на цифровое изображение. На рисунке 2 представлены результаты фильтрации наложенного на цифровое изображение гауссовского белого шума.
Рисунок 1 — Результаты фильтрации импульсного шума на изображении
Рисунок 2 — Результаты фильтрации белого шума на изображении
Конечный результат анализа изображений во многом определяется качеством сегментации [1], а степень детализации выделяемых характеристик зависит от конкретной задачи. Поэтому не существует отдельного метода или алгоритма подходящего для решения всех типов задач сегментации, каждый из методов имеет свои достоинства и недостатки. В большинстве случаев выбирается один или несколько алгоритмов, и модифицируются под специфичные условия задачи.
Сегментация решает в общем смысле две основные задачи [9]:
Ввыделяются различные классификации методов, но большинство из них основываются на двух следующих свойствах сигнала яркости — это разрывность и однородность.
Разделение изображения на части базируется на идеях, основанных на резких перепадах яркости. Изменение формы описания элементов изображения основывается на разделении изображения на однородные области с учетом заранее выбранных критериев [1].
К методам на основе разрывности яркости относится обнаружение точек линий и перепадов [1]. При обнаружении точек и линий с помощью специальных масок организуется соответствующий поиск. В качестве методов обнаружения перепадов используются производные и градиенты от функций яркости, такие методы основаны на более общих идеях [1, 9].
Методы пороговой обработки основываются на идеях разделения значимых характеристик по некоторому порогу. Порог может быть глобальным, то есть определенным на всем изображении или локальным, который определен на некоторой области [1, 2, 9].
Метод выращивания областей, основывается на обнаружении разрывов яркости. В методах выделяются несколько центральных точек или групп точек, после чего, к ним присоединяются пиксели, удовлетворяющие заданным условиям [1, 9].
Гистограммные методы основаны на выборе минимальных и максимальных значений или интервалов между экстремумами [9, 1].
Методы на основе преобразований Хафа, основываются на связывании точек друг с другом путем предварительного выяснения их принадлежности к некоторой кривой заданной формы или обнаружения прямых и кривых линий по семейству заданных прямолинейных отрезков и дуг [9].
Методы теории графов, основываются на обнаружении и связывании контуров с помощью представления отрезков контуров в виде графа и осуществлении поиска на этом графе путей, соответствующих искомым контурам [1].
Методы водоразделов заключается в поиске линий разделяющих локальные минимумы и максимумы значений яркостей элементов изображения [1, 9].
Существует множество методов решающих задачи сегментации, как и подходов к их классификации. Для сравнения методов сегментации цифровых изображений, были смоделированы методы, представляемые в виде масок. Принцип работы таких методов основан на разности яркости элементов и фона изображения [1]. Математическое обоснование методов заключается в вычислении производных, представленных для цифровых изображений в виде дискретных приближений градиента. В качестве градиентных методов выделяют операторы, представляющие собой матричные маски [1,8,9]:
Оператор Робертса прост в реализации и обладает высоким быстродействием, однако сильно чувствителен к помехам [1, 8, 9]. На практике для вычисления дискретных градиентов чаще всего используются операторы Превитта и Собела. Маски оператора Превитта проще реализовать, чем маски оператора Собела, однако у последнего оператора влияние шума угловых элементов маски несколько меньше, что существенно при работе с производными [1, 4, 5]. Следует отметить, что у каждой из масок сумма коэффициентов равна нулю [1].
Оператор Робертса использует четыре значения яркости на изображении [8] и имеет следующий вид:
или
где [Ei,j] — элемент матрицы исходного изображения.
Оператор Собела использует восемь отсчетов яркости в области анализируемого элемента:
Матрицы оператора Собела имеют вид [8]:
где: E — матрица исходного изображения.
В программном представлении изображения [8]:
или
где
Оператор Превитта подобен оператору Собела и отличается от него маской. Матрицы оператора Собела имеют вид [8]:
В качестве методов основанных на производной второго порядка выделяют оператор Лапласиана [1, 8, 9]. Данный оператор обнаруживает границы в местах смены знака производной функции яркости. Но оператор лапласиана очень чувствителен к шуму. Кроме того, использование модуля лапласиана приводит к удвоению контуров, что дает нежелательный эффект и усложняет сегментацию [9, 1, 8]. С целью уменьшить влияние шума часто используют лапласиан в сочетании со сглаживанием, например, по методу Гаусса. Такое сочетание называют оператором лапласиан гауссиана (LaplacianofGaussian — LoG) [1, 9].
Маска оператора Лапласиана гауссиана создается по формуле:
где σ — среднеквадратичное отклонение распределения Гаусса. Маска фильтра имеет вид:
где a — параметр в диапазоне [0,1].
Еще одним часто реализуемым программно методом является Canny [1, 8, 9]. Фактически это набор последовательно применяемых алгоритмов. Данный подход устойчивый к шуму и дает, как правило, лучшие результаты по сравнению с градиентными методами. Но, так как это в принципе набор алгоритмов, то и быстродействие данного метода уступает более простым операторам.
На рисунке 3 приводятся результаты сегментации цифрового изображения с помощью рассмотренных алгоритмов.
Рисунок 3 — Результаты сегментации изображения
На основе реализованных методов фильтрации делается вывод, что для импульсных помех более подходит медианный фильтр, хорошо сохраняющий границы элементов и обладающий быстродействием. Для удаления белого шума наилучшие результаты показаны адаптивным винеровским фильтром.
Градиентные алгоритмы, применяемые для выделения контуров элементов изображений более просты в реализации программными средствами, однако результаты, получаемые с их помощью, зависят от качества исследуемых изображений. Качество выделения контуров методом Cannyвыше. Однако данный алгоритм медленнее, что становится заметно на большом количестве анализируемых изображений.
1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. — М.: Техносфера, 2006. — 1072 с.
2. Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учеб. пособие. — Новосибирск.: Изд-во НГТУ, 2003. — 352 с.
3. Сато Ю. Обработка сигналов. Первое знакомство. 2-е издание. — М.: Додэка XXI, 2009. — 176 с.
4. Оппенгейм А. Шафер Р. Цифровая обработка сигналов. 2-е издание. — М.: Техносфера, 2007. — 856 с.
5. Лайонс Ричард. Цифровая обработка сигналов: 2 изд. — М.: ООО Бином-Пресс, 2006. — 656 с.
6. Сергиенко А.Б. Цифровая обработка сигналов. — СПб.: Питер, 2007. — 752 с.
7. Фисенко В.Т., Фисенко Т.Ю., Компьютерная обработка и распознавание изображений: учеб. пособие. — СПб: СПбГУ ИТМО, 2008. — 192 с.
8. Яне Б. Цифровая обработка изображений. — М.: Техносфера, 2007. — 584 с.
9. Шапиро Л., Стокман Дж. Компьютерное зрение. — М.: БИНОМ. Лаборатория знаний, 2006. — 752 с.