Источник материала: http://www.sati.archaeology.nsc.ru.
Грищенко А.А. 2003г. САТИ ИАЭТ СОРАН.
Целью данной работы было рассмотрение методов работы с
изображением...
Первая часть включает в себя рассмотрения стандартных методов
работы с изображением, во второй рассматриваются методы выделения границ.
Математическая реализация выполнена в среде
Mathcad.
Работа представляет собой математико-алгоритмическую базу для
разработки ПО.
В качестве материала для примеров использованы изображения
каменных орудий(археологический материал, "Малая Сыя", 1975г. Холюшкин Ю.П.)
фото Грищенко А.А. 2003г.
Любое изображение в цифровом формате представляет собой три двумерных массива по каналам RGB(где значения соответствуют яркости компоненты) или может быть приведено к таковому.
В даннной работе я буду работать с изображением как с одной 2-х мерной
матрицей, где значения от 0 до 255 - яркость точки. Фактически это соответсвует
серому изображению с глубиной яркости 8бит. Яркость точки находится по следующей
формуле:
Y = 0.3*R+0.59*G+0.11*B
Повышение/снижение яркости – это, соответственно, сложение/вычитание значения яркости с некоторым фиксированным значением (также в пределах от 0 до 255); при этом обязательно контролировать выход нового значения канала за пределы диапазона.
Далее в тексте такая коррекция подразумевается после каждого преобразования.
Повышение/снижение контрастности – это, соответственно, умножение/деление значения яркости на некоторое значение (в том числе действительное), что приводит к более чётким яркостным границам. Однако, из свойсв восприятия следует, что изменение контрастности не должно приводить к изменению средней яркости по изображению, поэтому пользуются следующей формулой: NY =K*(Y-dY)+dY, где NY – новое значение, K – коэффициент контрастности, Y – текущее значение, dY – среднее значение по изображению (таким образом, алгоритм является двухпроходовым).
Негатив получается простой заменой значения каждого значения на его дополнение до 255 (например, Y =255-Y)
Бинаризация – это преобразование изображения, в общем случае, к одноцветному (чаще всего к черно-белому). При этом выбирается некий порог (например 128), все значения ниже которого превращаются в цвет фона, а выше – в основной цвет.
апертура фильтра – это размер окна (части изображения), с которым фильтр работает непосредственно в данный момент времени; окно это постепенно передвигается по изображению слева направо и сверху вниз на один пиксель (то есть на следующем шаге фильтр работает с окном, состоящим не только из элементов исходного изображения, но и из элементов, ранее подвергнувшихся преобразованию, – своего рода «принцип снежного кома»). Кроме того, заметим, что если речь идёт об окне, представляющем собой строку элементов изображения ([X][X][X]), то такое преобразование называется одномерным; соответственно, существует и двумерное преобразование.
Данную тему я вынес в раздел сравнения изображений как более соответствующий.
Сглаживающий фильтр основывается на следующем принципе: находится среднее арифметическое значение всех элементов рабочего окна изображения (отдельно по каждому из каналов), после чего это среднее значение становится значением среднего элемента (речь идёт о нечётной апертуре фильтра; для двумерного случая средним элементом будет средний элемент по горизонтали и вертикали, то есть центр квадрата).
Медианный фильтр основывается на нахождении медианы – среднего элемента последовательности в результате её упорядочения по возрастанию/убыванию и присваиванию найденного значения только среднему элементу (речь снова о нечётной апертуре). Например, для той же апертуры 3 и двумерного фильтра (как в примере выше) мы должны упорядочить 9 точек (например, по возрастанию), после чего значение 5й точки упорядоченной последовательности отправить в центр окна фильтра (3х3)
Метод Робертса, является самым простым, самым быстрым и достаточно эффективным. Работает он с двумерной апертурой 2х2 следующего вида
|
Здесь вторая форма записи (с квадратным корнем) работает медленнее, но точнее.
Метод Лапласа осуществляет домножение каждого элемента двумерной апертуры 3х3 на соответствующий элемент так называемой матрицы Лапласа:
|
|
|
= |
|
|
, |
|
, |
|
, |
|
и так далее… |
Метод Уоллеса работает с двумерной апертурой 3х3 следующего вида:
|
Сразу находится новое значение центрального элемента по приведённой выше формуле; при этом, если знаменатель (Ai с нечётными значениями i) равен нулю, то к нему и к числителю добавляется единица (проще добавлять эту единицу всегда).
Метод Собела работает с двумерной апертурой 3х3 следующего вида:
|
X = ( A3 + 2 * A4 +
A5 ) – ( A1 + 2 * A8 + A7
) Y = ( A1 + 2 * A2 + A3 ) – ( A7 + 2 * A6 + A5 ) |
Сначала находятся значения переменных X и Y по приведённым выше формулам. После находится новое значение центрального элемента.
Метод Кирша работает с двумерной апертурой 3х3 следующего вида:
|
Si = Ai + Ai(+)1 +
Ai(+)2 Ti = Ai(+)3 + Ai(+)4 + Ai(+)5 + Ai(+)6 + Ai(+)7 |
Сначала находятся все значения переменных Si и Ti, где i изменяется от 0 до 7, по приведённым выше формулам, в которых «(+)» означает сложение по модулю 8,После находятся значения модуля разности | 5*Si – 3*Ti | для каждого i от 0 до 7 и значение максимума среди этих модулей.
Статистический метод является двухпроходовым и применим для любой апертуры,
даже для прямоугольной. На первом этапе вычисляется среднее значение яркости по
текущему рабочему окну:
Источник материала: http://www.sati.archaeology.nsc.ru.