Источник информации: http://www.butovo.com/~zss/bw_morf.html
Одной из фундаментальных проблем анализа изображений является создание адекватного математического описания изображений, передающего их содержание, смысл. Иными словами, это описание должно отражать лишь существенные (с точки зрения решаемой задачи) особенности изображения, и не зависеть от несущественных деталей. В морфологическом анализе такими несущественными характеристиками являются условия регистрации изображений объекта или сцены и параметры регистрирующей аппаратуры. Методы морфологического анализа являются, таким образом, шагом на пути решения проблемы описания семантики изображений.
Хорошо известно, что изображения одной и той же сцены, отвечающие различным условиям освещения и(или) измененным оптическим свойствам объектов могут отличаться радикально. Это обстоятельство порождает значительные трудности в прикладных задачах анализа и интерпретации изображений реальных сцен, в которых решение не должно зависеть от условий регистрации изображений. Речь идет, например, о задачах выделения неизвестного объекта на фоне известной местности, известного объекта на произвольном фоне при неконтролируемых условиях освещения, о задаче совмещения изображений одной и той же сцены, полученной в различных спектральных диапазонах и т.д.
Для решения перечисленных задач были разработаны методы морфологического анализа изображений, оказавшиеся достаточно эффективным[1,2].
Основную идею этих методов поясним на следующем примере. Рассмотрим изображение, сформированное с помощью видеокамеры в видимом диапазоне спектра. Это изображение несет, как правило, наиболее подробную информацию о геометрической форме изображаемых объектов сцены. Если предположить, что одна и та же поверхность объекта, отображаемая на видеоизображении областью однородной яркости, имеет однородные свойства, отражаемые на изображениях иной природы - в ИК или радиодиапазонах и др., то любые изображения данной сцены, полученные тем или иным способом, будучи связанными с геометрическими свойствами объектов сцены, могут быть получены путем преобразования яркости видеоизображения. В этой ситуации различная природа устройств формирования изображения или изменившиеся условия освещения и т.п. могут моделироваться путем всевозможных преобразований яркости исходного видеоизображения. Максимальный инвариант такого класса преобразований определит все то, что относится к данной сцене и не зависит от условий формирования изображений - его можно назвать формой. Поскольку этот инвариант форму сцены полностью не определяет, его называют формой изображения сцены. Отличия формы одного изображения от формы другого характеризуют свойства сцены, не связанные с условиями регистрации, и могут отражать изменения в содержании изображаемого - например, наличие новых объектов или отсутствие старых. Яркость ИК изображений или изображений локатора, несущую информацию качественного характера о физических свойствах объектов - температурном контрасте или относительной скорости приемника и объекта - естественно связать с геометрической формой изображения сцены и тем самым "привязать" к конкретным объектам сцены.
Важным классом задач, предшествующих решению задачи сравнения по форме предъявленных изображений, являются задачи совмещения и выделения заданных фрагментов. Например, дано изображение местности, полученное с некоторой "точки зрения", и на нем выделен определенный фрагмент. На другом изображении, полученном при других условиях и (или) в другом диапазоне спектра, требуется указать выделенный фрагмент местности и уточнить "точку зрения", с которой оно получено. Как известно, в таких задачах плохо работают широко распространенные корреляционные методы [1,2], это обусловлено значительным искажением распределения яркости на искомом фрагменте по сравнению с выделенным на исходном изображении, которое не сводится к однородному изменению яркости и контраста фрагмента как целого.
Итак, в основе методов морфологического анализа лежит математическое понятие формы. Под формой изображения понимается максимальный инвариант преобразований изображения, которым оно подвергается при изменении условий наблюдения, изменении параметров регистрирующей аппаратуры и др. [1].
Форма, таким образом, определяется не только исследуемым объектом или сценой, но и тесно связана с моделью регистрации изображения объекта или сцены. Например, если речь идет о задачах сравнения или классификации объектов, состоящих из однородно светорассеивающих плоскостей по их изображениям, полученным при сохранении ракурса, но при различных условиях освещения, то под формой изображения можно понимать максимальный инвариант преобразования яркостей изображения, каковым является ортогональный проектор в гильбертовом пространстве изображений на множество кусочно-постоянных изображений [1]. Таким образом, построение формы изображения является основополагающей частью задач морфологического анализа.
Поясним понятие формы изображения сначала на простом примере. Рассмотрим изображения "единицы", представленные на рис.1:
Все представленные на рис.1 изображения имеют одну и ту же форму (в обычном понимании) и отличаются лишь условиями регистрации. Формально каждое изображение можно задать как функцию
определенную на поле зрения X и принимающую два значения: С1 и С2на его подмножествах А1 "единице" и А2 - "фоне" соответственно, c (ћ ) - индикаторная функция:
,
причем множества А1 и А2 не пересекаются.
Следует отметить, что, кроме изображений "единицы", можно рассмотреть изображение однородного поля зрения. Форму такого изображения естественно считать более простой, чем форма "единицы".
При таком соглашении форма любого изображения f', полученного с помощью преобразования яркостей F ( f'О Vf =F(f)) не сложнее, чем форма f, и мы будем отмечать этот факт, записывая f'<f. Про такие изображения будем говорить также, что они сравнимы по форме с f. Изображения f' и f назовем эквивалентными по форме, если f'<f и f'>f. Факт эквивалентности изображений будем отмечать как f'~f.
Форма изображения f состоит из изображений f'<f , которые сравнимы по форме с f, но не обязательно сравнимы по форме между собой.
Что касается других свойств множества F, определяющего модель формирования яркости изображений, то в большинстве случаев его можно считать выпуклым. Выпуклость и замкнутость F гарантирует для наблюдаемого изображения g существование оператора проецирования Pf на Vf, который определяется с помощью решения следующей задачи наилучшего приближения :
.
Изображение Pfg является самым лучшим приближением изображения g изображениями, форма которых не сложнее, чем форма f, соответственно, изображение g-Pfg представляет все то, что отличает g по форме от f.
В системах охранной сигнализации основной задачей является обнаружение и выделение исчезнувших и появившихся объектов. Причем задача должна решаться независимо от условий освещения.
Рис.2 |
Рис.3 |
Рис. 4 |
Рис. 5 |
На рис. 2 и 3 представлены исходные данные - изображения одного и того же поля зрения, полученные в разное время суток. Требовалось выделить объекты, которые присутствуют в первом изображении и отсутствуют во втором.
Рис. 4 демонстрирует тот факт, что простое вычитание изображений не приводит к искомому выделению объектов, т.к. они имеют разное распределение яркостей.
Рис. 5 представляет изображение g-Pfg отображающее различие по форме в двух изображениях. На рисунке ярко виден исчезнувший объект.
Задача построения формы изображения является существенной частью морфологического анализа. От того, насколько качественно построена форма, существенно зависит и результат решения задачи морфологического анализа.
Один из способов построения формы состоит в задании областей постоянной яркости по физическим свойствам объекта, т.е. по расположению однородно светящихся или отражающих граней или границ относительно наблюдателя. Приписывая этим областям всевозможные яркости, получим форму изображения как множество изображений. Если же мы не имеем столь подробных сведений об объекте исследования, то мы можем построить форму по какому-либо одному изображению, зная, к каким преобразованиям яркости данного изображения могут привести изменившиеся условия наблюдения.
Любое изображение, форма которого не сложнее f, можно получить подбором яркостей Сi. Таким образом, построение формы изображения заключается в определении индикаторных функций c i. В простейшем случае можно диапазон изменения яркостей изображения f разбить на n одинаковых интервалов.
Однако процесс регистрации и оцифровки изображения обязательно сопровождается некоторой погрешностью, поэтому будем считать, что выходное изображение некоторой системы является суммой "идеального", незашумленного изображения f(x) и шума n(x):
Как аппроксимировать форму изображения f, если само изображение f ненаблюдаемо, а доступна наблюдению лишь его искаженная шумом версия g? Для решения этой проблемы воспользуемся тем фактом, что множество кусочно постоянных изображений является всюду плотным. Это означает, что существует последовательность {fN}, сходящаяся к f. Аппроксимация формы Vf состоит теперь в том, чтобы использовать форму VfN кусочно постоянного изображения fN, достаточно близкого к f, вместо формы изображения f. Близость изображений fN и f здесь понимается в том смысле, что их разность f-fN должна быть мала по сравнению с шумом g.
Однако само изображение f ненаблюдаемо, в нашем распоряжении имеется лишь его зашумленная версия x. Поэтому, выбирая слишком высокую точность аппроксимации изображения x кусочно постоянным изображением, мы вместе с формой изображения f будем аппроксимировать и форму шумового изображения, не имеющего отношения к сути проблемы. Если же точность приближения x изображением fN недостаточна, мы можем потерять важные особенности формы изображения f. Поэтому необходим критерий выбора точности аппроксимации, позволяющий достигнуть компромисса между потерей информации о форме с одной стороны и ее зашумлением с другой.
Будем считать, что проектор PN достаточно хорошо описывает форму f, если изображение f-PN f не заметно на фоне шума. Критерий того, что в аппроксимации VfN формы Vf не упущены важные делали формы изображения f, может быть отождествлен с критерием проверки статистической гипотезе о параметре распределения статистики
.
Рассмотрим теперь способы выбора последовательностей, {fN}, аппроксимирующих изображение g.
1-ый способ. Пусть задана последовательность {A1,:,AN}N, N=1,2,..., все более мелких разбиений поля зрения X, а яркость Ci i=1,...,N, выбирается из решения задачи наилучшего приближения
изображения g кусочно постоянным изображением. Решением этой задачи являются числа
.
2-ой способ. Пусть задана последовательность {C1,:,CN}N, N=1,2,..., яркостей кусочно постоянного изображения, и соответствующее разбиение {A1,:,AN}N поля зрения X, а яркость Ciвыбирается из решения следующей задачи наилучшего приближения
.
В Ai могут быть отнесены лишь те точки x из X, для которых |x -Ci|<|x -Cj|. Те точки, которые, согласно этому принципу, могут быть отнесены к нескольким множествам, должны быть отнесены к одному из них по произволу.
3-ий способ. В этом случае для каждого N множества {A1,:,AN}N , и их яркости {C1,:,CN}N выбираются из условия наилучшей аппроксимации изображения x изображениями вида fN(x)=C1*c 1+:+CNc N.
Аналитически в явном виде решение этой задачи получить не удается. Можно предложить рекуррентный алгоритм, на каждом шаге уменьшающий значение нормы в (7). На первом шаге выбирается некоторое начальное разбиение {C1,:,CN}, и вычисляются множества {A1,:,AN}. На следующем шаге на полученном разбиении поля зрения X вычисляются яркости {С1,:,СN}, затем процедура повторяется до тех пор, пока изменение яркостей за один шаг станет незначительным.
Но такое разбиение не дает гарантии, что в каждом интервале будет находиться одна и только одна область постоянной яркости изображения f. Для выполнения оптимального разбиения на неравномерные интервалы воспользуемся следующим алгоритмом.
После того, как изображение разбито на равномерные интервалы, вычислим изображение f'=Pff. Это изображение будет иметь яркости С1i , i=1,n. Теперь изображение f' разобьем на интервалы, средние значения которых равны С1i. Повторим вычисление изображения Pff, получим яркости С2i . Процесс повторяем до тех пор, пока значения яркостей в двух последующих итерациях не совпадут.
Этот алгоритм представляет собой алгоритм оптимального приближения изображения кусочно постоянными функциями. В результате его применения диапазон яркостей изображения будет разбит на n интервалов, в каждом из которых будет не более одной области постоянной яркости изображения f.
Литература