Ю.П.Пытьев, А.И.Чуличков Морфологический анализ формы изображений

Морфологический анализ формы изображений

Источник информации: http://www.butovo.com/~zss/bw_morf.html

Введение

Одной из фундаментальных проблем анализа изображений является создание адекватного математического описания изображений, передающего их содержание, смысл. Иными словами, это описание должно отражать лишь существенные (с точки зрения решаемой задачи) особенности изображения, и не зависеть от несущественных деталей. В морфологическом анализе такими несущественными характеристиками являются условия регистрации изображений объекта или сцены и параметры регистрирующей аппаратуры. Методы морфологического анализа являются, таким образом, шагом на пути решения проблемы описания семантики изображений.

Хорошо известно, что изображения одной и той же сцены, отвечающие различным условиям освещения и(или) измененным оптическим свойствам объектов могут отличаться радикально. Это обстоятельство порождает значительные трудности в прикладных задачах анализа и интерпретации изображений реальных сцен, в которых решение не должно зависеть от условий регистрации изображений. Речь идет, например, о задачах выделения неизвестного объекта на фоне известной местности, известного объекта на произвольном фоне при неконтролируемых условиях освещения, о задаче совмещения изображений одной и той же сцены, полученной в различных спектральных диапазонах и т.д.

Для решения перечисленных задач были разработаны методы морфологического анализа изображений, оказавшиеся достаточно эффективным[1,2].

Основную идею этих методов поясним на следующем примере. Рассмотрим изображение, сформированное с помощью видеокамеры в видимом диапазоне спектра. Это изображение несет, как правило, наиболее подробную информацию о геометрической форме изображаемых объектов сцены. Если предположить, что одна и та же поверхность объекта, отображаемая на видеоизображении областью однородной яркости, имеет однородные свойства, отражаемые на изображениях иной природы - в ИК или радиодиапазонах и др., то любые изображения данной сцены, полученные тем или иным способом, будучи связанными с геометрическими свойствами объектов сцены, могут быть получены путем преобразования яркости видеоизображения. В этой ситуации различная природа устройств формирования изображения или изменившиеся условия освещения и т.п. могут моделироваться путем всевозможных преобразований яркости исходного видеоизображения. Максимальный инвариант такого класса преобразований определит все то, что относится к данной сцене и не зависит от условий формирования изображений - его можно назвать формой. Поскольку этот инвариант форму сцены полностью не определяет, его называют формой изображения сцены. Отличия формы одного изображения от формы другого характеризуют свойства сцены, не связанные с условиями регистрации, и могут отражать изменения в содержании изображаемого - например, наличие новых объектов или отсутствие старых. Яркость ИК изображений или изображений локатора, несущую информацию качественного характера о физических свойствах объектов - температурном контрасте или относительной скорости приемника и объекта - естественно связать с геометрической формой изображения сцены и тем самым "привязать" к конкретным объектам сцены.

Важным классом задач, предшествующих решению задачи сравнения по форме предъявленных изображений, являются задачи совмещения и выделения заданных фрагментов. Например, дано изображение местности, полученное с некоторой "точки зрения", и на нем выделен определенный фрагмент. На другом изображении, полученном при других условиях и (или) в другом диапазоне спектра, требуется указать выделенный фрагмент местности и уточнить "точку зрения", с которой оно получено. Как известно, в таких задачах плохо работают широко распространенные корреляционные методы [1,2], это обусловлено значительным искажением распределения яркости на искомом фрагменте по сравнению с выделенным на исходном изображении, которое не сводится к однородному изменению яркости и контраста фрагмента как целого.

Итак, в основе методов морфологического анализа лежит математическое понятие формы. Под формой изображения понимается максимальный инвариант преобразований изображения, которым оно подвергается при изменении условий наблюдения, изменении параметров регистрирующей аппаратуры и др. [1].

Форма, таким образом, определяется не только исследуемым объектом или сценой, но и тесно связана с моделью регистрации изображения объекта или сцены. Например, если речь идет о задачах сравнения или классификации объектов, состоящих из однородно светорассеивающих плоскостей по их изображениям, полученным при сохранении ракурса, но при различных условиях освещения, то под формой изображения можно понимать максимальный инвариант преобразования яркостей изображения, каковым является ортогональный проектор в гильбертовом пространстве изображений на множество кусочно-постоянных изображений [1]. Таким образом, построение формы изображения является основополагающей частью задач морфологического анализа.

Понятие формы изображения в задаче морфологического анализа

Поясним понятие формы изображения сначала на простом примере. Рассмотрим изображения "единицы", представленные на рис.1:

Все представленные на рис.1 изображения имеют одну и ту же форму (в обычном понимании) и отличаются лишь условиями регистрации. Формально каждое изображение можно задать как функцию

определенную на поле зрения X и принимающую два значения: С₁ и С₂на его подмножествах А₁ "единице" и А₂ - "фоне" соответственно, c (ћ ) - индикаторная функция:

причем множества А₁ и А₂ не пересекаются.

Следует отметить, что, кроме изображений "единицы", можно рассмотреть изображение однородного поля зрения. Форму такого изображения естественно считать более простой, чем форма "единицы".

При таком соглашении форма любого изображения f', полученного с помощью преобразования яркостей F ( f'О V_f=F(f)) не сложнее, чем форма f, и мы будем отмечать этот факт, записывая f'<f. Про такие изображения будем говорить также, что они сравнимы по форме с f. Изображения f' и f назовем эквивалентными по форме, если f'<f и f'>f. Факт эквивалентности изображений будем отмечать как f'~f.

Форма изображения f состоит из изображений f'<f , которые сравнимы по форме с f, но не обязательно сравнимы по форме между собой.

Что касается других свойств множества F, определяющего модель формирования яркости изображений, то в большинстве случаев его можно считать выпуклым. Выпуклость и замкнутость F гарантирует для наблюдаемого изображения g существование оператора проецирования P_f на V_f, который определяется с помощью решения следующей задачи наилучшего приближения :

Изображение P_fg является самым лучшим приближением изображения g изображениями, форма которых не сложнее, чем форма f, соответственно, изображение g-P_fg представляет все то, что отличает g по форме от f.

Выделение объектов в задаче охранной сигнализации.

В системах охранной сигнализации основной задачей является обнаружение и выделение исчезнувших и появившихся объектов. Причем задача должна решаться независимо от условий освещения.

Рис.2

Рис.3

Рис. 4

Рис. 5

На рис. 2 и 3 представлены исходные данные - изображения одного и того же поля зрения, полученные в разное время суток. Требовалось выделить объекты, которые присутствуют в первом изображении и отсутствуют во втором.

Рис. 4 демонстрирует тот факт, что простое вычитание изображений не приводит к искомому выделению объектов, т.к. они имеют разное распределение яркостей.

Рис. 5 представляет изображение g-P_fg отображающее различие по форме в двух изображениях. На рисунке ярко виден исчезнувший объект.

Построение формы изображения.

Задача построения формы изображения является существенной частью морфологического анализа. От того, насколько качественно построена форма, существенно зависит и результат решения задачи морфологического анализа.

Один из способов построения формы состоит в задании областей постоянной яркости по физическим свойствам объекта, т.е. по расположению однородно светящихся или отражающих граней или границ относительно наблюдателя. Приписывая этим областям всевозможные яркости, получим форму изображения как множество изображений. Если же мы не имеем столь подробных сведений об объекте исследования, то мы можем построить форму по какому-либо одному изображению, зная, к каким преобразованиям яркости данного изображения могут привести изменившиеся условия наблюдения.

Любое изображение, форма которого не сложнее f, можно получить подбором яркостей Сi. Таким образом, построение формы изображения заключается в определении индикаторных функций c _i. В простейшем случае можно диапазон изменения яркостей изображения f разбить на n одинаковых интервалов.

Однако процесс регистрации и оцифровки изображения обязательно сопровождается некоторой погрешностью, поэтому будем считать, что выходное изображение некоторой системы является суммой "идеального", незашумленного изображения f(x) и шума n(x):

Как аппроксимировать форму изображения f, если само изображение f ненаблюдаемо, а доступна наблюдению лишь его искаженная шумом версия g? Для решения этой проблемы воспользуемся тем фактом, что множество кусочно постоянных изображений является всюду плотным. Это означает, что существует последовательность {f_N}, сходящаяся к f. Аппроксимация формы V_f состоит теперь в том, чтобы использовать форму V_fN кусочно постоянного изображения f_N, достаточно близкого к f, вместо формы изображения f. Близость изображений f_N и f здесь понимается в том смысле, что их разность f-f_N должна быть мала по сравнению с шумом g.

Однако само изображение f ненаблюдаемо, в нашем распоряжении имеется лишь его зашумленная версия x. Поэтому, выбирая слишком высокую точность аппроксимации изображения x кусочно постоянным изображением, мы вместе с формой изображения f будем аппроксимировать и форму шумового изображения, не имеющего отношения к сути проблемы. Если же точность приближения x изображением f_N недостаточна, мы можем потерять важные особенности формы изображения f. Поэтому необходим критерий выбора точности аппроксимации, позволяющий достигнуть компромисса между потерей информации о форме с одной стороны и ее зашумлением с другой.

Будем считать, что проектор P_N достаточно хорошо описывает форму f, если изображение f-P_N f не заметно на фоне шума. Критерий того, что в аппроксимации V_fN формы V_fне упущены важные делали формы изображения f, может быть отождествлен с критерием проверки статистической гипотезе о параметре распределения статистики

Рассмотрим теперь способы выбора последовательностей, {f_N}, аппроксимирующих изображение g.

1-ый способ. Пусть задана последовательность {A₁,:,A_N}_N, N=1,2,..., все более мелких разбиений поля зрения X, а яркость C_i i=1,...,N, выбирается из решения задачи наилучшего приближения

изображения g кусочно постоянным изображением. Решением этой задачи являются числа

2-ой способ. Пусть задана последовательность {C₁,:,C_N}_N, N=1,2,..., яркостей кусочно постоянного изображения, и соответствующее разбиение {A₁,:,A_N}_N поля зрения X, а яркость C_iвыбирается из решения следующей задачи наилучшего приближения

В A_i могут быть отнесены лишь те точки x из X, для которых |x -C_i|<|x -C_j|. Те точки, которые, согласно этому принципу, могут быть отнесены к нескольким множествам, должны быть отнесены к одному из них по произволу.

3-ий способ. В этом случае для каждого N множества {A₁,:,A_N}_N , и их яркости {C₁,:,C_N}_N выбираются из условия наилучшей аппроксимации изображения x изображениями вида f_N(x)=C₁*c ₁+:+C_{Nc N}.

Аналитически в явном виде решение этой задачи получить не удается. Можно предложить рекуррентный алгоритм, на каждом шаге уменьшающий значение нормы в (7). На первом шаге выбирается некоторое начальное разбиение {C₁,:,C_N}, и вычисляются множества {A₁,:,A_N}. На следующем шаге на полученном разбиении поля зрения X вычисляются яркости {С₁,:,С_N}, затем процедура повторяется до тех пор, пока изменение яркостей за один шаг станет незначительным.

Но такое разбиение не дает гарантии, что в каждом интервале будет находиться одна и только одна область постоянной яркости изображения f. Для выполнения оптимального разбиения на неравномерные интервалы воспользуемся следующим алгоритмом.

После того, как изображение разбито на равномерные интервалы, вычислим изображение f'=P_ff. Это изображение будет иметь яркости С_1i , i=1,n. Теперь изображение f' разобьем на интервалы, средние значения которых равны С_1i. Повторим вычисление изображения P_ff, получим яркости С₂i . Процесс повторяем до тех пор, пока значения яркостей в двух последующих итерациях не совпадут.

Этот алгоритм представляет собой алгоритм оптимального приближения изображения кусочно постоянными функциями. В результате его применения диапазон яркостей изображения будет разбит на n интервалов, в каждом из которых будет не более одной области постоянной яркости изображения f.

Литература

Пытьев Ю.П. Морфологический анализ изображений. Докл. АН СССР. 1983.т.269, N 5, с.1061-1064
Пытьев Ю.П. Задачи морфологического анализа изображений. В сб. Математические методы исследования природных ресурсов Земли из космоса. Под ред. В.Г.Золотухина. -- М.:Наука 1984.
Pyt'ev Yu.P. Morphological Image Analysis. -- Pattern Recognition and Image Analysis. V.3, No.1, 1993, pp.19--28.
Пытьев Ю.П., Чуличков А.И. ЭВМ анализирует форму изображений. -- М.: Знание, 1988 -- 48с.
Пытьев Ю.П., Чуличков А.И. Морфологический и нечеткий анализ изображений групп точечных объектов. -- в сб. Математические методы распознавания образов. Звенигород, 1993.
Пытьев Ю.П., Чуличков А.И. Морфологический анализ изображений. Комплекс "прибор + ЭВМ" и его возможности. -- Труды VII чтений по космонавтике, М. 1983.
Пытьев Ю.П.,...,Чуличков А.И.,... Морфологический метод в задаче идентификации объектов по их изображениям. -- В сб. Проблемы искусственного интеллекта и распознавания образов. Киев, 1984.
Чуличков А.И. Анализ и распознавание формы сигнала, искаженного линейным преобразованием. -- Математические методы распознавания образов, Рига, 1989.
Антонюк В.А., Задорожный С.С., Пытьев Ю.П. Устройство для выделения изображения дефектной области в телевизионном сигнале. А.с. N 1388541, 1388542, 1986г.