Авторы: Вовк О.Л.
Источник: Проблемы управления и информатики / Институт кибернетики В.М. Глушкова НАН Украины, институт космический исследований. - Киев – 2006 — № 6, c. 100–105.
Построение эффективного механизма поиска в коллекциях визуальной информации является одной из наиболее актуальных задач современных научных исследований в сфере компьютерного зрения. Такая задача возникает как при содержательной классификации изображений (к примеру, в медицинской диагностике), так и при контекстном поиске изображений в базах данных (к примеру, при поиске изображений в сети Интернет) [1].
Выделяют следующие основные технологии индексирования изображений в электронных коллекциях [2, 3]:
Следует отметить, что удовлетворение наибольшего числа запросов возможно при использовании методов, базирующихся на кластеризации, в виду следующих недостатков методов других групп:
Таким образом, эффективность поиска изображений в электронных коллекциях напрямую связана с эффективностью выделения регионов изображений.
Согласно [4, 6] существует две основные группы методов выделения регионов изображений: статистические методы кластеризации и методы выделения границ объектов путем локализации на изображениях резких перепадов яркости цвета. Однако, методы второй из перечисленных групп более чувствительны к вариации освещенности изображений [4]. Исходя из этого, цель данной работы – разработка нового подхода к использованию статистических методов кластеризации для выделения регионов изображений.
В настоящей работе особое внимание уделено разработке подхода к статистической кластеризации пикселей изображений с учетом специфики объектов кластеризации. Необходимо отметить, что данный подход ориентирован на обработку цветовых характеристик изображений в пространстве с равнозначными составляющими (каждая из составляющих имеет одинаковое влияние на результирующий цвет). В качестве примера такого пространства можно привести пространство RGB.
Пусть цвет модели RGB определяется с помощью трех составляющих: R, G, B. Причем, 0≤R≤1, 0≤G≤1, 0≤B≤1 [7].
Возможны следующие основные комбинации, задающие цвет в пространстве RGB.
1. Если числовые значения всех компонентов одинаковые (R=G=B), то результатом является:
2. Если числовое значение только одного из анализируемых компонентов больше нуля, то результатом является цвет, которому соответствует ненулевой компонент, степень яркости этого цвета не линейно зависит от значения компонента (чем меньше числовое значение компонента, тем темнее цвет).
3. Если числовые значения двух из трех компонентов больше нуля, то возможны следующие случаи (третий нулевой):
4. Если числовые значения всех трех компонентов отличны от нуля:
В основе предлагаемого метода решения задачи выделения регионов изображений лежит сравнение цветовых характеристик пикселей и объединение пикселей с визуально подобными цветовыми компонентами в кластеры.
Исходя из приведенных выше сведений, можно выделить несколько необходимых (но не достаточных) условий визуального подобия цветов:
В зависимости от конкретных изображений выполнение введенных условий может быть более или менее строгим. К примеру, для изображений с объектами в одной цветовой гамме условие может выполняться только для одной пары компонентов (например, только R>G).
Все необходимые условия визуального подобия, отмеченные выше, можно учесть с помощью битовой маски взаимосвязей и рангов цветовых компонентов центров кластеров. Младшие биты битовой маски характеризуют отношения между цветовыми компонентами. При рассмотрении трехмерного цветового пространства и введении трех типов связей (меньше, больше, равно) получаем 9 младших бит. Старшие биты маски описывают уровни каждой из трех характеристик (можно учитывать любое число уровней). Предлагается рассмотреть три основных уровня – низкий, средний и высокий. Для этого весь интервал изменения каждой из цветовых составляющих [xl, xh] делится на три равных промежутка – [xl, GL], (GL, GH], (GH, xh], соответствующих приведенным уровням. Причем, числовые значения xl и xh не связаны с конкретным кластером (или изображением), они определяются исходя из свойств анализируемого цветового пространства. При введении трех уровней имеем 9 старших бит маски.
Таким образом, при рассмотрении трех основных отношений между цветовыми компонентами центров кластеров и трех рангов цветовых компонент предлагаемая битовая маска взаимосвязей и рангов будет состоять из 18 бит.
В качестве цветового пространства выберем пространство цветов RGB, для которого xl=0 (0), xh=1 (255).
В таблицах 1, 2 приведены правила формирования старших и младших бит маски для пространства цветов RGB.
Кроме того, предлагается “размывать” границы, как отношений, так и уровней, с помощью введения некоторой погрешности маски – eps.
Таблица 1. Маска рангов компонентов пространства RGB
Старшие биты | |||
Компонент | Предел изменения компонента | Ранг | Маска |
B | [xl …GL] | низкий | 0 0 0 0 0 0 0 0 1 |
(GL…GH] | средний | 0 0 0 0 0 0 0 1 0 | |
(GH… xh] | высокий | 0 0 0 0 0 0 1 0 0 | |
G | [xl …GL] | низкий | 0 0 0 0 0 1 0 0 0 |
(GL…GH] | средний | 0 0 0 0 1 0 0 0 0 | |
(GH… xh] | высокий | 0 0 0 1 0 0 0 0 0 | |
R | [xl …GL] | низкий | 0 0 1 0 0 0 0 0 0 |
(GL…GH] | средний | 0 1 0 0 0 0 0 0 0 | |
(GH… xh] | высокий | 1 0 0 0 0 0 0 0 0 |
Таблица 2. Маска взаимосвязей компонентов пространства RGB
Младшие биты | ||
Компонент | Связь цветовых характеристик | Маска |
R и G | R>G | 0 0 0 0 0 0 0 0 1 |
R=G | 0 0 0 0 0 0 0 1 0 | |
R<G | 0 0 0 0 0 0 1 0 0 | |
R и B | R>B | 0 0 0 0 0 1 0 0 0 |
R=B | 0 0 0 0 1 0 0 0 0 | |
R<B | 0 0 0 1 0 0 0 0 0 | |
G и B | G>B | 0 0 1 0 0 0 0 0 0 |
G=B | 0 1 0 0 0 0 0 0 0 | |
G<B | 1 0 0 0 0 0 0 0 0 |
Приведем анализ рангов цветовых характеристик. К примеру, пусть X1=x1, тогда:
Кроме того, необходимо так подбирать eps, чтобы было удовлетворено условие: (GL+ eps)<(GН– eps).
В отношении между компонентами X1 и Х2 присутствует связь, к примеру “>”, в случае, если удовлетворяется условие X1 > Х2; кроме того, предполагается, что если выполняется условие X1 < (Х2+ eps), то между X1 и Х2 существует и связь “=”. Аналогичными являются рассуждения и для отношения “<”.
Формальное описание построения битовой маски взаимосвязей и рангов кластера с центром {R,G,B} можно записать в следующем виде.
Определим рассматриваемую маску в виде многомерного вектора:
(1)
причем компоненты векторов могут принимать только два значения: 0 или 1.
Условно обозначим вектора рангов вектором , который можно представить как:
(2)
Компоненты вектора определяются по формулам:
(3)
Условно обозначим вектора взаимосвязей вектором , который можно представить в виде:
(4)
Компоненты вектора определяются по формулам:
, , (5)
В таблице 3 приведены примеры построения битовых масок взаимосвязей и рангов для конкретных числовых значений цветовых составляющих центров кластеров. Предполагается, что значения компонентов R, G и B принадлежат интервалу [0, 1], eps=0.1, GL=0.33 и GH=0.67.
Таким образом, стоит отметить, что как пара компонентов может иметь одновременно две связи (к примеру, больше и равно), так и отдельный компонент может иметь два уровня (к примеру, низкий и средний).
Таблица 3. Примеры битовых масок
Числовые значения центров кластеров | Маска | |||||||||||||||||||
R | G | B | Биты | |||||||||||||||||
17 | 16 | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 | |||
0.5 | 0.5 | 0.5 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 |
0.7 | 0.1 | 0.3 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 |
0.2 | 0.8 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 |
0.3 | 0.35 | 0.9 | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 |
0.35 | 0.6 | 0.3 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 0 |
Разработанная маска применяется как для первоначального разделения пикселей по кластерам, так и в качестве критерия окончания кластеризации статистического иерархического агломеративного алгоритма кластеризации [8]. Рассматривается агломеративная технология, согласно которой, изначально каждый пиксель представляет собой отдельный кластер, для каждого из которых производится расчет битовой маски взаимосвязей и рангов. Затем объекты с одинаковыми битовыми масками образуют новые кластеры, последующее объединение которых производится по Евклидовому расстоянию в цветовом пространстве между центрами кластеров. Такие итерации повторяются до тех пор, пока выполняется условие “сравнимости” анализируемых кластеров. В основе условия “сравнимости” – подсчет числа эквивалентных ненулевых бит масок кластеров, претендующих на объединение.
Для построения систем индексации изображений на основе характеристик отдельных кластеров (таких как, характеристики цвета, формы, текстуры) необходимо использование методов кластеризации пикселей изображений, учитывающих специфику объектов кластеризации. Кроме того, иерархические методы и методы группы разбиений не имеют эффективного критерия окончания кластеризации объектов.
Построенная в данной работе маска взаимосвязей и рангов центров кластеров позволяет учесть все приведенные выше ограничения статистических методов кластеризации. В её основе два типа бит – биты взаимосвязей (для учета типов отношений больше, меньше, равно между числовыми значениями составляющих цветового пространства) и биты рангов (для учета уровней числовых значений составляющих цветового пространства).