В.А.Митекин МОДИФИЦИРОВАННЫЕ МЕТОДЫ СТАТИСТИЧЕСКОГО СТЕГОАНАЛИЗА БИНАРНЫХ И ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ

Введение

Алгоритм внедрения «цифровых водяных знаков (далее ЦВЗ)» в бинарные и полутоновые изображения, использующий контроль визуального качества изображения-контейнера, как усовершенствованный вариант алгоритмов DHST (Data Hiding Self-Toggling) и DHSPT (Data Hiding by Smart Pair-Toggling). Основной целью разработки алгоритма являлась минимизация визуальных искажений изображения-контейнера при встраивании ЦВЗ. Целью данной работы является анализ стойкости алгоритма встраивания ЦВЗ, разработка алгоритма статистического стегоанализа для изображений данного вида и исследование его эффективности. В частности, показано, что класс алгоритмов встраивания ЦВЗ, использующих контроль визуального качества, не может быть признан надежным с точки зрения стеганографической стойкости.

 

1. Методы внедрения ЦВЗ

Стеганографическим встраиванием называется процесс встраивания информации в произвольный естественный контейнер (например, изображение), при котором сам факт наличия встроенной информации не может быть обнаружен. Под стойкостью стеганографического алгоритма в данном случае понимается его способность скрывать факт передачи сообщений, а также способность противостоять попыткам нарушителя разрушить или исказить сообщение.

 

1.1. Метод внедрения ЦВЗ в бинарное изображение с контролем визуального качества

Данный метод является модификацией алгоритмов DHST (Data hiding by single toggling) и DPST(Data hiding by pair toggling). Метод ориентирован, прежде всего, на сохранение визуального качества изображения при условии меньших, чем в упомянутых методах, объемов встраиваемой информации. Рассматриваемый метод основан на кодировании встраиваемой информации количеством темных или светлых пикселов в блоке фиксированного размера. В данном случае используется кодирование одного бита встраиваемой информации битом четности блока 3x3. пиксела. Предположим, что имеется бинарное изображения размера NxM пикселов. Разделим его на множество непересекающихся блоков i B, каждый размера 3x3. В каждый из этих блоков будет внедрен бит информации si. Двумерный генератор псевдослучайных точек выбирает блок для внедрения. Решение о необходимости изменения бита в данном блоке принимается на основе формулы «контроля четности». Выбор пиксела-кандидата для внедрения бита ЦВЗ основан на преобладающем цвете в блоке. Предположим, что существует L кандидатов в блоке, из которых нужно выбрать один. На окрестность каждого кандидата наложим матрицу веса размерностью 5x5, с помощью которой чего рассчитаем «вес» каждого кандидата. Наиболее подходящим кандидатом будем называть пиксел-кандидат с наибольшим весом (так называемая CS-схема). Вес r(m,n) является мерой, характеризующей взаимосвязь кандидата и его соседних пикселов. Если найдено несколько кандидатов с одинаковым весом, выбирается любой из них. В результате встраивания значение кандидата с наибольшим весом изменяется на противоположное. Таким образом, один блок содержит один бит ЦВЗ. Данный метод кодирования является наиболее широко распространенным для встраивания ЦВЗ в бинарные изображения. На его основе разработан ряд модифицированных алгоритмов.

 

1.2. Метод внедрения ЦВЗ в полутоновые изображения

Метод основан на представлении полутонового изображения в виде совокупности битовых «слоев», каждый из которых представляет изображение с глубиной цвета 1 бит. Таким образом, данный алгоритм применяется для одного или нескольких выбранных «слоев». Выбранный битовый слой изображения-контейнера модифицируется в соответствии с представленным выше методом. Результатом встраивания ЦВЗ является изображение той же глубины цвета, что и исходное.

 

2.1. Метод статистического стегоанализа, основанный на статистике «пар значений»

Рассмотрим метод стегоанализа на основе анализа статистики «пар значений». Данный метод может быть эффективно использован для стегоанализа наиболее распространенного метода встраивания в «наименьший значащий бит» (LSB), когда младший бит цветовой компоненты каждого пиксела контейнера-изображения заменяется битом скрываемого сообщения. Метод основан на поиске закономерности в вероятностях появления значений яркости в естественных изображениях и изображениях со встроенным ЦВЗ. При замене младшего бита цветовой компоненты очередного пиксела изображения на очередной бит предвари- тельно зашифрованного или сжатого ЦВЗ, значение яркости пиксела модифицированного изображения либо равно значению яркости пиксела контейнера, либо изменяется на единицу с вероятностью ~1/2. Для поиска следов встраивания был предложен метод анализа закономерностей в частотах появления «соседних» значений яркости. Такие пары значений («Pair of Values») различаются только значением наименее значащего бита (далее LSB, НЗБ). Значение яркости, двоичное представление которого заканчивается нулевым битом l, назовем «левым» (L), а соседнее с ним значение яркости, двоичное представление которого заканчивается единичным битом – «правым» (R). Пусть цветовая гамма исходного контейнера включает 8 цветов. Следовательно, при встраивании сообщения в НЗБ цветовой компоненты пикселов необходимо исследовать статистические характеристики в 4 парах номеров цвета.  При замещении битами внедряемого сообщения младших битов яркостной компоненты пикселов контейнера-изображения проявляются аналогичные статистические различия. Cтепень различия между вероятностными распределениями элементов естественных контейнеров и изображений с встроенным ЦВЗ может быть использована для оценки вероятности наличия ЦВЗ в изображении. Данную вероятность удобно определять с использованием критерия согласия. Согласно критерию определяется, насколько распределение исследуемой последовательности близко к характерному для изображений с ЦВЗ распределению. В исследуемой последовательности подсчитывается, сколько раз i n ее элемент i x принял рассматриваемые значения, при общем количестве элементов k .

 

2.2. Модифицированный алгоритм статистического стегоанализа для полутоновых изображений

Описанный метод статистического анализа полноцветных изображений не может быть с достаточной степенью эффективности применен для анализа бинарных изображений, так как основан на статистическом анализе «пар значений» для величины яркости конкретных точек изображения. В случае с бинарными изображениями существует всего два значения яркости пиксела, что делает описанный статистический анализ на основе критерия согласия 2 ч неэффективным. Так как при использовании описанного алгоритма встраивания ЦВЗ изменения вносятся не в конкретный пиксел изображения, а в выбранный по определенному закону пиксел из заданного блока 3x3. , то можно считать, что данный алгоритм изменяет количество блоков c заданным NB в изображении. Определим характер распределения данной величины (количество блоков) для оригинальных изображений и для изображений со встроенным ЦВЗ.

Далее будем рассматривать два класса тестовых изображений:

1. Непосредственно бинарные изображения.

2. Бинарные изображения, полученные из полутоновых путем выделения «младшего» битового слоя.

Определим характер распределения количества блоков с заданным NB для оригинальных изображений из каждого класса и для тех же изображений с ЦВЗ, встроенным в 100% блоков изображения. Из проведенных вычислительных экспериментов следует, что для оригинальных изображений класса 2 распределение является близким к биномиальному распределению с p=0,5, при условии, что блоки NB=0 и NB=9 не учитываются. В то же время, распределение для модифицированных изображений класса 2 не является таковым. Следовательно, статистический анализ для класса 2 (то есть фактически для полутоновых изображений) можно свести к проверке распределения заданной величины NB. В случае, если распределение не является биномиальным с p=0,5, с определенной достоверностью можно говорить о том, что изображение содержит встроенный ЦВЗ. Основываясь на гипотезе о биномиальном распределении величины NB для оригинальных изображений, опишем алгоритм статистического стегоанализа для полутоновых изображений следующим образом.

Шаг 1. Рассмотреть распределение величины NB (количество темных пикселов в блоке), не учитываязначения NB=0 и NB=9.

Шаг 2. Использовать критерий согласия 2  при заданном для сравнения полученной выборки и выборки, сгенерированной по биномиальному закону распределения с p=0,5.

Шаг 3. На основании проверки критерия сделать вывод о наличии или отсутствии в изображении встроенного ЦВЗ.

Для изображений класса 1 (бинарные изображения) характер распределения величины NB неизвестен и в случае оригинального изображения, и в случае изображения со встроенным ЦВЗ. Описанный выше метод анализа не может быть применен для этого класса изображений без соответствующих модификаций.

 

2.3. Модифицированный алгоритм статистического стегоанализа для бинарных изображений

Из описания алгоритма встраивания ЦВЗ известно, что наиболее подходящим кандидатом для внедрения бита информации является пиксел блока 3x3 с наибольшим «весом». Для нахождения веса используется маска 5x5 пикселов с матрицей W, являющаяся упрощенным вариантом «объективной меры визуальных искажений». Исходя из этого, можно считать, что встраивание ЦВЗ в изображение повлечет за собой наиболее значительное изменение количества пиксел с максимальным весом, вне зависимости от значения величины NB в данном блоке. Таким образом, встраивание ЦВЗ должно повлечь за собой наиболее значительные изменения в количестве пикселов с максимальным и близким к максимальному весом. Далее, введем следующие категории пикселов изображения:

1. «Пиксел-кандидат» – пиксел, имеющий максимальный вес в данном блоке 3x3.

2. «Подозреваемый пиксел» – пиксел, имеющий максимальный вес при условии его инвертирования.

Таким образом, пиксел является подозреваемым, если при инвертировании он имеет максимальный вес в блоке. Данный пиксел с наибольшей вероятностью уже был использован для встраивания ЦВЗ, если таковое производилось. Пусть N2x и N1x – общее количество пикселов заданного веса x, принадлежащих, соответственно, к 1 или 2 категории. Рассмотрим распределение величины (N2x-N1x) для оригинального изображения  и изображения со встроенным ЦВЗ.

Из проведенных вычислительных экспериментов следует, что распределение данной величины до и после встраивания значительно различаются только для значений x, близких к максимальному и минимальному весу. Для оригинальных изображений эти значения могут быть оценены. Для модифицированных изображений эти значения значительно превышают соседние и, соответственно, существенно превышают построенные оценки. Опишем алгоритм статистического стегоанализа для бинарных изображений:

Шаг 1. Рассмотреть распределение величины (N2x-N1x), где N2x и N1x – общее количество соответствующих пикселов заданного веса. Построить линейные аппроксимации (N2x-N1x) аппроксимальных величин (N2x-N1x) методом наименьших квадратов, на основе 4-5 значений, например для xmax-7<x<xmax-2 и xmin+2>x>xmin+7, где xmax – максимальный и xmin-минимальный вес пиксела. Результатом будут являться два уравнения вида y=a+bx

Шаг 2. Рассмотреть две выборки независимых случайных величин:

• величины |(N2x-N1x)аппрокс. - (N2x-N1x)|, где x принимает минимальное (x1=xmax) и максимальное значение (x2=xmin).

• величины |(N2x-N1x)аппрокс. - (N2x-N1x)|, где x принимает значения x3=max-1 и x4=min+1, x5=max-2 и x6=min+2.

Шаг 3. Основываясь на предположении, что для оригинальных изображений рассмотренные выборки будут иметь одинаковое математическое ожидание, используем t-критерий Уэлча для проверки при заданном  гипотезы о равенстве мат. Ожиданий двух независимых выборок с неизвестным законом распределения.

Шаг 4. На основании проверки данной гипотезы сделать вывод о наличии ЦВЗ (математические ожидания выборок не равны) или его отсутствии (математические ожидания равны).

 

2.4. Стегоанализ для алгоритмов встраивания «изображения в изображение»

При анализе стеганографических алгоритмов принято полагать, что встраиваемая информация (ЦВЗ) может быть с достаточной точностью описана моделью «белого шума». Данное предположение обосновывается тем фактом, что перед встраиванием ЦВЗ предварительно подвергается декоррелирующему преобразованию (например, шифрованию) .Принципиально отличным является случай, когда декоррелирующее преобразование не используется и ЦВЗ внедряется в изображение контейнер без каких-либо модификаций. Наиболее распространенным подходом в данном случае является встраивание «изображения в изображение», где в качестве изображения - ЦВЗ может выступать, к примеру, логотип или подпись владельца. Данный подход к встраиванию ЦВЗ подробно рассмотрен и реализован. Суть его заключается в замене младших бит изображения-контейнера старшими битами изображения - ЦВЗ, что обеспечивает минимальные визуальные искажения изображения-контейнера.

Метод статистического анализа «пар значений» не может быть эффективно применен для стегоанализа в данном случае, так как основан именно на предположении о «случайности» встраиваемого ЦВЗ. Исследуем эффективность разработанных методов применительно к алгоритму встраивания «изображения в изображение». Как уже было отмечено в разделе 2.2, распределение величины NB для младшего битового слоя является близким к биномиальному распределению с p=0,5, при условии, что блоки NB=0 и NB=9 не учитываются. Проведенный вычислительный эксперимент позволяет утверждать, что для старшего битового слоя такое распределение не наблюдается. Исходя из этого, можно предположить, что разработанный метод стегоанализа для полутоновых изображений применим и для обнаружения встраивания «изображения в изображение».

 

3. Результаты экспериментальных исследований

Для исследования эффективности разработанных алгоритмов был проведен следующий эксперимент.

1. Пятьдесят изображений каждого из классов (бинарные и полутоновые) были приведены к разрешению 640*480 пикселов.

2. Для каждого из классов случайным образом были выбраны по 25 изображений, в которые были внедрены ЦВЗ заданного объема.

3. Изображения каждого класса обрабатывались с помощью описанных алгоритмов. Для каждого изображения был получен детерминированный ре- зультат «наличие ЦВЗ/отсутствие ЦВЗ».

4. Для каждого из классов изображений было подсчитано количество ошибок 1 типа (пропущенное изображение с ЦВЗ) и 2 типа (ложно опознанное изображение без ЦВЗ). Данные операции были независимо повторены для ЦВЗ, встроенного в 50%, 25% и 10% блоков изображения (соответственно, объем ЦВЗ был равен 50%, 25% и 10% от максимального).

 

Заключение

В результате проведенного исследования было показано, что использование рассматриваемого метода стеганографии вносит характерные искажения в статистические характеристики несущего изображения и, следовательно, факт применения данного метода может быть обнаружен средствами статистического стегоанализа. На основе полученных экспериментальных данных было выдвинуто предположение о характере распределения величин NB и (N2x-N1x), что позволило создать метод стегоанализа для рассматриваемого класса изображений, используя стандартный t-критерий Уэлча. Полученные экспериментальные результаты позволяют сделать вывод об эффективности разработанного метода стегоанализа при объеме встраиваемого ЦВЗ более 10% от максимально возможного. Кроме того, данный метод может быть применен для стегоанализа всего класса стеганографических алгоритмов, использующих при встраивании критерий визуального качества изображений. Следовательно, можно сделать вывод о том, что класс алгоритмов встраивания ЦВЗ, использующих контроль визуального качества, не может быть признан надежным с точки зрения стеганографической стойкости.

Источник: http://www.ipsi.smr.ru/research/publication/KO/PDF/KO28/KO28227.pdf
В библиотеку