Н.Е. Губенко, С.С. Кухта - Анализ основных методов встраивания информации для простановки цифрового водяного знака с целью защиты авторских прав на аудиофайлы.

Автор: Н.Е. Губенко, С.С. Кухта
Источник: Программная инженерия: методы и технологии разработки информационновычислительных систем (ПИИВС-2020) / Сборник материалов III Международной научно-практической конференции (студенческая секция) - Донецк, ДонНТУ - 2020, с. 86-90

Аннотация

Н.Е. Губенко, С.С. Кухта. Анализ основных методов встраивания информации для простановки цифрового водяного знака с целью защиты авторских прав на аудиофайлы. Данная статья посвящена обзору основных методов встраивания информации в аудиофайлы. Проводится сравнительный анализ алгоритмов, выделяются преимущества и недостатки каждого из рассматриваемых методов. Формулируются основные рекомендации по выбору оптимального метода сокрытия информации в аудиофайлах.

Введение

Ежедневно в мире создаются сотни различных песен, записываются радиоэфиры и телепередачи. Когда они приобретают форму аудиофайла, возникает вопрос защиты авторских прав на эти объекты. Поскольку с юридической точки зрения механизм защиты авторских прав не совершенен, их необходимо защищать и с технической точки зрения путем проставления цифровых водяных знаков и сокрытия информации непосредственно внутри аудиофайла.

Стеганография - это метод передачи сообщений, который собственно скрывает само наличие связи. В отличие от криптографии, где заинтересованное лицо точно может определить, является ли передаваемое сообщение зашифрованным текстом, методы стеганографии позволяют встраивать секретные сообщения в безобидные послания так, чтобы невозможно было заподозрить существование встроенного тайного послания. Схема стеганографического процесса представлена на рисунке 1.

Рисунок 1 – Схема стеганографического процесса

Главной задачей стеганографического сокрытия информации внутри аудиофайла является встраивание данных таким образом, чтобы минимально исказить объект-контейнер. В связи с этим постоянно возникают новые алгоритмы и методы внедрения информации в аудиофайлы.

Особенности компьютерной стеганографии

В настоящее время в связи с бурным развитием компьютерных технологий появилось новое направление стеганографии – компьютерная (или цифровая) стеганография, которая направлена на встраивание сообщений в различные типы файлов (текстовых, графических, аудио, видео и др.). В связи с возрастанием роли глобальных компьютерных сетей цифровая стеганография приобретает большую значимость. Анализ источников сети Internet позволяет сделать вывод, что в настоящий момент цифровая стеганография используется для следующего:

Скрытая передача сообщений, используемая для различных целей;
Защита конфиденциальной информации от несанкционированного доступа;
Преодоление систем мониторинга и управления сетевыми ресурсами;
Камуфлирование ПО;
Защита авторского права на определенные виды интеллектуальной собственности

В настоящее время разрабатываются новые методы компьютерной стеганографии, основанные на особенностях представления информации в цифровом виде. Часть этих методов использует модификацию палитры, неточность устройств оцифровки, избыточность аудио и видео файлов и другие подходы.

Несмотря на бурное развитие стеганографических методов, в свободном доступе имеется недостаточно ПО для стеганографии в аудиофайлах. Проблема связана с тем, что методы вложения информации в аудио файлы разных битностей несколько различны. В настоящее время не существует универсальных программных решений для работы с аудиофайлами разных битностей.

Обзор основных методов компьютерной стеганографии

Простейшим стеганографическим методом является метод замены наименее значащих битов (НЗБ, LSB). Идея его заключается в следующем: наименее значащие биты амплитуды звукового сигнала заменяются двоичной последовательностью, в которой можно зашифровать значительный объем информации. Метод НЗБ является методом, использующим избыточность звуковых файлов. Схема работы алгоритма LSB представлена на рисунке 2.

Рисунок 2 - схема работы алгоритма LSB (НЗБ)

У данной группы методов имеется ряд отличительных особенностей. Среди негативных можно выделить следующие: с изменением информации искажаются статистические характеристики цифровых потоков. Ввиду этого для снижения компрометирующих признаков требуется коррекция статистических характеристик. К достоинствам можно отнести: возможность скрытой передачи большого объема информации, возможность защиты авторского права, скрытого изображения, товарной марки, регистрационных номеров и т.п. [1]

Более продвинутым и устойчивым к шумам является метод кодирования с расширением спектра. Алгоритм, предложенный в работе [2], удовлетворяет большинству из предъявляемых требований, изложенных выше. ЦВЗ внедряется в аудиосигналы (последовательность 8- или 16-битных отсчетов) путем незначительного изменения амплитуды каждого отсчета. Для обнаружения ЦВЗ не требуется исходного аудиосигнала.

Пусть аудиосигнал состоит из N отсчетов x(i), i =1, …, N, где значение N не меньше 88200 (соответственно 1 секунда для стереоаудиосигнала, дискретизированного на частоте 44,1 кГц). Для того чтобы встроить ЦВЗ, используется функция f(x(i), w(i)), где w(i) — отсчет ЦВЗ, изменяющийся в пределах [-?; ?], ? — некоторая константа. Функция f должна принимать во внимание особенности системы слуха человека во избежание ощутимых искажений исходного сигнала. Отсчет результирующего сигнала получается по формуле 1:

y(i) = x(i) + f(x(i),w(i)) (1)

Метод, предлагающий использовать слабую чувствительность системы слуха человека к незначительным изменениям фазы сигнала, был предложен В. Бендером, Н. Моримото и др. [3]

Внедрение информации модификацией фазы аудиосигнала — это метод, при котором фаза начального сегмента аудиосигнала модифицируется в зависимости от внедряемых данных. Фаза последующих сегментов согласовывается с ним для сохранения разности фаз. Это необходимо потому, что к разности фаз человеческое ухо более чувствительно. Фазовое кодирование, когда оно может быть применено, является одним из наиболее эффективных способов кодирования по критерию отношения сигнал-шум.

Процедура фазового кодирования состоит в следующем:

Звуковой сигнал разбивается на серию N коротких сегментов
К n-му сегменту сигнала применяется k-точечное дискретное преобразование Фурье, где К = I/N, и создаются матрицы фаз и амплитуд.
Запоминается разность фаз между каждыми двумя соседними сегментами
Бинарная последовательность данных представляется, как новая фаза
С учетом разности фаз создается новая матрица фаз для n > 0
Стегокодированный сигнал получается путем применения обратного дискретного преобразования Фурье, к исходной матрице амлитуд и модифицированной матрице фаз

Получателю должны быть известны длина сегмента и точки ДПФ. Перед декодированием последовательность должна быть синхронизирована.

Недостатком этой схемы является ее низкая пропускная способность. В экспериментах В. Бендера и Н. Моримото пропускная способность канала варьировалась от 8 до 32 бит в секунду.

Существует также метод встраивания информации за счет изменения времени задержки эхо-сигнала. Он был предложен теми же авторами, что и предыдущий алгоритм.

Этот метод позволяет внедрять данные в сигнал прикрытия, изменяя параметры эхо-сигнала. К параметрам эхо, несущим внедряемую информацию, относятся: начальная амплитуда, время спада и сдвиг (время задержки между исходным сигналом и его эхо). При уменьшении сдвига два сигнала смешиваются. В определенной точке человеческое ухо перестает различать два сигнала, и эхо воспринимается, как добавочный резонанс. Эту точку трудно определить точно, так как она зависит от исходной записи, типа звука и слушателя. В общем случае, по исследованиям В. Бендера и Н. Моримото, для большинства типов сигналов и для большинства слушателей слияние двух сигналов происходит при расстоянии между ними около 0,001 секунды

Кодер использует два времени задержки: одно для кодирования нуля, другое для кодирования единицы. И то, и другое время задержки меньше того, на котором человеческое ухо может распознать эхо. Кроме уменьшения времени задержки необходимо добиться установлением начальной амплитуды и времени спада того, чтобы внедренная информация не могла быть воспринята системой слуха человека.

Для того, чтобы закодировать более одного бита, исходный сигнал разделяется на маленькие участки. Каждый участок рассматривается как отдельный сигнал, и в него внедряется один бит информации. Результирующий закодированный сигнал (содержащий несколько бит внедренной информации) представляет собой комбинацию отдельных участков.

Для достижения минимума заметности сначала создаются два сигнала: один, содержащий только «единицы», и другой — содержащий только нули. Затем создаются два переключающих сигнала — нулевой и единичный. Каждый из них представляет собой бинарную последовательность, состояние которой зависит от того, какой бит должен быть внедрен в данный участок звукового сигнала.

Далее вычисляется сумма произведений нулевого смешивающего сигнала и аудиосигнала с задержкой «нуль», а также единичного смешивающего сигнала и аудиосигнала с задержкой «единица». Другими словами, когда в аудиосигнал необходимо внедрить «единицу», на выход подается сигнал с задержкой «единица», в противном случае — сигнал с задержкой «нуль». Так как сумма двух смешивающих сигналов всегда равна единице, то обеспечивается гладкий переход между участками аудиосигнала, в которые внедрены различные биты. Блок-схема стегокодера представлена на рисунке 3.

Рисунок 3 - блок-схема работы стегокодера

Декодирование внедренной информации представляет собой определение промежутка времени между сигналом и эхо. Для этого необходимо рассмотреть амплитуду (в двух точках) автокорреляционной функции дискретного косинусного преобразования логарифма спектра мощности (кепстра). В результате вычисления кепстра получится последовательность импульсов (эхо, дублированное каждые секунд).

Не менее популярными являются методы, основанные на использовании особенностей формата. Например, пользуются широким спросом алгоритмы добавления информации в служебные поля, такие, как теги ID3 в МР3-файлах, куда помещается информация об исполнителях, альбоме и комментариях. В это же поле можно встроить информацию, но это нежелательно, поскольку поле ID3 считывается каждым проигрывателем перед воспроизведением аудиофайла.

В то же время, помимо тэгов в аудиофайлах могут присутствовать поля Info, которые уже не декодируются аудио-проигрывателями, а, значит, потенциально подходят для внедрения полезной информации.

В области данных аудиофайлов формата WAVE хранятся несжатые и никоем образом не измененные данные, полученные напрямую с аналоговоцифрового преобразователя, поэтому реализовывать стеганографические алгоритмы на файлах данного типа несколько проще и понятнее.

Поскольку WAVE файлы имеют достаточно большой размер, они не используются для обмена в сети интернет и для хранения музыки на портативных устройствах (плееры, мобильные телефоны). WAVE файлы используются там, где необходимо сохранить первозданный вид файла высокого качества там, где нет ограничения на размер свободного дискового пространства. К примеру, они используются на студиях звукозаписи в программах для редактирования аудио, где экономят время на сжатии и распаковке данных. За счет своего большого размера эти файлы могут хранить в себе лишнюю или повторяемую информацию. Таким образом, в них тоже можно провести стеганографическое сокрытие данных. Однако располагать его следует не случайным образом, а псевдослучайным. Такая последовательность называется стегопуть [4].

Выбор оптимального метода стеганографического сокрытия информации зависит от объекта-контейнера, необходимого уровня устойчивости шумам и каким-либо воздействиям. Наиболее распространенным из вышеупомянутых алгоритмов является алгоритм LSB, однако он плох тем, что уже существуют программы для разрушения стегосообщения, потому нельзя быть уверенным в том, что информация не будет уничтожена или искажена.

С точки зрения сложности реализации системы наибольшие затруднения вызывает метод расширения спектра, поскольку он имеет под собой наиболее серьезный математический аппарат среди рассматриваемых методов. К его достоинствам также можно отнести то, что только этот алгоритм устойчив к разрушению информации при использовании фильтра средних и низких частот.

Методы, основанные на использовании особенностей формата, имеют наибольшую устойчивость к воздействию на файл увеличением размера, так как данные не искажаются, размещаясь в фиксированной области памяти.

Среди основных требований, предъявляемых к методам встраивания информации можно выделить следующие:

Сохранность целостности контейнера
Неотличимость на слух файлов с сообщением и без него
Файл не должен вызывать подозрений
Возможность работы с файлами любой битности
Возможность определять объем контейнера
Многотомность контейнера

Выводы

Из вышеперечисленных особенностей можно сделать вывод, что выбор наиболее оптимального метода сокрытия информации в аудиофайлах зависит от формата выбранного контейнерного аудиофайла, необходимого уровня стойкости к определенного рода шумам и воздействиям, а также необходимой стойкостью к сжатию (поскольку формат МР3, в отличии от WAV, используется как раз для хранения сжатого звука). Наиболее эффективно стеганографические методы работают в файлах формата WAV.

Список литературы

1. Дрюченко М.А. Алгоритмы выявления стеганографического скрытия информации в jpeg файлах. – Воронежский государственный университет, 2007. – 7 с.
2. Грибунин В.Г. Цифровая стеганография. / В.Г. Грибунин, И.Н. Оков, И.В. Туринцев – М.: СОЛОН-ПРЕСС, 2009 – 272 с.
3. Bender W., Gruhl B., Morimoto N., Lu A. Techniques for data hiding // IBM Syst. J., 1996. Vol. 35. № 3.
4. Калинцев, Ю.К. Разборчивость речи в цифровых вококодерах / Ю.К. Калинцев – М.: Радио и связь, 1991. – 320 с.