Effcient DCT-domain Blind Measurement and Reduction of Blocking Artifact

Источник: http://live.ece.utexas.edu/publications/2002/sliu_csvt2002_dctblind.pdf

Введение Кодировка является неотъемлемой частью процедур сжатия изображения и видео. В частности, дискретное косинусное преобразование (DCT) - основа алгоритма кодировки изображения JPEG [1], стандарта кодировки видео MPEG [2], и ITU-T H.261 [3], а так же рекомендации H.263 [4] для визуальных коммуникаций в режиме реального времени. В типичном методе сжатия DCT происходит следующим образом : входное изображение разбивается на небольшие блоки (как правило, 8x8), каждый блок преобразовывается независимо от других для того, чтобы конвертировать элементы изображения в DCT-коэффициенты. DCT-коэффициенты, использующие скалярное квантование, определяются так называемыми матрицами квантования. Все квантованные DCT-коэффициенты преобразуются в поток битов через переменную длину кодирования. На выходе декодера полученные данные декодируются, деквантуются и реконструируются с помощью метода обратного DCT (IDCT). При высокой или умеренной скорости передачи, DCT-кодированное изображение обеспечивает приемлемоевосстановление без заметных артефактов. Однако, при низкой скорости передачи восстановленные изображения в целом страдают от визуально раздражающих артефактов в результате грубого квантования. Одним из основных артефактов является блочный эффект, который выглядит как искусственные границы между соседними блоками. На рис.1 показаны два варианта изображения “Lena” JPEG-закодированных на различных скоростях. Как видно, на изображении не было никаких видимых блочных артефактов при кодировании на уровне 1,0 бит на пиксель (BPP), но при кодировании 0,217 бит на пиксель появились заметные блочные артефакты. Поскольку блочные артефакты значительно ухудшили визуальное качество восстановленного изображения, желательно, чтобы было возможно контролировать и управлять видимостью блочных эффектов в DCT-кодированных изображениях. За последние несколько лет, совсем немного исследований было уделено проблеме уменьшения блочного эффекта в блоке DCT-кодированного изображения. На выходе кодера, различные преобразования методы были предложены, например, с чередованием блоков преобразования [5], комбинированного преобразования [6] и так далее. Однако, так как все эти схемные преобразования не соответствуют существующим стандартам кодирования изображений (видео), таких как JPEG, MPEG, трудно или невозможно адекватно интегрировать их с существующими стандартами. Другой метод заключается в сокращении блочных артефактов с помощью методов постобработки на выходе декодера. Этот метод представляет практический интерес, поскольку он требует только декодированное изображение, следовательно, полностью совместим с известными стандартами кодирования. Типичные методы пост-обработки включают блочно-граничную фильтрацию [4,7], итерационные методы, основанные на теории проекции на выпуклые множества (POCS) [8,9], максимальный подход апостериорной вероятности [10] и др. Однако, итерационные POCS-методы основаны, как правило, на высокой вычислительной сложности, и поэтому их трудно адаптировать к приложениям обработки видео и изображений в режиме реального времени. Самый простой подход - полная низкочастотная фильтрация - имеет очевидный недостаток - размытие информационно-несущих деталей. Для уменьшения блочных артефактов без значительной потери информации высоких частот, были предложены несколько пространственно-вариационных алгоритмов адаптивной фильтрации. Например, в [11], видимость артефактов на каждой границе блока впервые была вычислена на основе нескольких характеристик Human Vision System (HVS); эта информация была использована для выбора адаптивной нелинейной, пространственно-вариационной операции сглаживания на границах блоков. Известно, что блочные артефакты появляются при использовании грубого квантования DCT-коэффициентов в каждом блоке. Однако, большинство методов пост-обработки, предложенных в литературе, направлены на подавление блочных артефактов путем изменения значения пикселей вблизи границы блока. Несмотря на это, некоторые алгоритмы пост-обработки DCT-изображений были также исследованы недавно, где видимость блочных артефактов уменьшается при непосредственном использовании DCT-коэффициентов вместо значений пикселей. В данной работе рассмотрен эффективный алгоритм для оценивания и сокращения блочных артефактов в DCT-кодированных изображениях. Декодированное изображение, состоящее из всех декодированных компонентов каждого блока, используется для обнаружения первичных границ изображения так, чтобы информационные границы можно было сохранить в исходное изображение. Различные методы обработки применяются для трех типов блочных границ в целях уменьшения блочных артефактов при сохранении целостности исходного изображения. Экспериментальные результаты показывают, что предложенный метод измерения блочных артефактов является надежным, и в соответствии с человеческим восприятием предлагаемый метод дает отличное подавление блочных артефактов при сохранении хорошего качества изображения. Еще одним преимуществом предлагаемого метода является то, что используется низкая вычислительная сложность, что делает его подходящим для приложений реального времени. Предложенная методика может быть легко интегрирована в соответствующие известные стандарты DCT-обработки изображений или видео. Модель блочного артефакта Учитывая DCT-сжатое изображение, промоделируем каждый блок, как блок постоянно искаженный белым шумом с нулевым средним и неизвестной дисперсией. Рассмотрим два соседних 8x8 блока - b1 и b2, со средними значениями 1 и 2, соответственно, где . Где и моделируются как одинаково независимые блоки, содержащие белый шум с нулевым средним значением. Когда соответствующие DCT-блоки b1 и b2 использованы с большим параметром квантования, большинство из DCT - коэффициентов становятся равными нулю, что снижает эффект дисперсии и . В результате, 2-D-ступенчатой функции между b1 и b2 (в связи с тем, что ) могут стать видимыми, создавая блочные артефактs, как показано на рис.1б. Основываясь на этом наблюдении, формируем новый сдвинутый блок , состоящий из правой половины b1 и левой половины b2, как показано на рис.2. Блочный артефакт между блоками b1 и b2 может быть смоделирован как 2-D-ступенчатая функция в блоке . Определить 2-D-ступеначтый блок s в новом сдвинутом блоке . является амплитудой 2-D-ступенчатой функции s, ? является средним значением блока с указанием локальной яркости фона, и r является остаточным блоком, в котором описывается локальная активность вокруг границ блока. Чем больше значение , тем более значимый блочный эффект берется при условии, что яркость фона и локальной активности остаются неизменными. В дальнейшем, эффективный DCT-алгоритм применим, но вычисляет лишь DCT-коэффициенты блока и значения параметров в (2). HVS-основанные критерии блочных артефактов В большинстве случаев конечным потребителем визуальной информации является человек. Таким образом, измерения блочных артефактов с использованием соответствующих и известных свойств человеческого восприятия должны доказать эффективность для оценки видимости блочного эффекта [11, 17, 18]. Текстура (или активность) маскировки и яркости маскировки - два хорошо изученных свойства HVS, которые имеют непосредственное отношение к восприятию блочных артефактов [19]. Для того, чтобы использовать активные маскирующие свойства HVS, предположим, что общая активность данного блока является просто суммой активностей всех пространственных частот, и что DCT- коэффициент - амплитуда ожидаемого компонента. Маскирующий эффект также зависит от относительной ориентации маскирования сигнала [19]. Учитываем яркость маскировки: видимость блочных артефактов зависит от локальной яркости фона. Для вертикальных блочных артефактов может быть применен идентичные метод. 2-D карта видимости блочных артефактов на изображении, как результат этого процесса, будет использоваться в следующем разделе при рассмотрении адаптивного удаления блочных артефактов на границах каждого блока. Алгоритм сокращения блочных артефактов Учитывая DCT-границу блока, если его критерий видимости видимости ? ниже определенного порога ?, нет необходимости применять данное преобразование к границе блока. Однако, если ? ? ?, то считается, что работа по снижению видимости блочных артефактов необходима. Порог ? определяется экспериментально. Для того, чтобы избежать размытия информационно-несущих границ изображения, формируется DC-образ, состоящий из DC- компонентов каждого DCT-блока. Значимые (без артефактов) края обнаружены при снижении разрешения изображения. Блоки, которые граничат с обнаруженными границами, называются граничными блоками. По данным критериям локальной видимости блочного эффекта и результатам определения границ, все граничные блоки в изображении можно разделить на три категории: • Тип I: без дальнейшего преобразования; • Тип II: и более двух смежных блоков являются граничными блоками; • Тип III: и по крайней мере один из соседних блоков является граничным.