Назад в библиотеку

Аналитическое исследование JPEG 2000 функционала.

Авторы: Диего Санта-Круз и Турадж Эбрахими

Автор перевода: Лавров В.В.

Источник:Diego Santa-Cruz and Touradj Ebrahimi, An analytical study of JPEG 2000functionalities. In Proc. of the International Conference on Image Processing (ICIP), vol. 2, pp. 49-52, Vancouver, Canada, September 10-13, 2000.

АБСТРАКТ

JPEG 2000, новый ISO / ITU-T стандарт кодирования изображений, разработка которого скоро будет окончена. Недавно были представлены новые стандарты, а именно JPEG-LS и MPEG-4 VTC. Эта статья сравнивает набор функциональных возможностей JPEG 2000, и насколько они хороши, по сравнению с JPEG-LS и MPEG-4 VTC, а также старшего, но широко используемого JPEG и более позднего PNG. Исследование сосредоточено на наборе поддерживаемых функций, хотя исследование сжатия без потерь и с потерями, а так же результаты эффективности сжатия также освещаются. Каждый стандарт, а также принципы алгоритмов что он использует также кратко описаны. Как показывают результаты, JPEG 2000 поддерживает широкий набор функций, среди оценивающихся стандартов, обеспечивая при этом высокую производительность для высокочастотных искажений.

1. ВВЕДЕНИЕ

JPEG 2000 будет следующей ISO / ITU-T стандарт сжатия неподвижных изображений. Были предприняты усилия, чтобы сделать этот новый стандарт подходящим для сегодняшних и завтрашних приложений, обеспечивая функции недоступные в предыдущих стандартах, а также путем предоставления более эффективных функции поддержки, которые предлагаются вместе с ним. Возникает законный вопрос : Какие возможности, предлагает JPEG 2000, и насколько хорошо они выполняются по сравнению с другими стандартами, что предлагают те же функции. Эта статья направлена на предоставление ответа на этот простой, и одновременно сложный вопрос.

2 ОБЗОР СТАНДАРТОВ КОДИРОВАНИЯ НЕПОДВИЖНЫХ ИЗОБРАЖЕНИЙ

Для целей данного исследования мы сравним алгоритм кодирования JPEG 2000 стандарт и следующие три стандарта:. JPEG, MPEG-4 Visual Texture Coding (VTC) и JPEG-LS. Кроме того, мы также включаем PNG. Причины этого выбора в следующем. JPEG является одним из самых популярных методов кодирования изображения в приложениях, начиная от сети Интернет и заканчивая цифровой фотографией. И MPEG-4 и JPEG VTC-LS совсем новые стандарты, которые скоро начнут появляться в различных приложениях. Вполне логично сравнить набор функциональных возможностей JPEG 2000 стандарт не только с новыми продвигаемыми и популярными стандартами, но и со старыми (JPEG), и с тем, которые, предлагаю самые последние современные стандарты. Несмотря на то, PNG формально не является стандартом и не основан на самых современных технологиях, он становится все более популярным интернет- приложением. PNG также претерпевает стандартизации ISO / IEC JTC1/SC24 и в конечном итоге станет международным стандартом ISO / IEC 15948. Несмотря на то, JPEG 2000 поддерживает кодирование двухуровневых и цветных изображений, мы ограничимся однотонными изображениями, так как это один из самых популярных типов изображений. Другие стандарты кодирования изображений JBIG и JBIG2. Хотя они обеспечивает очень хорошую производительность для двухуровневых изображений, они не эффективны для кодирования однотонных изображений с достаточно большим числом уровней. Так как эта статья концентрируется на последних типах изображений, JBIG и JBIG2 не рассматриваются. Другие популярные стандарты для кодирования изображений непрерывного тона GIF и Flash-Pix. GIF ограничен 8 битами палитры изображения и, следовательно, здесь не рассматривается. FlashPix основан на формате JPEG и, следовательно, больше формат, чем стандарт кодирования и не рассматривается в этой статье тоже. Дадим краткое объяснения принципов, лежащих в алгоритмах, что используются в этой работе.

2.1. JPEG

Это очень хорошо известный ISO / ITU-T стандарт, разработанный в конце 1980 года. Есть несколько режимов, определенных для JPEG, в том числе: базовый, без потерь, прогрессивный и иерархический. Базовый режим является самым популярным и поддерживает только кодирование с потерями. Он основан на зигзаг сканировании блоков 8x8 пикселей, равномерном квантовании скалярных величин и кодировании по - Хаффману. Режим без потерь не пользуется популярностью. Он основан на схеме предсказания и кодированию кодами Хаффмана. Следует отметить, что JPEG режимы с потерями и без потерь основаны на совершенно разных алгоритмах. Прогрессивные и иерархические режимы JPEG являются режимами кодирования с потерями и отличаются только способом поиска дискретно-косинусных коэффициентов. Они позволяют реконструировать изображение постепенно, начиная с более низкого качества или более низкого разрешения версии изображения, частично декодируя сжатый битовый поток. Прогрессивный режим кодирует квантованные коэффициенты смесью спектральной селекции и последовательного приближения, в то время, как иерархический режим использует пирамидальный подход к вычислению коэффициентов ДКП.

2.2. MPEG-4 VTC

MPEG-4 Visual Texture Coding (VTC) представляет собой алгоритм, используемый в MPEG-4 стандарте для сжатия текстур в фотореалистичных 3D-моделях. Так как текстуры в 3D-моделях похожа на стоп-кадр, этот алгоритм может быть использован для сжатия неподвижных изображений. Она основана на дискретном вейвлет-преобразование (DWT), скалярном квантовании нуль-дерева и арифметическом кодировании. MPEG-4 VTC поддерживает SNR(отношение сигнал-шум) масштабируемость за счет использования различных уровней квантования: один (SQ), несколько (MQ) и двухуровневым (ВQ). SQ не обеспечивает масштабируемость SNR, MQ предоставляет ограниченную масштабируемость SNR и BQ предоставляет общую масштабируемость SNR. Разрешающая масштабируемость поддерживается за счет использования сканирования диапазона за диапазоном (BB), вместо традиционного сканирования методом нуль-дерева (ТD), который также поддерживается. MPEG-4 VTC также поддерживает кодирование объектов произвольной формы, посредством адаптивного DWT, но не поддерживает кодирование без потерь.

2.3. JPEG-LS

JPEG-LS является последним ISO / ITU-T стандартом для кодирования фотографий без потерь. Он также предусматривает кодирование «почти без потерь». Алгоритм разбит на две части. Часть-I, базовой системы, базируется на основе адаптивного прогнозирования, контекстном моделировании и кодах Голомба. Часть-II представляет расширения, такие как арифметический кодер, но она все еще в стадии подготовки. Этот алгоритм был разработан с низким уровнем сложности, обеспечивая при этом высокую степень сжатия. Однако это не обеспечивает масштабируемость, устойчивость ошибки или другие дополнительные функции.

2.4. PNG

Portable Network Graphics (PNG) представляет собой рекомендации W3C для кодирования неподвижных изображений, которые были разработаны в качестве запатентованной бесплатной замены GIF,так как включал в себя больше возможностей. Он основан на схеме интеллектуального и энтропийного кодирования. Энтропийное кодирование используется Deflate- алгоритмами для популярного Zip -формата для сжатия файлов , которая основана на сочетании LZ77кода с кодированием Хаффмана. PNG способен только на сжатие без потерь, и поддерживает монохромные и полноцветные изображения.

2.5. JPEG 2000

JPEG 2000 находится в стадии разработки, хотя первая часть (ядро системы) технически заморожено и планируется его выпуск для международной стандартизации (IS) декабре 2000 года. Он основан на дискретном вейвлет-преобразовании (DWT), скалярном квантовании, контекстном моделировании, арифметическом кодировании и распределении после сжатия. Энтропийное кодирование выполняется в виде блоков, как правило, 64x64, внутри каждого поддиапазона. DWT может быть выполнено с обратимыми фильтрами, которые обеспечивают кодирования без потерь, или необратимыми фильтрами, которые гарантируют более высокую эффективность кодирования. Кодированные данные организованы в так называемые слои, которые являются уровнями качества, используемые после сжатия распределения для вывода в код-поток в пакеты. JPEG 2000 обеспечивает масштабируемость, SNR и положение прогрессивности или любое их сочетание, код-потоки, ошибки устойчивости произвольной формы области интересов, сжатии с потерями и без потерь, кодирование и т.д., все в едином алгоритме.

3. МЕТОДОЛОГИЯ СРАВНЕНИЯ

Самая важная проблема в методах кодирования является - это эффективность сжатия, которая остается одним из главных приоритетов в разработке продуктов обработки изображений. Тем не менее, мы приводим анализ результатов эффективности сжатия без потерь прогрессивных алгоритмов для оценки того, насколько хорош код алгоритмов различных типов и того, насколько хорошее прогрессивное кодирование поддерживается. Большинство приложений также требует других оценок особенностей алгоритма кодирования, чем просто эффективность сжатия. Это часто называют функционалом. Примерами таких функций являются устойчивость к остаточной ошибки передачи. В следующем разделе мы обобщим результаты исследования.

4. РЕЗУЛЬТАТЫ

Алгоритмы были оценены на семи изображениях из тестового набора JPEG 2000, охватывающего различные типы изображений. Образы «велосипед» (2048x2560) и «кафе» (2048x2560) являются обычными фотографиями , «cmpnd1» (512x768) и «графика» (1688x2347) являются составными документами, состоящими из текста, фотографий и компьютерной графики, «aerial2» (2048x2048) является аэрофотосъемкой, «цель» (512x512) является компьютерной графикой и «мы» (512x448) - ультра-сканирование. Все эти изображения имеют глубину 8 бит на пиксель. Введем программное обеспечение для кодирования изображений: JPEG 2000 - JPEG 2000 Verification Model (VM), 6.1 (ISO / IEC JTC1 /SC29/WG1 N 1580), MPEG-4 –MoMuSys В.М. августа 1999 (ISO / IEC JTC1/SC29/WG11 N 2805). Independent JPEG- Group JPEG implementation, версии 6b, SPMG JPEG-LS -программа реализации Университета Британской Колумбии, версия 2.2, JPEG кодек без потерь из Корнельского университета, версия 1.0, а libpng –реализаця PNG, версии 1.0.3.

Таблица 1. Без потерь сжатия.

Таблица 1. Без потерь сжатия.
Рис. 1. –  PSNR соответствующий среднему СКО для всех  тестовых изображений.  Для каждого алгоритма приведено исполнение при  потерях декодирования  0,25, 0,5, 1 и 2 бита на пиксель для одного и  того же прогрессивного  битового потока.

Рис. 1. – PSNR соответствующий среднему СКО для всех тестовых изображений. Для каждого алгоритма приведено исполнение при потерях декодирования 0,25, 0,5, 1 и 2 бита на пиксель для одного и того же прогрессивного битового потока.

5. ВЫВОДЫ

Эта работа направлена на сравнение эффективности различных алгоритмов, ориентированных на статические изображения. Были рассмотрены многие аспекты в том числе общность алгоритма для кодирования различных типов данных без потерь и с потерями, ошибки устойчивость, сложность, масштабируемость, область интересов и так далее. Результаты показывают, что в зависимости от точки зрения, лучших показателей можно ожидать от JPEG 2000. В то же время, многие существующие стандарты можно эффективно использовать, исходя из потребностей.

6. СПИСОК ЛИТЕРАТУРЫ

1 ISO/IEC JTC 1/SC 29/WG 1, ISO/IEC FCD 15444-1: Information technology — JPEG 2000 image coding system: Core coding system [WG 1 N 1646], Mar. 2000, http://www.jpeg.org/FCD15444-1.htm.

2 William B. Pennebaker and Joan L. Mitchell, JPEG: Still Image Data Compression Standard, Van Nostrand Reinhold, New York, 1992.

3 ISO/IEC, ISO/IEC 14496-2:1999: Information technology — Coding of audio-visual objects — Part 2: Visual, Dec. 1999.

4 ISO/IEC, ISO/IEC 14495-1:1999: Information technology— Lossless and near-lossless compression of continuous-tone still images: Baseline, Dec. 1999.

5 W3C, PNG (Portable Network Graphics) Specification, Oct. 1996, http://www.w3.org/TR/REC-png.

6 ISO/IEC, ISO/IEC 11544:1993 Information technology —Coded representation of picture and audio information—Progressive bi-level image compression, Mar. 1993.

7 ISO/IEC JTC 1/SC 29/WG 1, ISO/IEC FCD 14492:Information technology — Coded representation of picture and audio information — Lossy/Lossless coding of bi-level images [WG 1 N 1359], July 1999, http://www.jpeg.org/public/jbigpt2.htm.

8 Diego Santa-Cruz and Touradj Ebrahimi, “A study of JPEG 2000 still image coding versus other standards,” in Proc.of the X European Signal Processing Conference, Tampere, Finland, Sept. 2000, vol. 2, pp. 673–676.