Назад в библиотеку

Визначення оптимальної метрики для аналізу роботи вейвлет‒кодеру.

Автор: Лавров В.В.
Источник: Автоматизація технологічних об’єктів та процесів. Пошук молодих. Збірник наукових праць ХІI науково-технічної конференції аспірантів та студентів в м. Донецьку 17-20 квітня 2012 р. - Донецьк, ДонНТУ, 2012.

У сучасних мережах значну частину трафіку складає мультимедійний контент, ве-ликою частиною якого є графічні зображення. Для ефективного використання пропу-скного ресурсу при передачі зображень застосовують різноманітні кодери. Вони ма-ють багато способів реалізації, а серед них виділяють кодери з апаратом вейвлет пе-ретворень. Вейвлети дозволяють суттєво стиснути розміри зображення, з втратами, що непомітні для зору людини. При відтворенні стислих зображень виникає питання, як порівняти відтворене зо-браження та оригінал. Адже відомо, що людський зір та машинне бачення кардина-льно відрізняються один від одного. Високі характеристики машинної обробки зовсім не означають високу якість відтворення для людини, тому що зір людини володіє не-лінійною поведінкою та суб’єктивністю. Саме тому існує велика кількість метрик, що аналізують зображення. Метою цієї статті є знайомство з ними та визначення най-кращих для власного кодеру що використовує вейвлет перетворення. Для проекту-вання кодера була обрана проста та ефективна модель, що базується на розкладі зо-браження на кольорові шари (R - червоний, G-зелений, B- блакитний) та обробці ко-жного шару двомірним дискретним вейвлет перетворенням. Для аналізу були обрані наступні метрики: PSNR, SSIM, MSE, Сorr, експертна оцінка людського зору.

PSNR.

PSNR, відношення сигналу до шуму (peak-to-peak signal-to-noise ratio - PSNR) най-частіше використовується для вимірювання рівня спотворень при стисненні зобра-жень. Найпростіше його визначити через середньоквадратичне відхилення (MSE), що для двох монохромних зображень I і K розміру m × n, одне з яких вважається зашум-леними наближенням іншого, обчислюється так:

PSNR

де MAXI - це максимальне значення, прийняте пікселем зображення. Коли пікселі мають розрядність 8 біт, MAXI = 255 [1].

SSIM.

Нещодавно було розроблене сімейство метрик структурної подібності, до якого відносяться наступні метрики: SSIM, MultiScale SSIM, 3-Component SSIM, Spatio-Temporal SSIM. Для даної роботи обираємо метрику SSIM. Вона обчислюється складними алгоритмами, але враховує особливості сприйняття людиною. По-перше розглядається i-тий кадр розміром K×L и значеннями компонент яскравості Y(i), k=1÷K та l=1÷L. Обирається вікно W та вага ω_j для кожної j-ої точки вікна, j=1÷J, J – кількість пікселів у вікні. Далі визначаються середньовагові значення яскравісної компоненти вихідного и закодованого вікна, середньовагові дисперсії яскравісної компоненти вихідного и закодованого вікна, середньовагова коваріація між компонентами яскравості вихідного та закодованого вікон за формулою:

SSIM

Де Y(i) – значення компоненти яскравості j-ой точки вікна, центр якого знаходиться в точці з координатами (k,l) i-того кадру. Далі рахується значення метрики SSIM в точці:

SSIM

MSE.

Ця міра належить до родини метрик що базуються на відхиленнях подібних піксе-лів двох зображень. До неї відносяться: MSAD, Delta, MSE. Де MSE- середньоквадра-тичне відхилення. [3]

MSE

Corr.

У данній роботи використовувався лінійний коефіцієнт кореляції Пірсона, що розраховується за формолою:

Corr

де А- оригінальне зображення, а В - відтворене зображення.[3]

Експертна оцінка людського зору.

Це є суб'єктивний, але у деяких випадках, найбільш ефективний критерій. Оцінка робиться за п’ятибальним принципом. Оцінку "відміно" отримує відтворене зобра-ження, що не відрізняється від оригіналу. Оцінку "добре" отримує відтворене зобра-ження, що має незначні спотворення, але вони помітні лише при порівнянні відтворе-ного зображення та оригіналу. Оцінку "задовільно" отримує зображення що має неве-ликі спотворення. Оцінку "незадовільно" отримує зображення, що має значні спотво-рення. Оцінку "погано" отримує зображення, що важко піддається ідентифікації. Порівняння метрик ведеться на основі критерію оцінки людського зору. Дані ви-ражаються у відносних одиницях та формують графіки залежності значення метрики від коефіцієнту стиску.

Рисунок 1 – Графік залежності метрики від коефіцієнту стиску.

Рисунок 1 – Графік залежності метрики від коефіцієнту стиску.

Аналізуючи результати роботи, можливо дійти висновку, що найбільш адекватними крітеріями оцінки, графіки залежності яких нагадує графік залежності оцінки людського зору є PSNR та SSIM крітерії. Крітерій MSЕ навіть при малих коефіцентах стиску починає стрімко спадати, вказуючи на значні зміни у зображенні, що не є дійсністю. А критерій Corr не достатньо швидко реагує на зниження якості зображення при збільшенні коефіціенту стиску. Таким чином при аналізі результатів роботи кодеру, що базується на вейвлет перетвореннях, можливо використання різноманітних метрик оцінки. Приоитетними серед них є метріки PSNR та SSIM, друга з яких є точнішою але більш сдладною та вимогає більших витрат при розраховуванні.

Перелік посилань

1. Илюшкина Н., Чобану М. "Применение новых критериев оценки качества изо-бражений после их сжатия с потерями", Проектирование и моделирование, №3, стр 66-68, Ста-пресс, 2007 г.

2. Z. Wang, A. C. Bovik, H. R. Sheikh, E. P. Simoncelli, "Image quality assessment: From error visibility to structural similarity," IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600-612, Apr. 2004.

3. Ю.И. Монич, В.В. Старовойтов, "Оценки качества для анализа цифровых изо-бражений", «Искусственный интеллект» №4, стр 376-386, 2008 г.