Перспективи досліджень вейвлет-перетворення з погляду на європейські й світові дослідження

Автор статті - Майдан В.В.


Деякі ідеї теорії вейвлетів з'явилися дуже давно. Наприклад, вже в 1910 році А.Хаар видав повну ортонормальну систему базисних функцій із локальною областю визначення (тепер це називається набагато простіше - вейвлети Хаара). Перша згадка про вейвлети з'явилася в літературі з цифрової обробки та аналізу сейсмічних сигналів (роботи А.Гроссмана та Ж.Морле). Останнім часом виник і сформувався цілий науковий напрямок, пов'язаний із вейвлет-аналізом і теорією вейвлет-перетворення. Вейвлети широко застосовуються для фільтрації й попередньої обробки даних, аналізу стану й прогнозування ситуації на фондових ринках, розпізнавання образів, при обробці й синтезі різних сигналів, наприклад мовних, медичних, для вирішення задач стиснення й обробки зображень, при навчанні нейромереж та в багатьох інших випадках. Незважаючи на те, що теорія вейвлет-перетворення є вже здебільшого сформованою, точного визначення, що ж це таке – «вейвлет», - які функції можна назвати вейвлетами, наскільки мені відомо, не існує. Вейвлети можуть бути ортогональними, напівортогональними, біортогональними. Ці функції можуть бути симетричними, асиметричними та несиметричними. Розрізняють вейвлети з компактною областю визначення й такі що не мають подібної області. Деякі певні функції мають аналітичне вираження, інші - швидкий алгоритм обчислення пов'язаного з ними вейвлет-перетворення.
Зараз одним з найпоширеніших методів діагностики та розпізнавання серцево-судинних захворювань є електрокардіографія. Сигнал ЕКГ характеризується набором зубців, по тимчасових і амплітудних параметрах яких ставиться діагноз. Донедавна процедуру знаходження характеристик зубців виконував лікар-кардіолог, використовую при цьому тільки креслярське приладдя. Така схема достатньо проста і надійна, але вимагає багато часу, і вона працювала протягом довгого часу через відсутність альтернативних підходів до рішення даної задачі. Зараз для аналізу електрокардіограм вмкористовується вейвлет-перетворення. Воно також дуже вдало застосовується в роботі інших електронних медицинських приладь, пов’язаних із біоелектронікою. Одним із найуспішніших застосувань вейвлетів є їх використовування для стиснення зображень. Численні дослідження в цьому напрямку вилилися врешті-решт в ухвалення нового стандарту - JPEG2000. Поки зображення в цьому форматі ще не дуже поширені, але немає ніяких сумнівів у тому, що він повністю витіснить нинішній популярний формат JPEG.
Аналіз бізнес-інформації є необхідною умовою при плануванні діяльності підприємства, ухваленні рішень, пошуку шляхів підвищення прибутковості. Розумний аналіз бізнес-даних і правильне використання одержаної інформації дозволяє значно підвищити ефективність роботи підприємства. При цьому, враховуючи високу динамічність сучасного бізнесу, часто виникає необхідність швидкого і, як наслідок, майже інтуїтивного ухвалення рішення за певним питанням. В таких умовах величезну роль відіграє якнайкраще презентування аналітичної інформації – не є таємницею те, що графічну інформацію (схеми, графіки, карти) людина сприймає краще, аніж жорстку мову цифр. Аналіз даних із використанням безперервного вейвлет-перетворення є зручним, надійним і могутнім інструментом дослідження бізнес-процесів і дозволяє представити результати в дуже спрощеному вигляді, зручному для вивчення та інтерпретації. Це лише декілька найпоширеніших сфер застосування вейвлетів та вевлет-перетворення, тому спектр розвитку теми й подальших виборів певних напрямків дослідження вбачається мені дуже широким.

В роботі з вейвлетами найбільш цікавою вважаю сферу JPEG2000, тому хотів би розглянути її трохи детальніше. Розробка JPEG2000 почалася в 1996 році. Якраз до цього часу стала зрозумілою істотна перевага алгоритмів стиснення на основі вейвлетів перед ДКП (дискретний косинусний перетворювач), використаним в JPEG. Проте, лише ради збільшення ступеню стиснення інвестори наврядчи стали б витрачати величезні гроші. При створенні нового стандарту разом із досягненням більшої ефективності стиснення ставилися ще й такі цілі:
• Об'єднання в рамках єдиної технології стиснення з втратами і без втрат. У доповненнях до JPEG є режим стиснення без втрат, але ця технологія захищена патентами.
• Стійкість алгоритму до помилок каналу зв'язку при передачі стислого зображення. Тут видно націленість нового стандарту на мобільні додатки, на передачу зображень по радіоканалу.
• Уніфікована архітектура декодера. В JPEG є десь 44 різних режими декодування, залежно від додатку. Синтаксис JPEG2000 такий, що незалежно від уживаного способу кодування використовується один і той самий декодер.
• Масштабованість. Залежно від потреби, це може бути масштабованість за розміром, частотним змістом, кількістю кольорів, розміром екрану.
• Обробка певних ділянок зображенні (Region Of Interest). Наприклад, користувача може цікавити не все зображення вулиці, а лише фото окремої машини, він виділяє його (мишею), і декодер з високою якістю відновлює цей фрагмент. (Все неможливо «підняти» з високою якістю через обмеження на об'єм передаваної інформації). До речі, такий режим є у відеокодеку Analog Devices ADV611/ADV613.
• Стиснення зображень великих розмірів.
• Можливість обробки стислого зображення без декомпресії.
Локальна, масштабована будова вейвлет-функцій дозволила вирішити приведені завдання. Робочою групою були розглянуті сотні пропозицій дослідників і відібрані найперспективніші. При цьому велика увага надавалася патентній чистоті - технології не мали бути захищеними ліцензіями.
На поточний час стандарт JPEG2000 складається з 6 частин:
• основна частина - ядро стандарту;
• розширення базового алгоритму стиснення;
• мotion JPEG - для стиснення відео, кадр за кадром;
• тести для підтвердження правильності реалізації;
• програмне забезпечення;
• формат файлу складового (графіка +текст) зображення.
Зараз офіційно опублікованою є лише перша частина стандарту. Недопрацьовані варіанти решти частин можуть бути завантажені з сайту www.jpeg.org

Розглянемо основні блоки, що входять до структурної схеми алгоритму стиснення JPEG2000.
Попередня обробка. Зображення зазвичай є набором ненегативних цілих чисел. На етапі попередньої обробки з нього обчислюють середнє. Крім того, якщо зображення великого розміру, то воно може бути розбите на частини. Тоді кожна частина стискається окремо, а для запобігання появи помітних ліній при з’єднанні частин застосовуються спеціальні заходи.
Вейвлет-перетворення. В першій частині визначені два вейвлет-фільтри - фільтр Добеши для стиснення з втратами, а також біортогональний фільтр із цілочисельними коефіцієнтами для стиснення без втрат. В другій частині стандарту дозволяється застосування будь-яких фільтрів, а також не тільки октавосмугове розбиття, але й довільне (вейвлет-пакети й т.ін.) В стандарті визначено, що вейвлет-перетворення здійснюється не шляхом згортання з імпульсними характеристиками фільтрів, а на основі алгоритму, відомого як ліфтінгова схема.<>br Квантування. В першій частині стандарту визначений рівномірний квантувач із мертвою зоною. У разі стиснення без втрат розмір кроку квантувача дорівнює 1, інакше він вибирається залежно від потрібного ступеню стиснення. Крок квантувача постійний в межах субсмуги. В другій частині стандарту визначена можливість застосування решітчастого квантувача - TCQ.
Ентропійне кодування. Застосовується адаптивний арифметичний кодер (а в JPEG був кодер Хаффмана). Зважаючи на патентні обмеження використовується не QM-кодер розробки IBM, а трохи гірший MQ-кодер, спеціально розроблений для JPEG2000. Кодування ведеться не для всього зображення в цілому й навіть не окремих субсмуг, а дрібніших об'єктів - кодованих блоків (КБ). Розмір кодованого блоку може бути не більш як 4096 пікселів, висота не менше ніж 4 піксели. Таке розбиття хоча й знижує коефіцієнт стиснення, але підвищує стійкість стислого потоку до помилок каналу зв'язку: помилка зіпсує лише невеликий блок. Кодування блоків ведеться в три етапи, бітовими площинами.
Стислий потік даних пакується в пакети. Саме завдяки гнучкій і продуманій будові пакетів можливе досягнення цілей розробки стандарту.
Багато що з приведених нижче робіт було опубліковано в спеціальному випуску журналу Signal Processing: Image Communication №17, 2002 видавництва Elsevier і викладене для вільного доступу в Інтернет.

An overview of JPEG2000, Marcellin M., Gornish M., Bilgin A., Boliek M. - 2000, 10с.
Вступ до стандарту JPEG2000, історія його створення. Стисло описані складники стандарту. Хоча в JPEG2000 задається лише синтаксис потоку даних і будова декодера, в статті детально розбираються аспекти кодування.

JPEG2000 perfomance evaluation and assessment. Santa-Cruz D., Grosbois R., Ebrahimi T. - 2001, 18с.
Робота присвячена порівнянню JPEG2000 з іншими стандартами й широко розповсюдженими алгоритмами. Зокрема, порівнюється ефективність стиснення з JPEG, JPEG-LS, MPEG-4 VTC, SPIHT. Окрім ступеню стиснення порівняння ведеться також за такими важливими показниками, як складність, стійкість до помилок каналу зв'язку. Результати порівняння показують, що в більшості випадків JPEG2000 перевершує інші рішення.

An overview of visual optimization tools in JPEG2000. Zeng W., Daly S., Lei S. - 2001, 20с. Незважаючи на численні дослідження дотепер залишається відкритим питання про об'єктивну міру спотворення, корельованої "на всі сто" з суб'єктивним сприйняттям відновлених зображень. На практиці широко використовують середньоквадратичну похибку, а облік системи людського зору (СЧЗ) виконують шляхом введення різних вагових коефіцієнтів. С роботі детально розглянуті підходи до обліку СЧЗ в стандарті JPEG2000. Порівнюючи їх з методами візуальної оптимізації стандарту JPEG, в статті робиться висновок про те, що навіть при рівних відносинах сигнал/шум зображення, стислі відповідно до JPEG2000, візуально виглядають краще, ніж зображення JPEG.

An overview of quantization in JPEG2000. Marcellin M., Lepley M., Bilgin A., Flohr T., Chinen T., Kasner J. - 2001, 12с. В роботі розглядаються режими квантування в стандарті. Описані як перша, так і друга частина стандарту, як режим без втрат, так і з втратами. Треба відзначити, що перший з авторів статті є автором алгоритму квантування TCQ (trellis coded quantization), рекомендованого для застосування в другій частині стандарту.

Authentication and access control in the JPEG2000 compresed domain. Grosbois R., GerbelotP., Ebrahimi T. - 2001, 10с. В роботі розглядаються способи впровадження цифрових водяних знаків (ЦВЗ) в потіку стислих за стандартом JPEG2000 зображень з метою їх аутентифікації та контролю доступу до них. Робота складається з декількох частин. У першій частині приводяться вимоги до механізму аутентифікації і контролю доступу в даному сценарії. У другій частині коротко описаний JPEG2000. Далі приведений пропонований метод аутентифікації, а в наступних частинах - розмежування доступу до зображення за розміром екрану та рівнем якості.

Стислі відомості про інституції Європи й світу, що в них проводяться вейвлет-дослідження, завдання:

1) Компанія BaseGroup Labs займається розробкою аналітичного програмного забезпечення й консультаціями в області аналізу даних. Фірма розташована в Рязані, Російська Федерація, заснована 22 листопада 1995 року.
Технології:
• Нейронні мережі, генетичні алгоритми, вейвлет аналіз, дерева рішень, асоціативні правила, спектральний аналіз, статистика
• Бази даних, OLAP, здобич даних (Data Mining), аналіз даних, моделювання, прогнозування
Розробка:
• Засоби розробки: Borland Delphi, З, C++, Pascal, VBA, PL SQL, Transact SQL, PHP, Perl, Java;
• Бази даних: Oracle Server, MS SQL Server, Interbase SQL Server, MySQL, Paradox, xBase;
• Операційні системи: MS DOS, MS Windows 95/98/2000/NT4/XP, Linux
Продукти:
Аналітичний платформа Deductor, до складу якої входять:
• Deductor Studio - аналітичний додаток, робоче місце аналітика;
• Deductor Viewer - робоче місце кінцевого користувача;
• Deductor Warehouse - багатовимірне сховище даних.

Контактна інформація:
Web: www.basegroup.ru/labs/reachus.htm
E-mail:info@basegroup.ru

2) National Institutes of Health, Department of Health and Human Services
Дослідження в області Медицини, Біології, Біомедицини.
Контактна інформація:
Bldg. 13, Rm. 3W13
Bethesda, MD 20892-0001
aldroubi@helix.nih.gov

3) Department of Electronics and Communications, SJ College of Engineering, Mysore, 570 006,
India Department of Electrical Engineering, Indian Institute of Technology, Bombay Mumbai, 400 076, India
Дослідження в області аналізу мультизображень та zerotree-філософії для змінення масштабу зображень.
Контактна інформація:
kaulgud@sjce.ac.in
ubdesai@ee.iitb.ac.in

4) Worcester Polytechnic Institute
Дослідження в області виявлення пошкоджень на магнітних носіях інформації.
Контактна інформація:
ahera@wpi.edu
hou@wpi.edu

5) Harbin Institute of Technology. Harbin 150001. ,P.R.. ofChina.

6) Kyoto Institute of Technology, Japan


Використані джерела:

1.Добеши И. Десять лекций по вейвлетам. Москва, "РХД", 2001 г.
2.Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. С.-Петербург, ВУС, 1999 г.
3.Андрей Киселев BaseGroup Labs: www.basegroup.ru
4.Worcester Polytechnic Institute, official site www.wpi.edu

Окрема подяка за результативний пошук: