Зміст
- Вступ
- 1. Огляд методів розпізнавання об'єктів на зображеннях
- 2. Опис білатерально фільтра
- 3. Напрямки, цілі і завдання подальших досліджень
- Висновки
- Список джерел
Вступ
Комп'ютерна обробка і розпізнавання об'єктів на зображеннях – одне з інтенсивно що розвиваються галузей сучасної комп'ютеризації. Розпізнавання 3D об'єктів по 2D зображенням є однією з найважливіших задач аналізу сцен і комп'ютерного зору. Базову інформацію для розпізнавання містять в собі зображення в різних його частинах спектра, різних випромінювань, наприклад таких як: оптичні, інфрачервоні, ультразвукові і так далі, які були отримані різними способами, такими як наприклад: телевізійними, фотографічними, лазерними, радіолокаційними, радіаційними і таке інше, перетворені в цифри і представлені у вигляді матриць чисел.
Дослідження по розпізнаванню образів об'єктів відрізняються великою різноманітністю в постановці завдань і виборі засобів їх реалізації, що є одним і наслідків різноманітності областей практичного застосування. Базовими завданнями, які вирішувалися ще в перших розробках систем комп'ютерного зору, є завдання виявлення і подальшого розпізнавання об'єктів, що мають певну форму на основі зашумленних і нерівних зображень. Першопрохідцем в практичних завданнях, які підштовхнули становлення і розвиток галузі розпізнавання об'єктів на зображеннях, була задача ідентифікації і розпізнавання людських облич. Одним з методів, широко застосовуваних при вирішенні задач розпізнавання об'єктів, є використання білатерально фільтра [1,2], але основним істотним його недоліком є швидкість роботи. У зв'язку з цим, актуальним є розгляд і дослідження можливості розпаралелювання фільтра для підвищення його якості та продуктивності.
1. Огляд методів розпізнавання об'єктів на зображеннях
Завдання розпізнавання об'єктів на зображеннях є сучасною і актуальною. Необхідність у вирішенні такого роду завдань виникає в самих різних областях - від військової справи і систем безпеки, до оцифровки аналогових сигналів. Єдиного алгоритму розпізнавання не існує, тому користуються певними методами для різних предметних областей. Наприклад, для оптичного розпізнавання образів можна застосувати метод перебору виду об'єкта під різними кутами, масштабами, зміщеннями і так далі. Для символів потрібно перебирати шрифт, властивості шрифту і так далі. Ще одним підходом є знаходження контуру об'єкта і дослідження його властивості (зв'язність, наявність кутів). У деяких областях для ефективної реалізації розпізнавання образів використовують нейронні мережі, але цей метод вимагає або великої кількості прикладів задач розпізнавання (з правильними відповідями), або спеціальної структури нейронної мережі, яка враховує специфіку даного завдання.
2. Опис білатерально фільтра
Білатеральний фільтр – це фільтр нелінійного згладжування зображення зі збереженням його кордонів. Даний фільтр завжди використовується при обробці зображень, в комп'ютерній графіці і для вирішення інших завдань. Такий великий спектр областей застосування фільтр отримав через своїх особливостей. По-перше він, просто формалізується і легко здійсненний. Крім цього, він не заснований на ітераціях, тобто помірний результат досягається вже після одного його опрацювання, по-друге, фільтр не лінійний і не використовується без різного виду поліпшень, тому що вимагає досить таки великих обчислювальних потужностей, що може дозволити собі не кожен комп'ютер. Таким чином обробка зображення розміром 1024х1024 пікселів на стандартному персональному комп'ютері становитиме близько години.
Варто зазначити, що алгоритми, які прискорюють роботу фільтра, розроблялися раннє, але переважна більшість з них в результаті призводять до втрати якості. Такі алгоритми описують набір методів, які прискорюють роботу фільтра. На поточной момент є два принципи прискорення роботи фільтра, перший – спеціалізовані фільтри, які виконують точні обчислення, але обмежені в певних завданнях. Другий принцип – це використовувати округляється фільтри, вони носять загальний характер, але не дозволяють досягти понад точних результатів. Математики Дуранд і Дорсі перетворили до лінійного вигляду даний фільтр, що дозволяє застосовувати швидкі перетворення Фур'є. Щоб збільшити швидкість обчислень до однієї секунди або менше, вони використовують дискретизацію даних яка знижується, для невеликих зображень. В їх роботі для білатерально фільтра, відводиться місце для обчислення швидкого перетворення Фур'є, і пряма згортка стає більш ефективною, як тільки дані перетворюються, так як ядро досить мало. Хоча їх дослідження не виділяє цього, результати їх роботи досягаються з прямою сверткой, без використання перетворення Фур'є. Розроблена ними методика пов'язана безпосередньо з їх роботою в тому, що в ній через лінійні операції виражений білатеральний фільтр і найбільшу частину прискорення взята від понижувальної дискретизації. Це дозволяє отримати підвищену точність обробки зображення при використанні даної фільтрації. Білатеральний фільтр також використовується для фільтрування карти глибини. Відфільтрована карта глибини має задовільний візуальне якість, тому що швидкий білатеральний фільтр генерує гладку карту глибини всередині гладкою області з аналогічними значеннями пікселів і зберігає різкий розрив по глибині на кордоні об'єкта. Після фільтрації швидким фільтром карта глибини потім використовується для генерації лівого, правого або мульти – перегляду зображення з використанням глибинного рендеринга на основі зображень (DIBR) для 3D візуалізації.
3. Напрямки, цілі і завдання подальших досліджень
Виконаний аналіз показав, що в якості кращого методу рішення задачі щодо прискорення билатеральной фільтрації можна вибрати метод Декомпозиції білатерально фільтра на просторові фільтри, тому що він може обробляти зображення з довільно просторовими і діапазонними ядрами, що збільшує можливості по обробці зображень різних розмірів і з різним наповненням.
Даний метод можне бути також досить легко паралельно реалізований. Наприклад, на графічному процесорі NVIDIA Geforce 8800 GPU при однаковій якості результату, метод в середньому в 10 разів швидше ніж інші методи [8]. Так як в методі використовується незалежна обробка кожного пікселя, метод піддається распараллеливанию, що дозволить прискорити його роботу, і можливо проводити обробку зображень в реальному часі.
Метою і завданнями подальшого дослідження є аналіз функціонування методу і дослідження характеристик його роботи, з подальшою оптимізацією методу за якістю і швидкості роботи, а також відображення отриманого модифікованого методу на паралельні структури обчислювальних систем, отримання характеристик реалізацій і аналіз ефективності виконаних розробок. Як паралельної обчислювальної системи планується використовувати паралельний мультипроцессор відеокарти ПК, роботу з ним організувати за допомогою технологій GPGPU і OpenACC [10].
Висновки
В ході виконання роботи виконано аналіз існуючих засобів розпізнавання об'єктів на зображеннях, були розглянуті методи і алгоритми билатеральной фільтрації для вирішення завдань розпізнавання об'єктів на зображеннях. Дано опис білатерально фільтра і його математичного уявлення, проаналізовані проблеми фільтра і методи їх вирішення. Були розглянуті можливості прискорення і підвищення якості билатеральной фільтрації при обробці зображень за рахунок розпаралелювання обчислювальних процесів, виконаний попередній аналіз можливості розпаралелювання фільтра. Як об'єкт подальших досліджень було обрано метод Декомпозиції білатерально фільтра на просторові фільтри і подальша його паралельна реалізація. Як паралельної обчислювальної системи планується використовувати паралельний мультипроцессор відеокарти ПК, роботу з ним організувати за допомогою технологій GPGPU і OpenACC.
Список джерел
- Билатеральные фильтры кратко. [Электронный ресурс] – Режим доступа: http://old.unick-soft.ru – Загл. с экрана.
- Bilateral filter [Электронный ресурс] – Режим доступа: https://en.wikipedia.org – Загл. с экрана.
- Фурман Я.А Введение в контурный анализ. Москва, ФИЗМАТЛИТ, 2003, 598 с.
- Обзор основных методов контурного анализа для выделения контуров движущихся объектов [Электронный ресурс] – Режим доступа: http://www.engjournal.ru – Загл. с экрана.
- Weickert J., Coherence-Encahncing Shock Filters. Lecture Notes in Computer Science. Springer, 2003, vol. 2781, pp. 1–8.
- Метод предварительной фильтрации изображений для повышения точности распознавания образов. [Электронный ресурс] – Режим доступа: http://www.engjournal.ru – Загл. с экрана.
- W.-Y. Chen and Y.-L. Chang and S.-F. Lin and L.-F. Ding and L.-G. Chen.”Efficient depth image based rendering with edge dependent depth filter and interpolation,” in Proc. ICME, pp. 1314-1317, 2005.
- Анализ эффективности алгоритмов билатеральной фильтрации. [Электронный ресурс] – Режим доступа: http://engineering-science.ru – Загл. с экрана.
- Real-Time Bilateral Filtering. [Электронный ресурс] – Режим доступа: http://vision.ai.illinois.edu – Загл. с экрана.
- OpenACC. [Электронный ресурс] – Режим доступа: https://www.openacc.org – Загл. с экрана.