Назад в библиотеку

Исследование возможности параллельной реализации билтеральной фильтрации для решения задач распознования объектов на изображениях и Depth Image Based Rendering(DIBR)

Автор: Борискин Д. В., Зори С. А.
Источник: VI Международная научная конференция Современные информационные технологии в образовании и научных исследованиях (СИТОНИ – 2019) – Донецк – 2019, Том 1, с. 247-251.

Аннотация

Борискин Д.В., Зори С.А. Исследование возможности билатеральной фильтрации для решения задач распознавание объектов на изображениях и Depth Image Based Rendering. Статья посвящена вопросу исследования возможностей билатеральной фильтрации для использования при решении задач распознавания изображений. Дано описано понятие билатеральной фильтрации, пример её использования. Показано что, решение задач DIBR основаны на эффективном анализе и построении карт глубины, который в свою очередь использует на одном из этапов процедуру билатеральной фильтрации, отличающихся высокой вычислительной сложностью. Таким образом, изучение возможностей эффективной реализации билатеральной фильтрации позволит существенно повысить эффективность DIBR и процедур распознавания изображений.

Введение

Компьютерная обработка и распознавание объектов на изображениях - одно из интенсивно развиваемых отраслей современной компьютеризации. Распознавание 3D объектов по 2D изображениям является одной из важнейших задач анализа сцен и компьютерного зрения в последнее время.

Актуальность работы: в данное время при обработке изображений используются множество фильтров, включая билатеральный. Но для того, чтобы решить задачи по распознаванию объектов на изображениях, нужно подключать дополнительные модули программных систем, что очень затратно в условиях ограниченного времени и вычислительных мощностей. Использование билатерального фильтра для данного спектра задач является обоснованным с точки зрения производительности без необходимости использования дополнительных средств и технологий, т.к. это базовый фильтр, который входит в стандартный функциональный набор ПО по обработке изображений.

Цель работы: исследование и анализ функциональных возможностей билатерального фильтра для распознавания объектов на изображениях.

Билатеральный фильтр

Билатеральный фильтр - это фильтр нелинейного сглаживания изображения с сохранением его границ. Данный фильтр всегда используется при обработке изображений в компьютерной графике.

Математические основы билатеральной фильтрации

Билатеральное фильтрование - это фильтрование с использованием нелинейной техники[1]. Оно расширяет сглаживание Гаусса, что позволяет увеличивать показатели фильтра за счёт соответствующей ему относительной интенсивностью пикселя, который находится в центре изображения. Наглядно это видно в математических формулах, приведённых ниже. Предположим, что функция f(x,y) – исходная, которая отображает яркость изображения, в зависимости от координат x,y и будет равна яркости текущего изображения в данном пикселе. После этого для любого пикселя на оси, в области размера n, где a0 - центр области, r(a) – коэффициент рангового фильтра, который определяется по формуле (1):

pic1

График функции коэффициента рангового фильтра изображён на рисунке 1.

pic2

Рисунок 1 – График функции коэффициента рангового фильтра

Аналогичным образом задаётся коэффициент g(a), который определяется близостью к центральному пикселю по формуле (2):

pic3

где t - масштабный коэффициент, график функции которой изображён на рисунке 2.

pic4

Рисунок 2 – График функции коэффициента g

Для центрального пикселя, который находится в пределах (a0) его новая величина h(a0) рассчитывается по формуле (3):

pic5

где, k - константа нормализации увеличения интенсивности которая высчитывается по формуле(4):

pic6

График функции константы нормализации изображён на рисунке 3.

pic7

Рисунок 3 – График функции константы нормализации

Глубина изображения как основа DIBR

Глубина изображения на основе рендеринга (DIBR)[2] - это процесс синтеза виртуальных видов сцены из захваченных цветных изображений или видео со связанной информацией о глубине. Глубина изображения основывается на глубине цвета изображения[3].

Глубина цвета изображения определяется количеством бит на один пиксель, которое может отображаться на экране монитора. Все данные хранятся в битах. Есть изображения, которые известны как «Базовый цвет», где каждый пиксель определяется значением каналов RGB или CMYK[4]. Пример задания цветов канала RGB изображён на рисунке 4.

pic8

Рисунок 4 – Примеры цветовых диапазонов

Изображения, которые использующие CMYK, тоже являются истинным цветом.

Решение задач DIBR основаны на эффективном анализе и построении карт глубины, который в свою очередь использует на одном из этапов процедуру билатеральной фильтрации, отличающихся высокими вычислительной сложностью и временными затратами. Билатеральный фильтр служит методом предобработки изображения, т.к. распознавание образов затруднено благодаря наличию искажений и шумов на изображениях, а в DIBR - для подавления шумов на картах глубины[5]. Таким образом, изучение возможностей эффективной и параллельной реализации билатеральной фильтрации позволит существенно повысить эффективность DIBR и других процедур распознавания и обработки изображений.

Заключение

В статье описаны возможности билатеральной фильтрации, дано описание алгоритма фильтрации на математическом языке. Показано что, решение задач DIBR основаны на эффективном анализе и построении карт глубины, который в свою очередь использует на одном из этапов процедуру билатеральной фильтрации, отличающихся высокой вычислительной сложностью. Таким образом, изучение возможностей эффективной и параллельной реализации билатеральной фильтрации позволит существенно повысить эффективность DIBR и других процедур распознавания и обработки изображений.

Список использованной литературы

1. Билатеральные фильтры кратко [Электронный ресурс] – Режим доступа: http://old.unick-soft.ru/ – Заглавление с экрана.
2. An overview of free view point Depth-Image-Based Rendering (DIBR) [Электронный ресурс] – Режим доступа: http://www.apsipa.org/ – Заглавление с экрана.
3. Глубина цвета изображения. [Электронный ресурс] – Режим доступа: https://ru.wikipedia.org/ – Заглавление с экрана.
4. Глубина цвета [Электронный ресурс] – Режим доступа: http://fb.ru/– Заглавление с экрана.
5. Directional Joint Bilateral Filter for Depth Images [Электронный ресурс] – Режим доступа: https://www.ncbi.nlm.nih.gov/– Заглавление с экрана.