Автор: Борискин Д. В., Зори С. А.
Источник: VI Международная научная конференция Современные информационные технологии в образовании и научных исследованиях (СИТОНИ – 2019)
– Донецк – 2019, Том 1, с. 247-251.
Борискин Д.В., Зори С.А. Исследование возможности билатеральной фильтрации для решения задач распознавание объектов на изображениях и Depth Image Based Rendering. Статья посвящена вопросу исследования возможностей билатеральной фильтрации для использования при решении задач распознавания изображений. Дано описано понятие билатеральной фильтрации, пример её использования. Показано что, решение задач DIBR основаны на эффективном анализе и построении карт глубины, который в свою очередь использует на одном из этапов процедуру билатеральной фильтрации, отличающихся высокой вычислительной сложностью. Таким образом, изучение возможностей эффективной реализации билатеральной фильтрации позволит существенно повысить эффективность DIBR и процедур распознавания изображений.
Компьютерная обработка и распознавание объектов на изображениях - одно из интенсивно развиваемых отраслей современной компьютеризации. Распознавание 3D объектов по 2D изображениям является одной из важнейших задач анализа сцен и компьютерного зрения в последнее время.
Актуальность работы: в данное время при обработке изображений используются множество фильтров, включая билатеральный. Но для того, чтобы решить задачи по распознаванию объектов на изображениях, нужно подключать дополнительные модули программных систем, что очень затратно в условиях ограниченного времени и вычислительных мощностей. Использование билатерального фильтра для данного спектра задач является обоснованным с точки зрения производительности без необходимости использования дополнительных средств и технологий, т.к. это базовый фильтр, который входит в стандартный функциональный набор ПО по обработке изображений.
Цель работы: исследование и анализ функциональных возможностей билатерального фильтра для распознавания объектов на изображениях.
Билатеральный фильтр - это фильтр нелинейного сглаживания изображения с сохранением его границ. Данный фильтр всегда используется при обработке изображений в компьютерной графике.
Билатеральное фильтрование - это фильтрование с использованием нелинейной техники[1]. Оно расширяет сглаживание Гаусса, что позволяет увеличивать показатели фильтра за счёт соответствующей ему относительной интенсивностью пикселя, который находится в центре изображения. Наглядно это видно в математических формулах, приведённых ниже. Предположим, что функция f(x,y) – исходная, которая отображает яркость изображения, в зависимости от координат x,y и будет равна яркости текущего изображения в данном пикселе. После этого для любого пикселя на оси, в области размера n, где a0 - центр области, r(a) – коэффициент рангового фильтра, который определяется по формуле (1):
График функции коэффициента рангового фильтра изображён на рисунке 1.
Аналогичным образом задаётся коэффициент g(a), который определяется близостью к центральному пикселю по формуле (2):
где t - масштабный коэффициент, график функции которой изображён на рисунке 2.
Для центрального пикселя, который находится в пределах (a0) его новая величина h(a0) рассчитывается по формуле (3):
где, k - константа нормализации увеличения интенсивности которая высчитывается по формуле(4):
График функции константы нормализации изображён на рисунке 3.
Глубина изображения на основе рендеринга (DIBR)[2] - это процесс синтеза виртуальных видов сцены из захваченных цветных изображений или видео со связанной информацией о глубине. Глубина изображения основывается на глубине цвета изображения[3].
Глубина цвета изображения определяется количеством бит на один пиксель, которое может отображаться на экране монитора. Все данные хранятся в битах. Есть изображения, которые известны как «Базовый цвет», где каждый пиксель определяется значением каналов RGB или CMYK[4]. Пример задания цветов канала RGB изображён на рисунке 4.
Изображения, которые использующие CMYK, тоже являются истинным цветом.
Решение задач DIBR основаны на эффективном анализе и построении карт глубины, который в свою очередь использует на одном из этапов процедуру билатеральной фильтрации, отличающихся высокими вычислительной сложностью и временными затратами. Билатеральный фильтр служит методом предобработки изображения, т.к. распознавание образов затруднено благодаря наличию искажений и шумов на изображениях, а в DIBR - для подавления шумов на картах глубины[5]. Таким образом, изучение возможностей эффективной и параллельной реализации билатеральной фильтрации позволит существенно повысить эффективность DIBR и других процедур распознавания и обработки изображений.
В статье описаны возможности билатеральной фильтрации, дано описание алгоритма фильтрации на математическом языке. Показано что, решение задач DIBR основаны на эффективном анализе и построении карт глубины, который в свою очередь использует на одном из этапов процедуру билатеральной фильтрации, отличающихся высокой вычислительной сложностью. Таким образом, изучение возможностей эффективной и параллельной реализации билатеральной фильтрации позволит существенно повысить эффективность DIBR и других процедур распознавания и обработки изображений.
1. Билатеральные фильтры кратко [Электронный ресурс] – Режим доступа: http://old.unick-soft.ru/ – Заглавление с экрана.
2. An overview of free view point Depth-Image-Based Rendering (DIBR) [Электронный ресурс] – Режим доступа: http://www.apsipa.org/ – Заглавление с экрана.
3. Глубина цвета изображения. [Электронный ресурс] – Режим доступа: https://ru.wikipedia.org/ – Заглавление с экрана.
4. Глубина цвета [Электронный ресурс] – Режим доступа: http://fb.ru/– Заглавление с экрана.
5. Directional Joint Bilateral Filter for Depth Images [Электронный ресурс] – Режим доступа: https://www.ncbi.nlm.nih.gov/– Заглавление с экрана.