На схеме указаны основные процедуры и методы обработки
от начального этапа восприятия поля зрения посредством датчиков, например, телекамеры до конечного, которым является распознавание.
(анимация: объем — 37 КБ, количество кадров — 6, количество циклов повторения — бесконечно, размер — 601x823)
Операция предобработки применяется практически всегда после снятия информации с видеодатчика и преследует цель снижения помех на изображении, возникших в
результате дискретизации и квантования, а также подавления внешних шумов. Как правило, это операции усреднения и выравнивания гистограмм.
Сегментация
Сегментация обычно понимается как процесс поиска однородных областей на изображении. Этот этап весьма трудный и в общем виде не алгоритмизированный до конца
для произвольных изображений. Наиболее распространены методы сегментации, основанные на определении однородных яркостей (цветов) или однородностей типа текстур.
При существовании стабильных различий в яркостях отдельных областей поля зрения применяются пороговые методы. Методы наращивания областей эффективны при наличии
устойчивой связности внутри отдельных сегментов. Метод выделения границ хорошо применять, если границы достаточно четкие и стабильные. Перечисленные методы служат
для выделения сегментов по критерию однородных яркостей. Заметим, что один из самых эффективных методов наращивания областей предполагает выбор стартовых точек
либо с помощью оператора (алгоритм центроидного связывания), либо автоматически. Эффективным здесь представляется метод водоразделов, основанный на поиске локальных
минимумов с последующей группировкой вокруг них областей по связности.
Все методы весьма приемлемы с точки зрения вычислительных затрат, однако, для каждого из них характерна неоднозначность разметки точек в реальных ситуациях из-за
необходимости применения эвристик (выбор порогов совпадения яркостей, выбор цифровых масок и т.д.). Заслуживает внимания в связи с этим предложенный метод
многозначной разметки, основанный на комбинации различных приемов для снижения неопределенности. Важное практическое значение имеют допускающие параллельную
обработку алгоритмы ускорения процесса разметки на основе логического анализа соседних элементов.
Для описания и сегментации свойств изображений, именно, однородности, шероховатости, регулярности, применяют текстурные методы делящиеся условно на две
категории: статистические и структурные. Примером статистического подхода является использование матриц совпадений, формируемых из исходных изображений, с
последующим подсчетом статистических моментов и энтропии. При структурном подходе, например, на основе мозаики Вороного, строится множество многоугольников.
Многоугольники с общими свойствами объединяют в области. Для исследования общих свойств часто используют признаки - моменты многоугольников.
После сегментации возникают помехи в виде как разрозненных изменений изолированных элементов изображения, так и в виде искажений некоторых связных областей.
Не останавливаясь подробно на методах борьбы с подобными помехами, отметим лишь, что на практике наибольшее распространение получили цифровые фильтры-маски и
нелинейные фильтры типа медианных. При этом в случае сегментации путем выделения границ использование усредняющих фильтров-масок невозможно, так как границы
при этом не подчеркиваются, а размываются. Для подчеркивания контуров применяются специальные операторы интегрального типа.
Распознавание
Распознавание - чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения,
выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися
шумами.
Заключение
Процесс распознавания изображений является сложной многоэтапной процедурой. Многоэтапность (иерархичность) обусловлена тем, что различные задачи обработки
самом деле тесно связаны и качество решения одной из них влияет на выбор метода решения остальных. Так выбор метода распознавания зависит от конкретных условий
предъявления входных изображений, в том числе характера фона, других изображений, помеховой обстановки и связан с выбором методов предобработки, сегментации,
фильтрации.
Литература
1. Гиренко А.В., Ляшенко В.В., Машталир В.П., Путятин Е.П. Методы корреляционного обнаружения объектов // Харьков: АО “БизнесИнформ”, 1996. 112 с.
2. Chen C.H., Rau L.F., Wang P.S.P. Handbook of pattern recognition and computer vision // Singapore-New Jersey-London-Hong Kong: World Scientific Publishing Co. Pte. Ltd., 1995. 984 p.
3. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике // М: Машиностроение, 1990. 320 с.
4. Ватолин Д., Обухов А., Гришин С. Фильтр для удаления "блочности" на видео данных / VirtualDub MSU Smart Deblocking Filter [Электронный ресурс] //
Ватолин Д., Обухов А., Гришин С. - режим доступа:
http://compression.ru/video/deblocking/smartdeblocking.html
5. Ричардс С., Вудс Р. Цифровая обработка изображений. // М.: Техносфера, 2005. 1072 с.
6. Вестник Национального Технического Университета “Харьковский политехнический институт” Выпуск 114. // Харьков: НТУ “ХПИ”, 2001. 128с.
7. Shalkoff R.J. Digital image processing and computer vision. // – New York-Chichester-Brisbane-Toronto-Singapore: John Wiley & Sons, Inc., 1989. 489 p.
8. Шапиро Л., Стокман Дж. Компьютерное зрение. Пер. с англ. // М.: БИНОМ. Лаборатория знаний,. 2006. 752 с.
9. Проблемы бионики. Всеукраинский межведомственный сборник. Выпуск 50. // Харьков: “ХГТУРЭ”, 1999. 217с.
10. Калинкина Д. Ватолин Д. Проблема подавления шума на изображениях и видео и различные подходы к ее решению [Электронный ресурс] //
Калинкина Д. Ватолин Д. - режим доступа: http://cgm.computergraphics.ru/content/view/74