На схемі вказані основні процедури і методи обробки від початкового етапу сприйняття поля зору за допомогою датчиків, наприклад, телекамери до кінцевого, яким є розпізнавання.
(анімація: обсяг — 43 КБ, кількість кадрів — 3, кількість циклів повторення — нескінечно, розмір — 601x823)
Операція передобробки застосовується практично завжди після зняття інформації з відеодатчіка і має на меті зниження перешкод на зображенні, що виникли
в результаті дискретизації і квантування, а також подавлення зовнішніх шумів. Як правило, це операції усереднення і вирівнювання гістограм.
Сегментація
Сегментація зазвичай розуміється як процес пошуку однорідних областей на зображенні. Цей етап дуже важкий і в загальному вигляді не алгоритмізований
до кінця для довільних зображень. Найбільш поширені методи сегментації, засновані на визначенні однорідних яркостей (кольорів) або однорідності типу текстур.
При існуванні стабільних відмінностей в яркості окремих областей поля зору застосовуються порогові методи. Метод нарощування областей ефективен при
наявності стійкої зв'язності всередині окремих сегментів. Метод виділення кордонів добре застосовувати, якщо межі досить чіткі і стабільні. Перераховані
методи служать для виділення сегментів за критерієм однорідних яркостей. Зауважимо, що один з найефективніших методів нарощування областей передбачає
вибір стартових точок або за допомогою оператора (алгоритм центроїдного зв'язування), або автоматично. Ефективним тут є метод вододілів, заснований на пошуку
локальних мінімумів з подальшою угрупованням навколо них областей по зв'язності. Всі методи дуже прийнятні з точки зору обчислювальних витрат, однак, для кожного
з них характерна неоднозначність розмітки отворів в реальних ситуаціях через необхідність застосування евристик (вибір порогів збіги яркостей, вибір цифрових
масок і т.д.). Заслуговує на увагу, у зв'язку з цим запропонований метод багатозначною розмітки, заснований на комбінації різних прийомів для зниження
невизначеності. Важливе практичне значення мають допускаючі паралельну обробку алгоритми прискорення процесу розмітки на основі логічного аналізу сусідніх
елементів.
Для опису та сегментації властивостей зображень, саме, однорідності, шорсткості, регулярності, застосовують текстурні методи, які діляться умовно на дві
категорії: статистичні та структурні. Прикладом статистичного підходу є використання матриць збігів, які формуються з вихідних зображень, з подальшим
підрахунком статистичних моментів та ентропії. При структурному підході, наприклад, на основі мозаїки Вороного, будується багато багатокутників. Багатокутники
з загальними властивостями об'єднують в області. Для дослідження загальних властивостей часто використовують ознаки - моменти багатокутників. Після
сегментації виникають перешкоди у вигляді як розрізнених змін ізольованих елементів зображення, так і у вигляді перекручувань деяких зв'язних областей.
Не зупиняючись детально на методах боротьби з подібними перешкодами, відзначимо лише, що на практиці найбільше поширення отримали цифрові фільтри-маски
і нелінійні фільтри типу медіанних. При цьому у разі сегментації шляхом виділення меж використання усереднюючий фільтрів-масок неможливо, так як кордони
при цьому не підкреслюються, а розмиваються. Для підкреслення контурів застосовуються спеціальні оператори інтегрального типу.
Розпізнавання
Розпізнавання - найчастіше кінцевий етап обробки, що лежить в основі процесів інтерпретації і розуміння. Вхідними для розпізнавання є зображення,
виділені в результаті сегментації і, частково, відреставровані.
Висновок
Процес розпізнавання зображень є складною багатоетапної процедурою. Багатоетапність (ієрархічність) обумовлена тим, що різні задачі обробки насправді
тісно пов'язані і якість вирішення однієї з них впливає на вибір методу вирішення інших. Так вибір методу розпізнавання залежить від конкретних умов
пред'явлення вхідних зображень, у тому числі характеру фону, інших зображень, перешкод і пов'язаний з вибором методів передобробки, сегментації, фільтрації.
Література
1. Гиренко А.В., Ляшенко В.В., Машталир В.П., Путятин Е.П. Методы корреляционного обнаружения объектов // Харьков: АО “БизнесИнформ”, 1996. 112 с.
2. Chen C.H., Rau L.F., Wang P.S.P. Handbook of pattern recognition and computer vision // Singapore-New Jersey-London-Hong Kong: World Scientific Publishing Co. Pte. Ltd., 1995. 984 p.
3. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике // М: Машиностроение, 1990. 320 с.
4. Ватолин Д., Обухов А., Гришин С. Фильтр для удаления "блочности" на видео данных / VirtualDub MSU Smart Deblocking Filter [Электронный ресурс] //
Ватолин Д., Обухов А., Гришин С. - режим доступа:
http://compression.ru/video/deblocking/smartdeblocking.html
5. Ричардс С., Вудс Р. Цифровая обработка изображений. // М.: Техносфера, 2005. 1072 с.
6. Вестник Национального Технического Университета “Харьковский политехнический институт” Выпуск 114. // Харьков: НТУ “ХПИ”, 2001. 128с.
7. Shalkoff R.J. Digital image processing and computer vision. // – New York-Chichester-Brisbane-Toronto-Singapore: John Wiley & Sons, Inc., 1989. 489 p.
8. Шапиро Л., Стокман Дж. Компьютерное зрение. Пер. с англ. // М.: БИНОМ. Лаборатория знаний,. 2006. 752 с.
9. Проблемы бионики. Всеукраинский межведомственный сборник. Выпуск 50. // Харьков: “ХГТУРЭ”, 1999. 217с.
10. Калинкина Д. Ватолин Д. Проблема подавления шума на изображениях и видео и различные подходы к ее решению [Электронный ресурс] //
Калинкина Д. Ватолин Д. - режим доступа: http://cgm.computergraphics.ru/content/view/74