Автор: Сергей Колесников, author@ci.ru

Источник: газета "Компьютер-Информ" http://www.ci.ru/inform06_06/p_24.htm


Распознавание изображений

Рассмотрев в предыдущих номерах базовые понятия теории распознавания, проблемы и принципы распознавания звуков, в этой статье обратимся к обширному вопросу распознавания изображений.

Введение

Актуальной на сегодняшний день задачей является распознавание машинописных и рукописных текстов в силу ее повседневной необходимости. Кроме того, большое значение имеет оперативный ввод графической информации, подлежащей дальнейшей обработке, в информационные и управляющие системы информации с машиночитаемых бланков.

Касательно технической стороны вопроса, как мы уже отмечали ранее, все находится на достаточно высоком уровне. Разрешающая способность систем оптического ввода уже вплотную приблизилась к возможностям человеческого зрения и даже превосходит его. Примером может служить цифровая фотокамера H2D-39, представленная шведской компанией Hasselblad, оборудованная ПЗС-матрицей в 39 мегапикселей. А современным вычислительным системам вполне по силам скоростная обработка различных параметров изображения.

Однако задача распознавания, сама по себе, предполагает интеллектуальную обработку полученной информации, что представляет определенные сложности. Несомненно, в задаче распознавания символов (распознавание текста, автомобильных номеров) достигнуты огромные успехи. Но, тем не менее, каких-либо универсальных методов обработки изображения, сравнимых по производительности и качеству распознавания с человеческими способностями, нет. Например, в задачах, которые ставятся перед экспертными системами, требуется более глубокий интеллектуальный анализ и высокое быстродействие, этими же свойствами должны обладать роботизированные системы обслуживания. Поэтому обработка изображения в задаче распознавания является одной из центральных проблем.

Постановка задачи

Выделим вопросы, которые возникают при решении задачи распознавания изображений:

Исходя из этого, используются следующие основные принципы:

Этап интерпретации изображения не обозначен четкими границами и включается частично в процесс сегментации и окончательно завершается на этапе распознавания.

Естественно задаться вопросом: а нельзя ли брать изображение и последовательно сравнивать его с эталонами по ряду каких-либо признаков? Но тут возникает ряд проблем и сложностей:

Для решения задачи в целом и на отдельных ее этапах применяются различные методы сегментации, нормализации и распознавания. На приведенной схеме указаны основные процедуры и методы обработки - от начального этапа восприятия поля зрения посредством датчиков до конечного, которым является распознавание. Кратко прокомментируем приведенную схему.

Предобработка

Процедура предварительной обработки используется практически всегда после получения информации с датчика, и представляет собой применение операций усреднения и выравнивания гистограмм, различного типа фильтров для исключения помех, возникающих в результате аппаратной дискретизации и квантования, а также подавления внешних шумов.

Сегментация

Под сегментацией будем понимать процесс поиска однородных областей на изображении. Наиболее часто применяются методы, основанные на определении однородных цветов или текстур, однако для произвольной задачи этот этап не имеет четкого алгоритма.

При существовании стабильных различий в яркостях отдельных областей поля зрения применяются пороговые методы. Приведем пример: для сегментации методом порогового распределения необходимо получить бинарное изображение из полутонового. Для этого устанавливается некоторое пороговое значение. После квантования функция изображения отображает элементы изображения с уровнем яркости больше порогового в значение 1, меньшее порогового - 0.

При наличии устойчивой связности внутри отдельных сегментов эффективны методы наращивания областей. Этот принцип состоит в том, что происходит группировка соседних элементов с одинаковыми или близкими уровнями яркости, а затем объединение их в однородные области. Один из типов - центроидное связывание - предполагает выбор стартовых точек либо с помощью оператора, либо автоматически. Эффективным представляется метод водоразделов, основанный на поиске локальных минимумов с последующей группировкой вокруг них областей по связности.

Метод выделения границ хорошо применять, если границы достаточно четкие и стабильные. Выделение контурных линий наиболее часто используется в системах технического зрения и основано на учете изменения яркости и дальнейшем ее сравнении с пороговой.

Перечисленные методы служат для выделения сегментов по критерию однородных яркостей. Все перечисленные принципы приемлемы с точки зрения вычислительных затрат, тем не менее, для каждого из них характерна не единственность разметки точек в реальных ситуациях из-за необходимости применения эвристик.

Для описания и сегментации свойств изображений, к которым относятся однородность, шероховатость, регулярность, применяют текстурные методы, подразделяющиеся условно на две категории - статистические и структурные. Использование матриц совпадений, формируемых из исходных изображений, с последующим подсчетом статистических моментов и энтропии - есть основа статистического метода. При структурном подходе строится множество многоугольников и производится исследование на предмет общих свойств. Многоугольники с общими свойствами объединяют в области.

Рис.1. Основные процедуры и методы распознавания изображений

Распознавание

Перейдем к конечному этапу обработки изображения - распознаванию. Для этого этапа входными данными являются изображения, полученные в результате шумоподавления и процесса сегментации. Как правило, они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися шумами.

Для решения задач распознавания применяются, в основном, четыре подхода:

Корреляционный. Подход, основанный на принятии решений по критерию близости с эталонами. В основном применяется при обнаружении и распознавании изображений в системах навигации, слежения, промышленной роботизации. Наиболее трудоемкий подход с точки зрения потребления вычислительных ресурсов. Подразумевает под собой многошаговую корреляцию при полностью заданном эталоне, путем сканирования входного поля зрения. Другими словами, происходит перебор всех входных сигналов и сравнение их с эталонным.

Признаковый. Такие методы основаны на переходе в пространство признаков, а соответственно, требуют значительно меньших вычислительных мощностей. В зависимости от поставленной задачи, выполняется корреляционная обработка признаков, полученных от эталона и входного изображения. При этом возникает задача объединения и комплексной обработки признаков различной размерности (метрических, статистических, логических, текстурных и т. д.), полученных различными измерительными средствами с целью решения задачи распознавания.

Корреляционно-признаковый метод подразумевает под собой обработку статистическими методами признаков, полученных следующим образом. Изначально применяется метод частных корреляций для различных фрагментов эталонного изображения, а затем в сигнальном пространстве полученные корреляционные коэффициенты рассматриваются как признаки.

Основной проблемой в признаковых методах составляет выбор признаков. При этом исходят из естественных правил:

1. Признаки изображений одного класса могут различаться лишь незначительно (за счет влияния помех, шумов); 2. Признаки изображений разных классов должны существенно различаться; 3. Набор признаков должен быть минимальным (от их количества зависит надежность, сложность, скорость обработки).

Синтаксический метод основан на получении структурно-грамматических признаков, когда в изображении выделяются непроизводные элементы - признаки. Вводятся правила соединения этих элементов, одинаковые для эталона и входного изображения. Анализ полученной таким образом грамматики обеспечивает принятие решений.

Каждый из подходов в распознавании имеет право на существование. Более того, в рамках каждого подхода есть свои конкретные алгоритмы, имеющие определенную область применения, которая зависит от характера различий входных и эталонных изображений, от помеховой обстановки в поле зрения, требований к объемам вычислений и скорости принятия решений. Признаковые и синтаксические методы - наиболее распространенные в теории распознавания образов.

Нормализация. Задача нормализации изображения - это задача определения параметров геометрических преобразований, которым подверглось изображение, с целью их компенсации. Компенсация может проводиться за счет изменения пространственного положения системы ввода изображения, либо алгоритмически путем применения обратного преобразования к входному изображению. Процедура преобразований производится с помощью операторов нормализации - нормализаторов, а вычисление параметров выполняется функционалами, действующими на множестве изображений.

Методы нормализации при распознавании занимают промежуточное место между корреляционными и признаковыми алгоритмами. В отличие от признаковых, при нормализации изображение не исключается из рассмотрения, а только замещается изображением того же класса эквивалентности. В то же время, в отличие от корреляционных методов, множество входных изображений заменяется множеством нормализованных изображений. Каждая нормализованная картинка, вообще говоря, находится гораздо ближе к своему эталону (с позиции групповых преобразований), что значительно сокращает количество корреляций на завершающем этапе распознавания.

Наибольший интерес в настоящее время в теории нормализации представляют последовательные методы, основанные на поэтапном вычислении параметров сложных преобразований и применении частичных нормализаторов на каждом этапе.

Рис. 2. Структура методов распознавания изображений

Особенности при проектировании роботизированных систем

Дополнительные проблемы при решении задачи зрительного восприятия роботизированных систем по сравнению с традиционными задачами обработки и распознавания изображений:

По материалам сайта http://sumschool.sumdu.edu.ua/

Статья взята с сайта: http://www.ci.ru/inform06_06/p_24.htm