Перевод статьи Rejection Criteria and Pairwise Discrimination of Handwritten Numerals

Z. Lou, K. Liu1, J. Y. Yang and C. Y. Suen "Rejection Criteria and Pairwise Discrimination of Handwritten Numerals Based on Structural Features".
Перевод части статьи "Критерии отклонения и установление попарных различий рукописных цифр, основанные на структурных особенностях"

Распознавание рукописных цифр интенсивно изучалось много лет. Это одно из самых успешных приложений в области распознавания образов, и обладает значительным коммерческим значением. В настоящее время, некоторые программы распознавания рукописных цифр могут быть найдены в рынке и применены ко многим практическим системам типа автоматической системы считывания почтового индекса, автоматической системы обработки банковских чеков, и так далее. Однако, без опаски можно сказать, что никакой существующий механизм распознавания рукописных цифр не может достигнуть совершенного распознавания. Очевидно, механизм распознавания рукописных цифр с более высокой эффективностью определенно расширит полную производительность прикладной системы, которая содержит механизм распознавания рукописных цифр.

В течение прошлых нескольких десятилетий, было предложено большое разнообразие методов распознавания рукописных цифр , которые могут быть классифицированы на две основные категории согласно используемым особенностям, а именно методам, основанным на структурных особенностях и статистических особенностях, соответственно. Статистические особенности обычно включают измерения плотности точек, моментов, и характерных местоположений, и т.д., а структурные особенности часто используют циклы, оконечные точки, соединения, штрихи, контуры, и так далее. Вообще, каждая категория имеет собственные преимущества и недостатки. Например, можно более просто обучить классификатор, основанный на статистических особенностях, используя нейронные сети или другие статистические методы классификации. Кроме того, для данного обучающего набора, классификаторы, обученные на статистических особенностях могут дать более высокие результаты распознавания по сравнению с обученными на структурных особенностях. Однако, одно основное преимущество методов, основанных на структурных особенностях - их способность описывать структуру символа, и наше знание о геометрической и структурной информации, относящейся к символу, может быть включено в процесс распознавания, что может позволить достигнуть результата распознавания с более высокой достоверностью.

В общем случае признается, что комбинация множественных классификаторов является наиболее перспективным подходом в развитии метода критериев отклонения и установления попарных различий рукописных цифр устойчивой и высокой точности механизма распознавания рукописных цифр. Теоретическое основание комбинации множественных классификаторов - то, что классификаторы с различными методологиями дизайна и с различными особенностями вероятно дополняют друг друга. Поэтому, комбинация различных классификаторов может значительно уменьшить ошибки классификации и достигнуть более высокой точности. Полагается, что классификаторы, основанные на структурных и статистических особенностях, соответственно, вообще дополняют друг друга. Поэтому, извлекание некоторых новых структурных особенностей рукописных цифр и разработка связанных методов распознавания - важный аспект, чтобы достигнуть более высоких результатов распознавания для системы распознавания рукописных цифр, основанной на комбинации множественных классификаторов.

В ссылке [25], представлен эффективный метод для распознавания символов, основанный на анализе информации контура формы. Форма символа описана строками примитивов контура, типа выпуклых, вогнутых и линейных секторов, с некоторыми расчетными атрибутами. Строка входного символа согласована со ссылками, состоящими из секторов с ограничениями на их атрибуты, которые определены статистическим анализом при изучении выборок. Когда вход соответствует двум или трем ссылкам, дальнейшее разграничение выполнено, и разрабатываются девять программ для стадии разграничения. Удовлетворительные результаты были достигнуты методом, который имеет один недостаток, что ссылка(ки) для каждой категории должна быть создана человеческим вмешательством.

Эта статья представляет новый метод распознавания рукописных цифр, основанный на структурном анализе информации контура и двухступенчатой методологии распознавания. Чтобы извлекать отличительные структурные особенности из цифры, примитивные сегменты типа дуги оконечной точки, отверстия и также выпуклые дуги, вогнутые дуги и доли строки, извлечены из ее внешнего контура (ов). Хотя выпуклые и вогнутые сегмениы - очень важные особенности для распознавания формы, и они широко использовались, наши исследования и эксперименты показывают, что выпуклости, вогнутость и линейность граничных долей для рукописных цифр, полученных исключительно из существенных точек искривления непостоянны, что затрагивает качество распознавания. Поэтому, былио установлено несколько стратегий и критериев для получения краткого и устойчивого описания символьного контура. После сегментации, набор параметров рассчитывается для каждой примитивной доли. Примитивная доля плюс ее расчетные параметры формирует ячейку особенности, которая является основным модулем для структурного описания цифры. В первой стадии нашего двухступенчатого метода распознавания, разработана схема классификации, основанная на анализе меры подобия структурных особенностей. Входная выборка дается как тождество или отклонение или как первый класс или второй класс оклонения, который базируется на мерах подобия между входной выборкой и всеми десятью классами цифры. В последнем случае, процесс распознавания войдет во вторую стадию, где будут использоваться некоторые стратегии для изменения структурного описания выборки, если она находится в отклонении первого класса, и наче к выборке будет применен двойной классификатор, если она находится во втором отклонении класса. Экспериментальные результаты, которые использовали рукописную базу данных цифры CENPARMI [10], Центр Распознавания образов и Искусственного интеллекта Университета Конкордии Канады, указывают, что общая работа предложенного метода благоприятно сравнивается с работой, достигнутой другими (методами), которые использовали ту же самую базу данных.

Классификация, основанная на мерах подобия. Последовательности ячеек особенности, извлеченных из символа обладают богатой структурной информацией о символе, как обсуждалось ранее, символ может иметь несколько последовательностей ячеек особенности, в зависимости от номера контуров, которые он имеет. Кроме того, две выборки той же самой цифры могут произвести различные последовательности ячеек особенности.

В течение стадии обучения, последовательности ячеек особенности извлекаются из каждой символьной выборки и используются для составления модели ссылок на соответствующий класс цифры. В стадии распознавания, последовательности ячеек особенности сначала извлекаются из входной выборки, чтобы сформировать входную модель, которая сравнивается тогда с моделями ссылок каждого класса, чтобы найти модели кандидата. Модель ссылок, как говорят, является моделью кандидата входной модели, если (1)общее количество последовательностей ячеек особенности, связанных с ней равно связанному со входной моделью, (2) есть взаимно-однозначное соответствие между последовательностями ячеек особенности модели ссылки, и входной модели так, что каждая пара согласованных последовательностей обладает совместимой последовательностью типа ячеек особенности, впоследствии называемой последовательностью типа.

Для входной модели и ее модели кандидата, мера подобия между ними может быть рассчитана исходя из параметров, связанных с ячейками особенности последовательностей, принадлежащих каждой модели. Поэтому, мера подобия между входной символьной выборкой и выборкой обучения определена как мера подобия между входной моделью и моделью ссылки, соответствующей ей, если модель ссылки - модель кандидата входной модели. Иначе, их мера подобия является нулевой. Мера подобия между входной выборкой и классом цифры определена как максимум мер подобия между входной выборкой и всеми выборками обучения этого класса.

Базируемые на вышеупомянутых определениях, основные шаги классификации в первой стадии могут быть получены следующим образом: Сформировать входную модель из входной выборки; Вычислить меры подобия между входной выборкой и всеми десятью классами цифры; Принять решение о распознавании, основанное на двух наиболее высоких мерах подобия.

Электронная библиотека

Биография

Каталог ссылок

Электронная библиотека

Биография

Каталог ссылок