Назад в библиотеку

Метод поиска автомобильных номеров с использованием модификации алгоритма распознавания государственных регистрационных знаков

Авторы: М. С. Востриков, К. Л. Тассов

Аннотация М. С. Востриков Метод поиска автомобильных номеров с использованием модификации алгоритма распознавания государственных регистрационных знаков В статье выполнен анализ существующих систем распознавания автомобильных номеров, выявлена актуальность задачи, предложен метод её решения.


Введение

С каждым годом в России, как и во всем мире, увеличивается количество автомобилистов. Ситуация на дорогах становится все сложней: больше автомобилей, больше нарушений, больше аварий. Возникает острая потребность в регулировании и упорядочении этого движения.

Задача контроля над передвижением транспортных средств и соблюдением водителями правил дорожного движения в России всегда лежала на ГИБДД. А если говорить точнее – на отдельно взятых сотрудниках ДПС. Естественно, заметить всех нарушителей, и тем более, предупредить большую часть нарушений было просто нереально. Поэтому несколько лет назад начались разработки новых методик и систем, призванные помочь установить порядок на дорогах. Со временем были созданы уникальные комплексы, способные не только дополнить, но и заменить сотрудника ДПС на его посту. Такие комплексы имеют множество полезных функций, а главное достаточно точно выполняют распознавание номеров.

Основными функциями современных комплексов распознавания изображений ГРЗ являются:

Несмотря на то, что заявленная точность наиболее распространенных систем превышает 95 %, добиться её можно лишь в лабораторных условиях. В реальных условиях вмешивается погодный фактор, грязь на номерных знаках и прочие неблагоприятные факторы. Таким образом, точность распознавания не достигает и 90 %. Отчасти это связанно с ограничениями самого перцептронного алгоритма, который используется в современных системах для распознавания автомобильных номеров. Использование же более совершенного алгоритма распознавания потребует значительно большей вычислительной мощности от аппаратной части. Увеличение точности таким способом повлечёт за собой заметное увеличение стоимости системы, не говоря уже о необходимости полной замены существующих систем [1, 3-4].

При обработке статистики удалось выяснить, что в большинстве случаев, когда система автоматического распознавания ГРЗ совершает ошибку, неверным оказывается только один символ распознанного номера [2]. Таким образом, решив задачу увеличения достоверности результатов поиска хотя бы для номеров с одной ошибкой распознавания, можно добиться лучших результатов с наименьшими затратами на модернизацию имеющегося оборудования, без необходимости его замены на новое.

Обзор решений

В используемых ранее системах, если номер был распознан с одной ошибкой, найти его можно было разве что использовав поисковый запрос с символом *, иначе называемым символ-джокер. При поиске номера, содержащего такой символ, будут учитываться остальные символы в шаблоне, а на месте всех символов * в найденных номерах может стоять любой символ. Даже если при поиске в шаблоне задан всего один символ *, количество полученных результатов уже сильно возрастает. Возрастает также длительность поиска по базе. Теоретически можно использовать и такой способ, чтобы найти распознанный с одной ошибкой номер. На практике же такой способ приносит мало пользы. Во-первых, чтобы найти с его помощью номер с одной ошибкой распознавания, придётся выполнить несколько запросов, в каждом из которых * будет стоять в разных позициях поискового шаблона, ведь заранее не известно, какой именно символ в каждом конкретном случае не был корректно распознан. Во-вторых, кроме искомого номера в таком запросе будет очень большое количество номеров, заведомо не совпадающих с искомым. В результате всё, что на самом деле даёт этот способ, это увеличение длительности поиска в несколько раз и огромный объём результатов, в котором надо разбираться уже вручную.

Анализ используемых в настоящее время систем автоматического распознавания ГРЗ показал, что от них можно получать для каждого распознанного номера дополнительную информацию. Это информация, получаемая на выходе перцептронного алгоритма, она содержит данные о каждом символе распознанного номера – о том, насколько он схож с каждым символом алфавита по меркам алгоритма. Сейчас она обрабатывается в системе, которая отбирает символы, чья числовая характеристика превосходит определённый порог. Такой подход позволяет добавлять в базу данных минимальное количество позиций и даёт неплохую точность. Однако дополнительно обработав некоторую её часть, можно дополнить базу распознанных номеров претендентами, которые позволят получать больше совпадений при поиске по базе, и не будут приводить к существенному росту её объёма и времени поиска по ней.

С готовым продуктом была проведена серия экспериментов, целью которых было выяснить, как дополнение базы претендентами влияет на длительность поиска и его результаты. Результаты сильно зависят от того, как задан поисковый запрос. В простейшем случае он представляет собой введённые в поисковый шаблон символы искомого номера, максимальная длина номера – десять символов. Ранее уже был рассмотрен способ с вводом в запрос символа-джокера и недостатки такого способа.

При поиске в дополненной претендентами базе нет необходимости прибегать к символам *, так как в базе уже хранятся варианты распознавания номеров, то есть одному событию распознавания может соответствовать несколько распознанных номеров. При этом длительность поиска по базе немного выше, чем в базе без претендентов, но гораздо ниже, чем при использовании символа * в разных местах шаблона в обычной базе. Конечно, из-за пополнения базы претендентами поиск может давать ложные результаты, но их количество значительно меньше, чем в способе, основанном на запросах с символами *.

Для подтверждения эффективности данного метода, было проведено исследование, включающее в себя поиск событий распознавания в базах обычной и с претендентами, с различным заданием поискового запроса, а именно – полный номер, либо номер с джокером в некоторой позиции, с целью найти корректно распознанный номер, или номер с одной ошибкой распознавания.

Исследование результатов тестов подтверждает сделанные наблюдения, результаты самих тестов приведены в таблице 1. Следует пояснить, что вероятность получения правильного результата при поиске с одним джокером ошибочно распознанного номера определяется в основном тем, с какой попытки удаётся угадать позицию, на которой оказался ошибочно распознанный символ. В данном случае подбор производился перемещением джокера слева направо. Также следует отметить, что поиск по расширенной базе номера с ошибочно распознанным символом не даёт стопроцентного результата, так как правильный символ мог не попасть в список претендентов. Среднее количество ложных результатов вычислялось по формуле , где Mi - количество ложных результатов в i-м опыте, N – количество опытов. Среднее время поиска вычислялось по формуле = где ti – длительность поиска в i-м опыте, N – количество опытов. Вероятность получения правильного результата вычислялась по формуле =, где K – количество запросов, по которым удалось получить верный результат, N – общее количество запросов.

Таблица 1 – Сравнение результатов поиска по обычной и дополненной базам

article6_1

Заключение

Таким образом, использование дополненной претендентами базы позволяет заметно улучшить достоверность результатов поиска событий распознавания автомобильных номеров путём анализа и хранения небольшого количества дополнительной информации, не прибегая при этом к значительным изменениям, не говоря уже о полной замене, существующих систем распознавания государственных регистрационных знаков.

Также удалось доказать, что использование нового метода хранения и поиска решает задачу поиска номера с одной ошибкой распознавания быстрее и с меньшим количеством ложных результатов, чем используемый раньше поисковый запрос с джокером, хотя при этом уступает по тем же параметрам поиску корректно распознанного номера по старой базе с запросом без подстановочных символов.

Кроме того, необходимо отметить, что осталась нерешённой задача улучшения поиска для номера, распознанного с двумя и более ошибками. Актуальность этой задачи, однако, гораздо ниже – по упомянутым во введении статистическим данным, большая часть ошибок приходится именно на один неверно распознанный символ.

Результаты исследования также показали, что использование расширенной базы, улучшая результаты для поиска номеров с неверно распознанным символом, одновременно ухудшает результаты поиска корректно распознанных номеров. Отсюда возникает новая задача – устранение возникших ухудшений, например, помечая определённые номера-претенденты как основные с соответствующим повышением их приоритета при поиске.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

  1. Авто–Инспектор – система распознавания автомобильных номеров. Режим доступа: http://www.iss.ru/products/auto/ (дата обращения 09.07.2012)

  2. В.В. Круглов, В. В., Борисов, Искусственные нейронные сети. Теория и практика, М.: Горячая Линия - Телеком, 2001.

  3. Концерн РОССИ. Поток–С, 2006 [Электронный ресурс]. URL: http://www.rossi-potok.ru/page.php?id=8 (дата обращения 09.07.2012)

  4. Компания Технологии Распознавания. АПК АВТОУРАГАН. Режим доступа: http://www.recognize.ru/node/23 (дата обращения 09.07.2012)