Биография | Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальный раздел | ДонНТУ | Портал магистров ДонНТУ |
Источник: Материалы пятой юбилейной международной научно-технической конференции студентов, аспирантов и молодых ученых «Информатика и компьютерные технологии», ДонНТУ, Донецк, 24-26 ноября 2009 г.
Федяев О.И., Фёдоров А.В.
Донецкий национальный технический университет
При мониторинге движения автотранспорта необходимо распознавать его номерные знаки. Это можно сделать по снимкам, формируемым установленной удаленно видеокамерой. Важным этапом анализа таких снимков является распознавание получаемых изображений в реальном времени. Результатом распознавания должен стать набор символов, составляющих номерной знак.
В качестве исходного изображения рассматривается двумерный монохромный сигнал с видеокамеры, содержащий множество областей (паттернов) образов реальных символов, разделенных контурными границами. Примеры паттернов, полученных после преобразования снимков с видеокамеры, показаны на рис. 1.
Проблема распознавания изображений изучается много лет. Разработано много различных методов и алгоритмов распознавания образов [1,2], но эффективность каждого из них очень сильно зависит от решаемой задачи.
В рамках проведенного исследования выполнено сравнение самых распространенных видов нейронных сетей с точки зрения эффективности распознавания.
Анализ показал, что хороший результат дают нейросети обратного распространения ошибки и самоорганизующиеся карты. Самоорганизующиеся карты - одна из разновидностей нейронных сетей Кохонена [3]. Самоорганизующиеся карты Кохонена служат, в первую очередь, для визуализации и первоначального («разведывательного») анализа данных [4].
Сигнал в рассматриваемую сеть Кохонена поступает сразу на все нейроны входного слоя. Выходной сигнал этого слоя формируется по принципу «победитель забирает всё» - ненулевой выходной сигнал формируется на ближайшем к подаваемому на вход объекту нейроне.
В процессе обучения веса синапсов настраиваются таким образом, чтобы узлы решетки «располагались» в местах локальных сгущений данных, то есть описывали кластерную структуру «облака данных», с другой стороны, связи между нейронами соответствуют отношениям соседства между соответствующими кластерами в пространстве признаков.
Недостатком данной нейросети является то, что в случае близкого расположения входных обучающих векторов обучение будет проводиться за более длительное время. При этом, некоторые нейроны не используются, а нагрузка на остальные – повышена.
Преимущество сети Кохонена заключается в способности функционировать в условиях препятствий, весы модифицируются плавно и подстройка весов (обучение) заканчивается очень быстро.
Одна из модификаций нейросети состоит в том, что к сети Кохонена прибавляется сеть MAXNET, которая определяет нейрон с наименьшим расстоянием к входному сигналу.
В ходе анализа была использована другая модификация, в которой нейрон-победитель брался не один, а несколько – это позволило сократить время обучения и повысить качество распознавания.
Рекуррентные нейросети по структуре аналогичны сети Кохонена, но функционируют и обучаются по-другому. Сигнал с выходных нейронов или нейронов скрытого слоя частично передается обратно на входы нейронов входного слоя (обратная связь) [3]. Частным случаем рекуррентных сетей являются двунаправленные сети. В таких сетях между слоями существуют связи как в направлении от входного слоя к выходному, так и в обратном.
К недостаткам относят низкую скорость обучения [4].
Среди преимуществ можно выделить то, что обратное распространение – эффективный и популярный алгоритм обучения многослойных нейронных сетей, с его помощью решаются многочисленные практические задачи.
Модификации алгоритма обратного распространения связаны с использованием разных функций погрешности, разных процедур определения направления и величины шага.
Для оценки эффективности использовалось три фундаментальных понятия: емкость, сложность образцов и вычислительная сложность. Под емкостью понимают, сколько образцов может запомнить сеть, и какие границы принятия решений могут быть на ней сформированы. Сложность образцов определяет число обучающих примеров, необходимых для достижения способности сети к обобщению. Вычислительная сложность связана с мощностью процессора ЭВМ.
В ходе анализа было установлено, что программно реализованные основные виды нейросетей обладают как достоинствами, так и недостатками. Их можно нивелировать, если изменить архитектуру нейросети таким образом, что 1-й слой Кохонена, а слой Гроссберга заменен многослойной сетью обратного распространения.
Литература