ДонНТУ   Портал магистров

Искусственный интеллект и распознавание образов

Распознавание образов: первое знакомство, анализ и дальнейшие изучение

Летом 2013 года, я проходил практику в институте проблем искусственного интеллекта, который находится в городе Донецк. Моей задачей, на время практики, было активное участие в разработке программного обеспечения, которое позволило бы автоматически распознавать дорожные знаки, полученные с камер превышения скорости, и заносить их в базу данных с минимальным участием человека.

Интерес к теме искусственного интеллекта я проявлял и раньше, после прохождения курса по классификации и распознаванию образов при помощи нейронных сетей, на третьем учебном курсе. Но именно во время прохождения практики я понял, что интересующей меня областью знаний являются искусственный интеллект и распознавание образов.

В первый день практики, мне и моим одногруппникам, был предложен вариант прохождения практики в одном из четырех отделах института: отделе разработок программного обеспечения под мобильные платформы, отделе распознавания звука, отделе распознавания текста и отделе распознавания образов. Из всех четырех меня заинтересовал последний, и выбрав его как место прохождения практики – я об этом не пожалел.

В первые дни практики, я познакомился с небольшим, но дружным коллективом и получил от них справочную информацию по задаче, которой отдел тогда занимался, и по теории распознавания образов в целом.

До момента ознакомления с задачей распознавания образов на практике, в моем понимании эта область искусственного интеллекта выглядела намного проще, чем это есть на самом деле. После прочтения полученных материалов и ознакомления с программной реализацией методов решения данной задачи, я понял, что у меня мало опыта в данной области знаний и я мало чем смогу помочь в реализации программного продукта, разрабатываемого отделом в тот момент.

Не смотря на малый опыт, мне нашли задачу, выполнение которой могло бы хоть немного, но разгрузить отдел. Как уже упоминалось выше, в то время отдел занимался реализацией программного обеспечения распознавания автомобильных номеров, и так как используемым подходом к распознаванию было использование нейронных сетей, то для эффективной работы программы требовалась начальная обучающая выборка. Именно формирование обучающей выборки и было предложено мне в качестве задачи на время прохождения практики.

В ходе выполнения задачи, я изучил различные подходы к распознаванию образов. Полученные знания упростили мне изучение предметов на старших курсах, которые касались распознавания и классификации образов, таких как: обработка изображений, распознавание изображений, нейронные сети, роевые и генетические алгоритмы.

Именно знания полученные во время прохождения практики в институте проблем искусственного интеллекта и подтолкнули меня к выбору темы бакалаврской работы, а в дальнейшем и магистерской работы, область распознавания образов.

О теории распознавания образов

Теория распознавания образа — раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков. Такие задачи решаются довольно часто, например, при переходе или проезде улицы по сигналам светофора. Распознавание цвета загоревшейся лампы светофора и знание правил дорожного движения позволяет принять правильное решение о том, можно или нельзя переходить улицу.

Проблема распознавания образа приобрела выдающееся значение в условиях информационных перегрузок, когда человек не справляется с линейно-последовательным пониманием поступающих к нему сообщений, в результате чего его мозг переключается на режим одновременности восприятия и мышления, которому такое распознавание свойственно.

Неслучайно, таким образом, проблема распознавания образа оказалась в поле междисциплинарных исследований - в том числе в связи с работой по созданию искусственного интеллекта, а создание технических систем распознавания образа привлекает к себе всё большее внимание.

Можно выделить два основных направления способов построения систем распознавания [1]:

  1. изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их;
  2. развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях.

Распознавание графических образов

В нынешнее время компьютер можно, без особых затруднений, научить воспринимать текстовую информацию, а так же анализировать ее и делать какие либо выводы, основываясь при этом на различные систему обучения. С небольшим затруднением, но все так же можно научить компьютер анализировать речь. Основной сложностью будет анализ звука и перевод этой информации в текстовый вид. А вот задача визуального восприятия машиной окружающего мира до сих пор затруднена. Из-за сложности этой задачи и отсутствия универсальных алгоритмов распознавания, выделяют несколько различных подходов к распознаванию графических образов.

Для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями и другие, подобные характеристики. Для букв нужно перебирать шрифт, свойства шрифта. Подобный способ хоть и не требует больших вычислительных мощностей, но он подходит в основном для бинарных образов и небольших изображений.

Второй подход — найти контур объекта и исследовать его свойства (связность, наличие углов, сложность контура, гладкость и т.д.). Данный подход особо популярен и достаточно гибок в работе, но уже более требователен к ресурсам, чем первый. Недостатком является то, что даже получив контур не всегда удается классифицировать объект только по свойствам контура, и часто приходится прибегать к помощи различных классификаторов и анализу оконтуренного объекта.

Ещё один подход — использовать искусственные нейронные сети [2]. Этот метод требует либо большого количества примеров задачи распознавания, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Недостатком и в то же время положительной стороной является то, что такую систему требуется обучать. Недостатком это является потому, что требуется заготовить большое количество учебных примеров образов, на которых система будет обучаться. Но в то же время, если учебная база для системы уже есть, — обучить систему с нуля не составляет проблем.

Распознавание графических образов

Исходя из разнообразия подходов к распознаванию образов, можно прийти к выводу, что эта область знаний все еще не до конца исследована и продолжает совершенствоваться. Стоит обратить внимание на то, что за последние годы обострился интерес к этой области знаний, а так же к искусственному интеллекту в общем. Все активнее начали проявлять интерес различные IT гиганты, такие как Google и Microsoft. Чего стоят только разработки Google Glass [3], а так же использование различных элементов искусственного интеллекта в их продукции.

Смотря на то, как меняется нынешний информационный мир, сложно остаться в стороне и не заинтересоваться различными направлениями его развития. Для меня таким направлением стал искусственный интеллект и распознавание образов.

Список использованных источников

  1. Дж Т. Принципы распознавания образов/Дж //Ту, Р. Гонсалес. М.: Изд-во" Мир. – 1978.
  2. Круглов В. В., Борисов В. В. Искусственные нейронные сети. Теория и практика. – М. : Горячая линия-Телеком, 2002.
  3. Google Glass. [Электронный ресурс]. — Режим доступа: https://ru.wikipedia.org/wiki/Google_Glass