Назад в библиотеку

УДК 004.896


ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ:
СОВРЕМЕННОЕ СОСТОЯНИЕ И ПРОБЛЕМЫ РЕАЛИЗАЦИИ


С. А. Елистратов, Ю. Б. Козлова

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева
Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: 79293085921@ya.ru


В современном мире интеллектуальные системы являются наиболее перспективным направлением в области информационных технологий. Они востребованы там, где невозможно или нецелесообразно присутствие человека (например, исследование космоса, обработка больших объемов информации). Однако данная область до сих пор недостаточно проработана.


Ключевые слова: нейронная сеть, алгоритм, библиотека, интеллектуальные системы, распознавание образов.


INTELLECTUAL SYSTEMS OF PERSON RECOGNITION:
MODERN CONDITION AND PROBLEMS OF IMPLEMENTATION


S. A. Elistratov, Y. B. Kozlova

Reshetnev Siberian State University of Science and Technology
31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation
E-mail: 79293085921@ya.ru


In the modern world, intelligent systems are the most promising area in the field of information technology. They are in demand where it is impossible or inappropriate for the a person presence (for example, exploring the cosmos, processing large amounts of information). However, this area has not been sufficiently developed yet.


Keywords: neural network, algorithm, library, intelligent systems, pattern recognition.


Современная жизнь становиться все более автоматизированной, ускоряя темпы экономики и жизни общества в целом. Однако некоторые области до сих пор полностью не проработаны, не достигнуты желаемые результаты, способные повлиять на жизнь человечества. Одним из таких направлений является разработка системы распознавания образов.

Такие системы имеют большую востребованность в космических разработках и в органах по управлению безопасностью жизнедеятельности населения, в частности, в местах массового скопления людей, с целью предотвращения терроризма, а также распознавания личностей, совершивших преступления (аэропорты, вокзалы, банки, супермаркеты и торговые центры, культурно-развлекательные и спортивные объекты). Также важно контролировать порядок на улицах города.

В настоящее время одной из проблем развития интеллектуальных систем распознавания лиц является отсутствие доступного технического оснащения. Камеры, передающие очень качественное изображение, необходимое для обработки системой, имеют высокую стоимость. Соответственно, очень малая часть субъектов мировой экономики может себе позволить такие расходы. Часто они являются нецелесообразными. К тому же, сама система распознавания лиц является довольно затратной.

К проблеме низкокачественного оборудования съемки также добавляются факторы освещенности, погодных условий, температурного режима. Также существует несколько способов скрыть внешность от камер – головные уборы, очки, макияж, парик, борода, усы и т. д. Способы преодоления данных факторов на сегодняшний день не найдено.

Также важной проблемой является отсутствие ресурсов у компаний-разработчиков. Для разработки интеллектуальных систем высокого уровня требуются крупные инвестиции, вложить которые готов не каждый, так как не известен результат разработки.

На сегодняшний день так и не разработан оптимальный алгоритм распознавания, существует несколько ведущих библиотек, которым удается распознавать образы на картинке, искать идентичные лица в сети. Однако цель поиска местонахождения объекта или его идентификации не достигнута.

Ведущие мировые компании области информационных технологий, такие как Google, Microsoft, Facebook Apple, Intel cоздали отделы по разработке библиотек распознавания образов. Пока результаты их работы ограничиваются простыми приложениями с распознаванием пород животных, людей, однако, их ожидания в ближайшей перспективе являются довольно высокими. В сентябре 2017 г. стало известно, что ученые Индии и Великобритании научили нейронную сеть распознавать преступников с предметами маскировки [4].

Компания FaceBook, разработала алгоритм под названием DeepFace, которая позволит визуально анализировать, сравнивать и идентифицировать человеческие лица с невероятно высокой точностью (до 97,25 %). DeepFace будет использовать технику 3D-моделирования для сканирования объекта, но сам алгоритм строится на основе процесса «фронтализации», то есть изменения угла изображения таким образом, чтобы лицо человека смотрело прямо вперед. Затем полученные данные переводятся в числовое значение и обрабатываются для последующего сравнения. На данный момент, DeepFace проходит этапы тестирования, для которого FaceBook уже идентифицировали порядка 4 млн фотографий своих пользователей [2].

Компанией Google была разработана открытая программная библиотека для машинного обучения под названием «TensorFlow». Она позволяет решать задачи построения и тренировки нейронной сети с целью автоматического нахождения и классификации образов, достигая качества человеческого восприятия. В то время как эталонная реализация работает на единичных устройствах, TensorFlow может работать на многих параллельных процессорах, как CPU, так и GPU, опираясь на архитектуру CUDA для поддержки вычислений общего назначения на графических процессорах). Уникальность библиотеки состоит в следующих характеристиках:

– основная библиотека подходит для широкого семейства техник машинного обучения, а не только для глубинного обучения;

– линейная алгебра и другие внутренности хорошо видны снаружи;

– в дополнение к основной функциональности машинного обучения, TensorFlow также включает собственную систему логирования, собственный интерактивный визуализатор логов и даже мощную архитектуру по доставке данных;

– модель исполнения TensorFlow отличается от scikit-learn языка Python и от большинства инструментов в R.

Вычисления TensorFlow выражаются как графы потоков данных с сохранением состояния (stateful). Библиотека алгоритмов от Google инструктирует нейронные сети воспринимать информацию и рассуждать подобно человеку, так что новые приложения изначально обладают такими «человеческими» качествами. Само название TensorFlow происходит от названия операций, которые эти нейросети осуществляют над многомерными массивами данных. Эти многомерные массивы именуются «тензорами», как одноимённые математические объекты, линейно преобразующие элементы одного линейного пространства в элементы другого. Задача TensorFlow – учить нейросети обнаруживать и распознавать паттерны и корреляции в массивах данных [5].

OpenCV – библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым кодом. Реализована на C/C++, также разрабатывается для Python, Java, Ruby, Matlab, Lua и других языков. Может свободно использоваться в академических и коммерческих целях – распространяется в условиях лицензии BSD [3]. OpenCV предоставляет различные классификаторы, которые можно использовать для распознавания лиц, глаз, автомобилей, и многих других объектов. Эти классификаторы, однако, достаточно просты, они не обучены с использованием технологий машинного обучения, поэтому, при распознавании лиц точность составит примерно в 80 % [1].

Технологии распознавания объектов достигли высоких результатов, однако недостаточных для реализации крупных задач, таких как исследования космоса и планет, где невозможно присутствие человека. В связи с этим требуется постоянное совершенствование алгоритмов распознавания объектов и обучения нейронных сетей.

Библиографические ссылки


1. Веб-камера, Node.js и OpenCV: делаем систему распознавания лиц [Электронный ресурс]. URL: https:// habrahabr.ru/company/ruvds/blog/335770/ (дата обращения: 14.09.2017).

2. Программа Deepface – определяет лица почти как живой человек [Электронный ресурс]. URL: http://www.sciencedebate2008.com/deepface-defines-a-personas-a-living-person/ (дата обращения: 14.09.2017).

3. Распознаем лица на фото с помощью Python и OpenCV [Электронный ресурс]. URL: https://habrahabr.ru/post/301096/ (дата обращения: 14.09.2017).

4. Распознавание образов [Электронный ресурс]. URL: http://ai-news.ru/raspoznavanie obrazov.html (дата обращения: 14.09.2017).

5. TensorFlow [Электронный ресурс]. URL: https://www.tensorflow.org/ (дата обращения: 14.09.2017).

References


1. Webcam, Node.js and OpenCV: we make a face recognition system. Available at: https://habrahabr.ru/company/ruvds/blog/335770/ (accessed: 14.09.2017).

2. The Deepface program – defines persons almost like a living person. Available at: http://www.sciencedebate2008.com/deepface-defines-a-person-as-a-livingperson/ (accessed: 14.09.2017).

3. Recognize the faces in the photo using Python and OpenCV. Available at: https://habrahabr.ru/post/301096/ (accessed: 14.09.2017).

4. Pattern Recognition. Available at: http://ai-news.ru/ raspoznavanie obrazov.html (accessed: 14.09.2017).

5. TensorFlow. Available at: https://www.tensorflow.org/ (accessed: 14.09.2017).


© Елистратов С. А., Козлова Ю. Б., 2017