назад в библиотеку

Распределенная итернет-система автоматического распознавания изображений в реальном времени

Колесник А. В., Ладыженский Ю. В.

Донецкий национальный технический университет

Каждый человек сталкивается с задачами распознавания изображений, которые он видит практически ежеминутно, и решает их мгновенно, например, определение цвета или формы предмета. Возникает вопрос: может ли современный компьютер выполнять распознавание изображений в реальном времени, а именно формировать полезные выводы относительно объектов и сцен на основе анализа изображений[1]?

На рисунке 1 показана архитектура распределенной системы распознавания изображений, работающей в реальном времени. Система работает с изображениями, источниками которых могут быть фото- и видеокамеры, телефоны, КПК, различные сканеры. Изображения с этих устройств через Internet по почтовым протоколам SMTP, IMAP пересылаются на определенный почтовый ящик. Почтовый клиент, который является частью системы распознавания, загружает изображения из почтового сервера и передает их на распознавание.

Архитектура системы распознавания изображений

Рисунок 1 – Архитектура системы распознавания изображений

После получения изображения система распознавания сопоставляет пришедшее изображение с изображениями, которые хранятся в базе данных. Если изображение найдено, то извлекается его описание, по которому формируется ответ пользователю. UML-диаграмма прецедентов на рисунке 2 демонстрирует основные элементы разрабатываемой распределенной системы во взаимодействии. Пользователь инициирует отправку изображения и получение ответа с почтового сервера, а почтовый клиент – получение изображения, передачу его на анализ, что заставляет работать систему распознавания изображений.

UML-диаграмма прецедентов системы распознавания изображений

Рисунок 2 – Диаграмма прецидентов системы распознавания

Разрабатываемая система распознавания работает под операционными системами семейства Windows c Microsoft Framework 3.5 SP1. Microsoft Visual Studio 2008 SP1 используется для разработки программной системы на языке C#, Microsoft SQL Server 2008 – для управления базами данных изображений. Для разработки интерфейса применяется Windows Presentation Foundation (WPF) – графическая подсистема в составе .NET Framework 3.5, работающая на ядре DirectX. Основа WPF – это независимый от разрешения экрана и основанный на векторной графике механизм отрисовки, который использует все преимущества современного графического оборудования. Для обработки и распознавания изображений используется библиотека с открытым кодом OpenCV, реализованная на С\С++. Представленная система обладает важными достоинствами для практики: распознавание выполняется в реальном времени за счет использования распределенной технологии распознавания изображений, система способна работать автоматически, получая на вход изображение из почтового сервера и отправляя результат своей работы через этот же или другой почтовый сервер.

Литература

[1] Шапиро Л., Стокман Дж. Компьютерное зрение; Пер с англ. – М.: БИНОМ. Лаборатория знаний, 2009. – 752с., 8с. ил.: ил.

[2] Нейгел, Кристиан, Ивьен, Билл, Глинн, Джей, Скиннер, Морган, Уотсон, Карли. C# и платформа .NET 3.0 для профессионалов.: Пер. с англ. – М.: ООО «И.Д.Вильямс», 2008 – 1376+416(на CD) c. : ил. – Парал. тит. англ.