КОМПЬЮТЕРНОЕ ЗРЕНИЕ
Авторы:Г. Э. Раифович,Г. И. Масхутович
Источник: Журнал APRIORI
, 2015 г.
Аннотация
Описывается разработка программы, которая выводит обработанное изображение с веб камеры.
Ключевые слова: обработка; распознавание; образ; изображение.
Компьютерное зрение теория и технология создания машин, которые могут производить обнаружение, слежение и классификацию объектов.
Компьютерное зрение стремится применить теории и модели компьютерного зрения к созданию систем компьютерного зрения. Также компьютерное зрение может быть описано как дополнение к биологическому зрению.
Компьютерное зрение включает такие подразделы как:
- воспроизведение действий;
- обнаружение объектов;
- слежение за объектами;
- распознавание образов;
- обработка изображения.
Входными данными для компьютерного зрения являются изображения, в программирование они представляются как двумерные массивы данных. Примерами входных изображений являются:
- цветные изображения;
- изображения инфракрасного спектра;
- ультразвуковые изображения;
- радиолокационные снимки;
- тепловизионные изображения.
Компьютерное зрение является частью дисциплин занимающихся двухмерными данными. Среди него есть еще:
- компьютерная графика;
- линейная алгебра;
- моделирование процессов.
Существует 3 уровня дисциплин, занимающихся двухмерными данными:
- Обработка изображений (низкий уровень). Обработка данных, без детального изучения содержания изображения. Целями данной задачи является очистить изображения от шумов, сжать данные и улучшить характеристики.
- Компьютерное зрение (средний уровень). Заключается в выделении на изображении каких – либо объектов и измерении их параметров.
- Распознавание образов (высокий уровень). Уровень заключается в том, чтобы определить тип объекта.
Для задач компьютерного зрения нужные видеокамеры. Они отличаются следующими характеристиками:
- Разрешающая способность это размер изображения в пикселях, получаемое с камеры. Чем больше данный параметр, тем детализирование будет картинка. При размере изображения 320 х 240 пикселей точность измерения при наблюдении объекта размером 1 мм равно 3.13 мм, 640 х 480 пикселей 1.56 мм, при 1280 х 1024 пикселей 0,97 мм.
- Число кадров в секунду это число изображений, получаемых с камеры за одну секунду. Чем больше данное число, тем плавнее получится видео.
- Тип получаемых данных какие данные выводит камера для обработки.
- Способ передачи данных в компьютер это по каким протоколам возможна передача данных компьютеру.
На наш взгляд, лучше всего реализацию алгоритмов компьютерного зрения представлена в библиотеке OpenCV. Данная библиотека написана на языке высокого уровня (C/C++) и содержит алгоритмы для: интерпретации изображений, калибровки камеры по эталону, устранение оптических искажений, определение сходства, анализ перемещения объекта, определение формы объекта и слежение за объектом, 3D реконструкция, сегментация объекта, распознавание жестов и т.д.
Для наглядного примера приведу программу, которая выводит обработанное изображение с веб камеры (Рис. 1).
Список использованной литературы
- OpenCv. [Электронный ресурс]. – Режим доступа: https://opencv.org/books....