OpenCV – библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов с открытым исходным кодом. Проведен сравнительный анализ эффективности алгоритмов библиотеки OpenCV при решении задачи распознавания лиц по их изображению.
В настоящее время диалоговые системы применяются в самых разных областях человеческой деятельности. В результате человеко-машинной коммуникации можно определять многие параметры, например, возраст, пол, эмоции и другие характеристики человека.
Для этого существует множество алгоритмов, например, нейронные сети, метод опорных векторов, деревья решений и другие.
Распознавание лиц или эмоций представляет собой частные случаи задачи распознавания образов [1; 2].
Для решения задачи распознавания лиц существует множество инструментов, из которых наиболее распространенным является библиотека с открытыми исходными кодами OpenCV, а именно – класс FaceRecognition.
OpenCV (Open Source Computer Vision) это популярная библиотека компьютерного зрения, разработанная компанией Intel в 1999 году. Кросс-платформенная библиотека нацелена на обработку изображений в режиме реального времени, и включает в себя свободную реализацию новейших алгоритмов компьютерного зрения [3].
В OpenCV используются три алгоритма распознавания лиц: Eigenfaces [4], Fisherfaces, LBPH (local binary patterns histograms).
Использование всего набора численных признаков в процессе распознавания может существенно замедлить работу алгоритма и снизить точность получаемого решения. Поэтому важным для снижения размерности в процессе решения задачи идентификации говорящего является извлечение наиболее информативных признаков, используемых алгоритмами распознавания.
Для того чтобы выбрать наиболее подходящие признаки, в каждом из алгоритмов используются свои методы: метод главных компонент, линейный дискриминантный анализ и гистограммы локальных бинарных шаблонов
Чтобы получить достоверные результаты, для алгоритмов библиотеки OpenCV необходимо выполнить несколько требований для изображений [5]:
В данной работе был проведен сравнительный анализ эффективности алгоритмов библиотеки OpenCV при решении задачи распознавания лиц.
В задаче представлены изображения 20 спикеров с 4-мя типами эмоций. Общий объем выборки составляет 1 482 изображений, которые имеют 13 462 атрибутов.
Тестирование 3 алгоритмов библиотеки OpenCV производилось на основе скользящего экзамена. На первом прогоне изображения 1-го спикера исключались из обучающего множества, и составляли только тестовое множество. На втором прогоне тестовое множество состояло только из изображений 2 спикера, которые исключались из обучающего множества.
В результате сравнительного анализа эффективности по среднему значению точности лучший результат показал алгоритм FisherFaces. И при проверке на статистическую значимость (T-test проводился с уровнем значимости 0.05) выяснилось, что он имеет статистически значимые отличия в сравнении с другими алгоритмами.