назад в библиотеку

Обнаружение лиц

Автор: Ming-Hsuan Yang (перевод с английского Колесник А.В.)

Source:

http://faculty.ucmerced.edu/mhyang/papers/face-detection-chapter.pdf

Актуальность

Задача обнаружения лиц – определить есть или нет какое-нибудь лицо в данном изображении (как правило, сером), и если есть, то определить местоположение и содержимое каждой найденной области. Это первый этап любой полностью автоматической системы, которая анализирует информацию, содержащуюся в лицах (например, личность, пол, выражение, возраст, расу и положение). Ранее решались задачи обнаружения лиц в вертикальном и фронтальном положении, но сейчас разработано несколько систем, которые способны достаточно точно обнаруживать лица в режиме реального времени в плоскости или вне плоскости вращения. Хоть модуль обнаружения лиц предназначен для работы с отдельными изображениями, его производительность может быть улучшена, если доступен видеопоток.

Введение

Достижения вычислительной техники способствовали развитию модулей видения в реальном времени, которые взаимодействуют с людьми в последние годы. Примеров тому множество, особенно в биометрических данных и взаимодействии компьютера с информацией человека, содержащейся в лицах, где системе необходимо проанализировать данные и среагировать соответствующим образом. Для биометрических систем, которые используют лица, как неинтрузивные модули ввода, крайне важно найти лицо в кадре, после чего может быть применен любой алгоритм распознавания. Интеллектуальное видение должно уметь переходить в состояние сосредоточения внимания на пользователе (т.е. когда пользователь смотрит), чтобы пользовательский интерфейс мог отреагировать соответствующим образом. Чтобы точно обнаружить черты лица для таких приложений, как цифровые косметики, лица должны быть первоначально обнаружены и распознаны для облегчения дальнейшей обработки. Очевидно, что распознавание лица играет важную и решающую роль для успеха любой системы обработки лица.

Проблема обнаружения является сложной задачей, поскольку необходимо учитывать все возможные варианты, вызванные изменениями освещенности, черт лица, прикуса зубов и т.д. Кроме того, он должен обнаружить лица, которые появляются в различных масштабах, позе, плоскости вращения . Несмотря на все эти трудности, достигнут огромный прогресс в последнее десятилетие, многие системы, добились впечатляющих результатов в режиме реального времени. Последние достижения этих алгоритмов также внесли существенный вклад в выявлении других объектов, таких как люди (пешеходы) и автомобили.

Функционирование систем обнаружения лиц

Большинство систем обнаружения выделяют определенные свойства (например, местные особенности и целостные структуры интенсивности) из набора обучающих изображений, полученных в фиксированной позе (например, прямой фронтальной позе) в автономном режиме настройки. Для уменьшения влияния изменения освещенности, эти изображения уравниваются с помощью гистограммы [3, 1] или обрабатываются по стандартизации (например, нулевой средней дисперсии единицы) [2]. На основе извлеченных свойств, эти системы, как правило, сканируют все изображение при всех возможных масштабах с целью обнаружения лиц. Извлеченные свойства могут быть закодированы вручную (с человеческого знания), или извлечены из набора данных, полученных в современных системах, которые продемонстрировали впечатляющие результаты [3, 1, 4, 5, 2]. В целях выявления лиц различного масштаба, процесс обнаружения, как правило, повторяется с пирамидой изображений, разрешение которых сокращается в несколько раз (например, 1,2) от первоначального 1 [3, 1]. Такие процедуры могут быть ускорены, когда другие визуальные сигналы точно определены (например, цвета и движения), для предварительной обработки размера, для сокращения пространства поиска [5]. Поскольку лица часто обнаруживаются через масштаб, обнаруженные лица источника обычно далее обрабатываются, чтобы объединить перекрытые результаты и удалить ложные положительные стороны с эвристикой (например, лица типично не накладываются в изображениях) [1].

Многочисленные представления были предложены для обнаружения лица, включая основанный на пикселе [3, 1, 5], основанный на частях [6, 4, 7], местные особенности края [8, 9], небольшие волны Haar [10, 4] и особенности Haar [2, 11]. В то время как ранее целостные схемы представления могли обнаружить лица [3, 1, 5], недавние системы с Haar-подобными особенностями [2, 12, 13] продемонстрировали внушительные эмпирические результаты в обнаружении лиц под преградой. Большой и представительный учебный набор изображений лица является существенным для успеха основанных на изучении датчиков лица. От набора собранных данных более положительные примеры могут быть искусственно произведены, тревожа, отражая, вращаясь и измеряя оригинальные изображения лица [3, 1]. С другой стороны, относительно легче собрать отрицательные примеры, беспорядочно пробуя изображения без изображений лица [3, 1].

Поскольку обнаружение лица может быть главным образом сформулировано как проблема распознавания образов, многочисленные алгоритмы были предложены, чтобы изучить их общие шаблоны или дискриминант классификаторов. Как правило, хорошая система обнаружения лица должна обучаться в несколько итераций. Один из распространенных методов по дальнейшему совершенствованию системы должна улучшить обучаемый датчик лица с используемыми параметрами, и переобучить систему с ложным положительным так же как отрицаниями [1]. Этот процесс повторяется несколько раз, чтобы далее улучшить работу датчика лица. Обзор этих тем может быть найден в [5]…

Список литературы

[1] Rowley, H., Baluja, S., Kanade, T.: Neural network-based face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 20(1) (1998) 23–38

[2] Viola, P., Jones, M.: Robust real-time face detection. International Journal of Computer Vision 57(2) (2004) 137–154

[3] Sung, K.K., Poggio, T.: Example-based learning for view-based human face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 20(1) (1998) 39–51

[4] Schneiderman, H., Kanade, T.: Object detection using the statistics of parts. International Journal of Computer Vision 56(3) (2004) 151–177

[5] Yang, M.H., Kriegman, D., Ahuja, N.: Detecting faces in images: A survey. IEEE Transactions on Pattern Analysis and Machine Intelligence 24(1) (2002) 34–58

[6] Mohan, A., Papageorgiou, C., Poggio, T.: Example-based object detection in images by components. IEEE Transactions on Pattern Analysis and Machine Intelligence 23(4) (2001) 349–361

[7] Heisele, B., Serre, T., Poggio, T.: A component-based framework for face detection and identification. International Journal of Computer Vision 74(2) (2007) 167–181

[8] Amit, Y., Geman, D.: A computational model for visual selection. Neural Computation 11(7) (1999) 1691–1715

[9] Fleuret, F., Geman, D.: Coarse-to-fine face detection. International Journal of Computer Vision 41(12) (2001) 85–107

[10] Papageorgiou, C., Poggio, T.: A trainable system for object recognition. International Journal of Computer Vision 38(1) (2000) 15–33

[11] Dollar, P., Tu, Z., Tao, H., Belongie, S.: Feature mining for image classification. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. (2007)

[12] Li, S., Zhang, Z.: Floatboost learning and statistical face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 28(9) (2004) 1112–1123

[13] Huang, C., Ai, H., Li, Y., Lao, S.: High-performance rotation invariant multiview face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 29(4) (2007) 671–686

[14] Freund, Y., Schapire, R.: A decision-theoretic generalization of on-line learning and application to boosting. Journal of computer and system sciences 55(1) (1997) 119–139

[15] Jones, M., Viola, P.: Fast multi-view face detection. Technical Report TR2003-96, Mitsubishi Electrical Research Laboratories (2003)

[16] Viola, P., Jones, M.: Fast and robust classification using asymmetric Adaboost and a detector cascade. In: Advances in Neural Information Processing Systems. (2002) 1311–1318

[17] Wu, J., Brubaker, S.C., Mullin, M., Rehg, J.: Fast asymmetric learning for cascade face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 30(3) (2008) 369–382

[18] Pham, M.T., Cham, T.J.: Online learning asymmetric boosted classifiers for object detection. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. (2007)

[19] Brubaker, S.C., Wu, J., Sun, J., Mullin, M., Rehg, J.: On the design of cascades of boosted ensembles for face detection. International Journal of Computer Vision 77(1-3) (2008) 65–86

[20] Provost, F., Fawcett, T.: Robust classification for imprecise environments. Machine Learning 42(3) (2001) 203–231

[21] Pham,M.T., Cham, T.J.: Fast training and selection and Haar features using statistics in boosting-based face detection. In: Proceedings of IEEE International Conference on Computer Vision. (2007)

[22] Oren, M., Papageorgiou, C., Sinha, P., Osuna, E., Poggio, T.: Pedestrian detection using wavelet templates. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. (1997) 193–199

[23] Romdhani, S., Torr, P., Sch¨ olkopf, B., Blake, A.: Computationally efficient face detection. In: Proceedings of the Eighth IEEE International Conference on Computer Vision. Volume 2. (2001) 695–700

[24] Keren, D., Osadchy, M., Gotsman, C.: Antifaces: A novel fast method for image detection. IEEE Transactions on Pattern Analysis and Machine Intelligence 23(7) (2001) 747–761

[25] Osadchy, M., LeCun, Y., Miller, M.: Synergistic face detection and pose estimation with energy-based models. Journal of Machine Learning Research (2007) 1197–1214

[26] Moriyama, T., Kanade, T., Xiao, J., Cohn, J.: Meticulously detailed eye region model and its application to analysis of facial images. IEEE Transactions on Pattern Analysis and Machine Intelligence 5(28) (2006) 73800752

[27] Ding, L., Martinez, A.: Precise detailed detection of faces and facial features. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. (2008)

[28] Friedman, J., Hastie, T., Tibshirani, R.: Additive logistic regression: a statistical view of boosting (With discussion and a rejoinder by the authors). The Annals of Statistics 28(2) (2000) 337–407