Реферат по теме выпускной работы
Содержание
- Введение
- 1. Актуальность темы
- 2. Цель и задачи исследования, планируемые результаты
- 3. Анализ предметной области
- 3.1 Обзор инструментальных средств
- 3.2 Анализ методов решения
- 3.3 Анализ методов детектирования объектов
- 4. Научная новизна и практическая ценность
- Список источников
Введение
Многие водители за рулем автомобиля испытывают чувство усталости или сонливости, и они даже не подозревают о том, что находятся в таком состоянии. Отслеживание опасного поведения за рулем может помочь обратить внимание водителей на стиль своего вождения и связанные с этим риски, тем самым снизить процент неосторожного вождения и улучшить навыки безопасного поведения на дороге. Понятие «вождение в полусонном состоянии», возможно, звучит несерьезно, но количество несчастных случаев, вызванных засыпанием водителя за рулем, с каждым годом уносит все больше жизней и приводит к травматизму. Вождение в состоянии сонливости настолько же опасно, как и вождение в состоянии алкогольного опьянения, о чем свидетельствует анализ числа травм и смертей, полученных при вождении. Заснул ли водитель за рулем, или же у него замедлилась скорость реакции – все это в равной мере может привести к серьезным опасным последствиям вождения в состоянии сонливости.
1. Актуальность темы
Системы автоматизированной поддержки водителя (Advanced Driver Assistance Systems, ADAS) нацелены на оказание помощи водителю в деле недопущения дорожно-транспортных происшествий (ДТП) или смягчения их последствий. Предупреждающие сигналы высокой приоритетности подаются этими системами для стимулирования бдительности и своевременных и надлежащих действий водителя в ситуациях, когда может иметь место или непосредственно существует опасность возникновения серьезных повреждений или гибели людей.
Основные современные технологии, составляющие ADAS-системы:
Все ADAS-системы можно условно разделить по форме представления на две категории:
2. Цель и задачи исследования, планируемые результаты
Постановка задачи
Проблеме мониторинга и контроля водителя по изображению посвящено не так уж много работ, следовательно, тема является актуальной. Основные трудности заключаются в том, чтобы можно было распознать объект независимо от изменения ракурса и условий освещённости при съёмке. Также немаловажной проблемой является ограниченный функционал мобильных ADAS- решений, так как они не умеют одновременно отслеживать и поведение водителя, и движение ТС из-за того, что в процессе работы используется только одна из камер смартфона.
Цель исследования – обзор методов детектирования, распознавания и сопровождения объектов фоторяда для повышения безопасности водителей и пассажиров ТС. В данном случае под объектом понимается лицо водителя. Решение задачи мониторинга состояния водителя состоит из нескольких шагов. На рисунке 1 представлены основные этапы обработки фоторяда.
Обнаружение и распознавание объектов в кадре
В первую очередь после получения очередного кадра, требуется выделить на нем объекты, представляющие интерес, а именно лицо водителя, и затем уточнить тип найденного объекта.Для решения данной задачи существует множество различных подходов, а именно сегментация, детектирование признаков, категориальное распознавание и т.д., для дальнейшего анализа были выделены следующие группы методов: основанные на сопоставлении с шаблоном и основанные на извлечении признаков.
Детектирование объектов с использованием метода поиска объекта по шаблону
Данная группа методов работает по следующему принципу: требуется два компонента – исходное изображение и изображение-шаблон. Чтобы определить сходный участок, необходимо наложить шаблон на снимок и попиксельно двигать его, слева направо, сверху вниз. В каждом положении вычисляется метрика, которая показывает, совпадают картинки или нет. Для каждого положения шаблона метрика заносится в результирующую матрицу R. Каждое положение (x,y) в R содержит метрику совпадений. После окончания сравнения лучшие совпадения находятся в глобальных минимумах (при использовании метода наименьших квадратов) или максимумах (при использовании метода корреляции или метода кросс-корреляции). Данная группа методов хорошо применяема при анализе сцен, в которых камера статична, а все экземпляр искомых объектов выглядят одинаково. На практике это приводит к следующим проблемам: в случае изменения ракурса съемки, перекрытия сразу наблюдается неустойчивая работа метода.
Категориальное распознавание объектов
Чтобы избежать вышеописанных проблем, было принято решение воспользоваться альтернативным подходом, а именно поиском лиц с помощью обученного классификатора. Использование классификатора подразумевает выделение некоторых характерных признаков на изображении, машинное обучение классификатора на наборе позитивных и негативных образцов, на которых заведомо присутствуют или отсутствуют объекты искомого класса, и применение классификатора к очередному изображению с целью поиска объектов на нем. Среди наиболее популярных методов данной группы можно выделить следующие: метод Виолы-Джонса, главных компонент, преобразования Хафа.
Процесс определения сонливости
Существующие в настоящий момент аппаратно-программные комплексы оценивают функциональное состояние человека, используя один из следующих методов: электроэнцефалографию, анализ сердечной активности, движения головы, время реакции на стимул, электродермальную активность, движения глаз, моргания, измерение доли времени, в течение которого веки частично закрыты по оценкам наблюдателя (PERCLOS). PERCLOS (PERcentage of eye CLOSure) – это доля времени, в течение которого веки водителя частично закрыты по оценкам наблюдателя или соответствующей прикладной программы. Однако эффективность подобных систем пока еще невелика. Причина тому – недостаточно разработанные физиологические и поведенческие критерии, на основании которых могут распознаваться опасные для водителя состояния, проблемы с регистрацией биологических сигналов, проблемы с эргономикой и удобством использования, закрытость алгоритмов, отсутствие обмена информацией в среде разработчиков, а также простое нежелание водителей быть объектами контроля.
Наиболее перспективным с точки зрения удобства использования, качества сигнала и информативности регистрируемых параметров является метод анализа окуломоторных реакций. В настоящей работе использовался метод видеоокулографии (eye-tracking), который сочетает в себе все указанные достоинства. Можно выявить следующие физиологические признаки, которые измеряют невнимательность, усталость или сонливость водителя ТС: доля времени, когда глаза закрыты (PERCLOS), зевота, кивание головой, частота моргания век, скорость моргания век.
Критерием сонливости является состояние, когда глаза закрыты больше 80% за минуту. Если процент закрывания глаз превышает 80% в течение минуты, то человек считается дремлющим. Сонливость – это чувство усталости и «слипания глаз», являющееся следствием нарушения сна и сопровождающееся постоянным или периодическим желанием уснуть во время, не предназначенное для сна. Чрезмерная сонливость снижает бдительность. Скорость реакции замедляется, затрудняется принятия решений, а также понижается внимание, память, страдает координация движений. Одним из заметных признаков сонливости является момент, когда водитель «клюет носом», т.е. ему трудно становится удерживать голову в нормальном положении.При развитии усталости или сонливости моргание глаз может стать более продолжительным и более медленным, и (или) частота моргания может варьировать, и (или) при моргании веки могут начать опускаться с небольшой амплитудой, например, пока глаза не начинают закрываться до краткосрочных «микроснов», т.е. состояний сна, которые длятся в течение приблизительно 3–5 с или дольше, или до продолжительного сна.
Обобщенная схема работы системы
Подсистема мониторинга и контроля усталости водителя в упрощенном виде состоит из трех модулей:
- Модуль детектирования лица водителя в кадре.
- Модуль распознавания глаз по ключевым признакам.
- Модуль отслеживания лица на следующих кадрах.
Входной информацией для такой системы является последовательность фото, снятых с определенной частотой. К каждому из них применяется алгоритм детектирования лица водителя. Получив область кадра с объектом, необходимо произвести сравнение ключевых признаков полученного объекта с имеющимися в БД. В результате чего, получаем подтверждение или опровержение утверждения «это лицо». В случае отсутствия совпадений, запишем новый вектор признаков в БД. Затем производится отслеживание на обнаруженном лице водителя положение глаз и проверяется на усталость с помощью имеющихся методов. Обобщённая схема работы подсистемы мониторинга и контроля усталости водителя изображена на рисунке 2.
3. Анализ предметной области
Многие водители за рулем автомобиля испытывают чувство усталости или сонливости, и они даже не подозревают о том, что находятся в таком состоянии. Отслеживание опасного поведения за рулем может помочь обратить внимание водителей на стиль своего вождения и связанные с этим риски, тем самым снизить процент неосторожного вождения и улучшить навыки безопасного поведения на дороге. Понятие «вождение в полусонном состоянии», возможно, звучит несерьезно, но количество несчастных случаев, вызванных засыпанием водителя за рулем, с каждым годом уносит все больше жизней и приводит к травматизму. Вождение в состоянии сонливости настолько же опасно, как и вождение в состоянии алкогольного опьянения, о чем свидетельствует анализ числа травм и смертей, полученных при вождении. Заснул ли водитель за рулем, или же у него замедлилась скорость реакции – все это в равной мере может привести к серьезным опасным последствиям вождения в состоянии сонливости.
Системы автоматизированной поддержки водителя (Advanced Driver Assistance Systems, ADAS) нацелены на оказание помощи водителю в деле недопущения дорожно-транспортных происшествий (ДТП) или смягчения их последствий. Предупреждающие сигналы высокой приоритетности подаются этими системами для стимулирования бдительности и своевременных и надлежащих действий водителя в ситуациях, когда может иметь место или непосредственно существует опасность возникновения серьезных повреждений или гибели людей.
Все ADAS-системы можно условно разделить по форме представления на две категории:
На рынке ADAS-систем существует немалое количество решений от разных компаний. Можно отметить следующие недостатки интегрируемых ADAS-систем:
3.1 Обзор инструментальных средств
В связи с новизной исследования в рамках предметной области, в процессе исследования рынка программного обеспечения был найден всего один программный продукт, схожих своей функциональностью с рассматриваемой в рамках магистерской работы системы.
Одним из наиболее популярных мобильных приложений в сфере ADAS-систем является решение iOnRoad3. Приложение использует встроенные в смартфон тыловую камеру, сенсоры и датчики для обнаружения впереди идущих автомобилей и предупреждения водителя в случае опасности. Данная система фиксирует объекты впереди водителя в реальном времени, высчитывая текущую скорость с помощью сенсоров. При надвигающейся опасности всплывает звуковое и графическое предупреждение о возможности столкновения, позволяя водителю вовремя затормозить.
Мобильные приложения имеют, в свою очередь, свои недостатки. Главным из них является то, что мобильные ADAS-решения не умеют отслеживать одновременно и поведение водителя, и движение ТС, и в таких приложениях задействуется только одна из имеющихся на смартфоне камер. Таким образом, мобильные ADAS-решения не учитывают весь спектр небезопасных дорожных ситуаций, с которыми может столкнуться водитель ТС. Кроме того, в таких мобильных решениях все интенсивные вычисления по обработке и анализу изображений и дорожных ситуаций выполняются только на смартфоне водителя, что может быть не всегда приемлемо ввиду ограниченности ресурсов мобильных устройств. Таким образом, развертывание и выполнение процессов мобильных приложений не представлено в облачной среде.
3.2 Анализ методов решения
Если рассматривать задачу мониторинга и контроля усталости водителя, то её можно разделить на три подзадачи–обнаружение, распознавание и отслеживание.
- обнаружение (detection) – выделение областей на изображении, которые могут содержать интересующий нас объекты, в нашем случае лицо водителя;
- распознавание (recognition) – уточнение типов найденных объектов, а именно глаза водителя;
- сопровождение (tracking) – локализация на следующих кадрах распознанных объектов.
Существует два способа отслеживания лица водителя на фото. Первый–обнаружение объекта в каждом кадре и второй – сопровождение через обнаружения в первом кадре, то есть выделяется объект, распознается и в дальнейшем отслеживается на каждом последующем кадре. Данный способ является вычислительно эффективным в отличии от первого, где приходится искать объекты в каждом кадре, что ведет к существенной вычислительной нагрузки на систему.
3.3 Анализ методов детектирования объектов
1. Один из возможных подходов к решению задачи поиска объектов состоит в том, чтобы использовать алгоритмы машинного обучения для построения моделей классов объектов (человек, мотоцикл, самолет, автомобиль, автобус и т.д.) и алгоритмы вывода для определения положения объектов на изображении.
Построение модели состоит из двух этапов:
Поиск объектов на основании некоторого шаблона предполагает, что имеется изображение объекта – шаблон – и тестовое изображение, которое сопоставляется с этим шаблоном (рисунок 1.5). В простейшем случае в качестве шаблона может выступать матрица интенсивностей цветов, наиболее характерных для объекта. Более сложные методы рассматриваемой группы в качестве шаблона используют наборы векторов признаков (дескрипторы), геометрическое представление объекта или вероятностные модели объектов, которые содержат информацию о распределениях интенсивностей пикселей. Сопоставление (matching) с шаблоном подразумевает сравнение описаний тестового и шаблонного изображений по некоторой выбранной метрике – как правило, выбирается Евклидово расстояние, норма L1, взвешенная свертка квадратичных ошибок, либо корреляция.
4. Научная новизна и практическая ценность
Научная новизна прежде всего заключается в том, что для исследования взят малоизученный объект, а именно модель определения лица и выделения глаз, что добавляет сложность в изучении предметной области. В процессе изучения предметной области, были собраны различные материалы для дальнейшего анализа, и выбора направления собственного исследования. Сложность исследования заключается прежде всего в нестабильности большинства алгоритмов к распознаванию лиц, а именно сложность их распознавания при незначительных поворотах и наклонах. На основе изученных материалов, был сформулирована математическая постановка задачи детектирования объектов.
По итогам проведенного обзора было принято решение использовать метод категориального распознавания объектов на изображении. В настоящий момент самым популярным в силу высокой скорости и эффективности является представленный в 2001 году метод Виолы – Джонса.
Основные принципы метода Виолы-Джонса таковы:
Характеристики метода:
Основу методы Виолы-Джонса составляют примитивы Хаара. В оригинальной версии алгоритма использовались только примитивы без поворотов, а значение признака вычислялось как простая разность сумм яркостей пикселей в подобластях. В дальнейшем были предложены примитивы с наклоном на 45 градусов, а также несимметричных конфигураций. Вместо вычисления простой разности было предложено приписывать каждой подобласти определенный вес и вычислять значение признака как взвешенную сумму пикселей разнотипных областей. Признаки вычисляются в пределах перемещающегося по изображению сканирующего окна переменного размера.
Вычисляемым значением такого признака будет: F = X-Y
где Х – сумма значений яркостей точек, закрываемых светлой частью признака, а Y – сумма значений яркостей точек, закрываемых темной частью признака.
Для их вычисления используется понятий интегрального вычисления (англ. Summed Area Table – SAT): в каждом пикселе изображения записана сумма всех пикселей левее и выше данного.
В алгоритме Виолы – Джонса используется так называемый бустинг [(англ. boosting) – комплекс методов, способствующих повышению точности аналитических моделей, или усиление «слабых» моделей. Это процедура последовательного построения композиции алгоритмов машинного обучения, когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих. В данном случае применяется алгоритм бустинга AdaBoost.
Метод Виолы – Джонса использует каскадную модель сильных классификаторов. Она представляет собой дерево принятия решений, где каждый узел построен так, чтобы детектировать все интересующие образы и отклонять области, не являющиеся образами.
Каскад применяется по следующим правилам:
простымиклассификаторами;
Для задачи отслеживания объекта было принято использовать фильтр Кальмана, который позволяет получить вероятные положения найденных ранее объектов в новом кадре на основе истории его предыдущих положений.
Основные особенности данного алгоритма:
При написании данного реферата магистерская работа еще не завершена. Окончательное завершение: апрель 2020 года. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.
Список источников
- Culjak I., Abram D., Pribanic T., Dzapo H., Cifrek M. A brief introduction // 2012 Proceedings of the 35th International Convention MIPRO. Opatija, Croatia. 2012. P. 1725-1730.
- Kalman R.E. A new approach to linear filtering and prediction problems // Journal of Basic Engineering, Vol. 82(1), 1960. P. 35-45.
- Cristianini N., Shawe-Taylor J. An Introduction to Support Vector Machines and Other Kernel based Learning Methods. New York: Cambridge University Press, 2000.
- Dalal N., Triggs B. Histograms of oriented gradients for human detection // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2005. Vol. 1. P. 886-893.
- Amos B., Ludwiczuk B., Satyanarayanan M. Openface: A general-purpose face recognition library with mobile applications, CMU School of Computer Science, Pittsburgh, Pennsylvania, United States, CMU-CS-16-118, 2016.
- Viola P., Jones M. Rapid Object Detection using a Boosted Cascade of Simple Features // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Kaiai, Hawaii, USA. 2001. Vol. 1. P. 511-518.
- Bay H., Ess A., Tuytelaars T., Van Gool L. Speeded-Up Robust Features (SURF) // Computer Vision and Image Understanding. June 2008. Vol. 110(3). P. 346-359.