Реферат–Кожухов Артем Сергеевич–Система мониторинга и контроля усталости водителя

Реферат по теме выпускной работы

Содержание

Введение
1. Актуальность темы
2. Цель и задачи исследования, планируемые результаты
3. Анализ предметной области
3.1 Обзор инструментальных средств
3.2 Анализ методов решения
3.3 Анализ методов детектирования объектов
4. Научная новизна и практическая ценность
Список источников

Введение

Многие водители за рулем автомобиля испытывают чувство усталости или сонливости, и они даже не подозревают о том, что находятся в таком состоянии. Отслеживание опасного поведения за рулем может помочь обратить внимание водителей на стиль своего вождения и связанные с этим риски, тем самым снизить процент неосторожного вождения и улучшить навыки безопасного поведения на дороге. Понятие «вождение в полусонном состоянии», возможно, звучит несерьезно, но количество несчастных случаев, вызванных засыпанием водителя за рулем, с каждым годом уносит все больше жизней и приводит к травматизму. Вождение в состоянии сонливости настолько же опасно, как и вождение в состоянии алкогольного опьянения, о чем свидетельствует анализ числа травм и смертей, полученных при вождении. Заснул ли водитель за рулем, или же у него замедлилась скорость реакции – все это в равной мере может привести к серьезным опасным последствиям вождения в состоянии сонливости.

1. Актуальность темы

Системы автоматизированной поддержки водителя (Advanced Driver Assistance Systems, ADAS) нацелены на оказание помощи водителю в деле недопущения дорожно-транспортных происшествий (ДТП) или смягчения их последствий. Предупреждающие сигналы высокой приоритетности подаются этими системами для стимулирования бдительности и своевременных и надлежащих действий водителя в ситуациях, когда может иметь место или непосредственно существует опасность возникновения серьезных повреждений или гибели людей.

Основные современные технологии, составляющие ADAS-системы:

система обнаружения дорожной разметки (Lane Detection, LDA) – маркеров полос и края проезжей части, оценка положения автомобиля в пределах полосы;

система контроля рядности движения (Lane Departure Warning, LDW) использует информацию от модуля обнаружения полосы LDA, вычисляет время до пересечения разметки (Time to Lane Crossing, TLC) и обеспечивает предупреждение водителю в случае обнаружения ухода;

функция обнаружения транспортных средств (ТС), работающая на основе монокамерных алгоритмов, распознает все моторизованные механические ТС – автомобили, мотоциклы, грузовики, в условиях дневного или ночного освещения;

функция предупреждения о переднем столкновении и смягчении неизбежной аварии (Forward Collision Warning and pre-crash mitigation), шоссейный мониторинг и предупреждения (Headway Monitoring and Warning).

Все ADAS-системы можно условно разделить по форме представления на две категории:

мобильные приложения, устанавливаемые на смартфон из магазина приложений (Google Play / App Store)

внешние камеры, сенсоры, датчики, чипы и т.д. вместе с программными средствами, встраиваемые в автомобили на заводах-производителях или устанавливаемые постфактум.

На рынке ADAS-систем существует немалое количество решений от разных компаний. Можно отметить следующие недостатки интегрируемых ADAS-систем:

стоимость таких систем остается достаточно высокой;

они доступны в основном только в виде дополнительной опции для дорогих и эксклюзивных автомобилей.

2. Цель и задачи исследования, планируемые результаты

Постановка задачи

Проблеме мониторинга и контроля водителя по изображению посвящено не так уж много работ, следовательно, тема является актуальной. Основные трудности заключаются в том, чтобы можно было распознать объект независимо от изменения ракурса и условий освещённости при съёмке. Также немаловажной проблемой является ограниченный функционал мобильных ADAS- решений, так как они не умеют одновременно отслеживать и поведение водителя, и движение ТС из-за того, что в процессе работы используется только одна из камер смартфона.

Цель исследования – обзор методов детектирования, распознавания и сопровождения объектов фоторяда для повышения безопасности водителей и пассажиров ТС. В данном случае под объектом понимается лицо водителя. Решение задачи мониторинга состояния водителя состоит из нескольких шагов. На рисунке 1 представлены основные этапы обработки фоторяда.

Рисунок 1 – основные этапы обработки фоторяда для задачи мониторинга и контроля усталости водителя

Обнаружение и распознавание объектов в кадре

В первую очередь после получения очередного кадра, требуется выделить на нем объекты, представляющие интерес, а именно лицо водителя, и затем уточнить тип найденного объекта.Для решения данной задачи существует множество различных подходов, а именно сегментация, детектирование признаков, категориальное распознавание и т.д., для дальнейшего анализа были выделены следующие группы методов: основанные на сопоставлении с шаблоном и основанные на извлечении признаков.

Детектирование объектов с использованием метода поиска объекта по шаблону

Данная группа методов работает по следующему принципу: требуется два компонента – исходное изображение и изображение-шаблон. Чтобы определить сходный участок, необходимо наложить шаблон на снимок и попиксельно двигать его, слева направо, сверху вниз. В каждом положении вычисляется метрика, которая показывает, совпадают картинки или нет. Для каждого положения шаблона метрика заносится в результирующую матрицу R. Каждое положение (x,y) в R содержит метрику совпадений. После окончания сравнения лучшие совпадения находятся в глобальных минимумах (при использовании метода наименьших квадратов) или максимумах (при использовании метода корреляции или метода кросс-корреляции). Данная группа методов хорошо применяема при анализе сцен, в которых камера статична, а все экземпляр искомых объектов выглядят одинаково. На практике это приводит к следующим проблемам: в случае изменения ракурса съемки, перекрытия сразу наблюдается неустойчивая работа метода.

Категориальное распознавание объектов

Чтобы избежать вышеописанных проблем, было принято решение воспользоваться альтернативным подходом, а именно поиском лиц с помощью обученного классификатора. Использование классификатора подразумевает выделение некоторых характерных признаков на изображении, машинное обучение классификатора на наборе позитивных и негативных образцов, на которых заведомо присутствуют или отсутствуют объекты искомого класса, и применение классификатора к очередному изображению с целью поиска объектов на нем. Среди наиболее популярных методов данной группы можно выделить следующие: метод Виолы-Джонса, главных компонент, преобразования Хафа.

Процесс определения сонливости

Существующие в настоящий момент аппаратно-программные комплексы оценивают функциональное состояние человека, используя один из следующих методов: электроэнцефалографию, анализ сердечной активности, движения головы, время реакции на стимул, электродермальную активность, движения глаз, моргания, измерение доли времени, в течение которого веки частично закрыты по оценкам наблюдателя (PERCLOS). PERCLOS (PERcentage of eye CLOSure) – это доля времени, в течение которого веки водителя частично закрыты по оценкам наблюдателя или соответствующей прикладной программы. Однако эффективность подобных систем пока еще невелика. Причина тому – недостаточно разработанные физиологические и поведенческие критерии, на основании которых могут распознаваться опасные для водителя состояния, проблемы с регистрацией биологических сигналов, проблемы с эргономикой и удобством использования, закрытость алгоритмов, отсутствие обмена информацией в среде разработчиков, а также простое нежелание водителей быть объектами контроля.

Наиболее перспективным с точки зрения удобства использования, качества сигнала и информативности регистрируемых параметров является метод анализа окуломоторных реакций. В настоящей работе использовался метод видеоокулографии (eye-tracking), который сочетает в себе все указанные достоинства. Можно выявить следующие физиологические признаки, которые измеряют невнимательность, усталость или сонливость водителя ТС: доля времени, когда глаза закрыты (PERCLOS), зевота, кивание головой, частота моргания век, скорость моргания век.

Критерием сонливости является состояние, когда глаза закрыты больше 80% за минуту. Если процент закрывания глаз превышает 80% в течение минуты, то человек считается дремлющим. Сонливость – это чувство усталости и «слипания глаз», являющееся следствием нарушения сна и сопровождающееся постоянным или периодическим желанием уснуть во время, не предназначенное для сна. Чрезмерная сонливость снижает бдительность. Скорость реакции замедляется, затрудняется принятия решений, а также понижается внимание, память, страдает координация движений. Одним из заметных признаков сонливости является момент, когда водитель «клюет носом», т.е. ему трудно становится удерживать голову в нормальном положении.При развитии усталости или сонливости моргание глаз может стать более продолжительным и более медленным, и (или) частота моргания может варьировать, и (или) при моргании веки могут начать опускаться с небольшой амплитудой, например, пока глаза не начинают закрываться до краткосрочных «микроснов», т.е. состояний сна, которые длятся в течение приблизительно 3–5 с или дольше, или до продолжительного сна.

Обобщенная схема работы системы

Подсистема мониторинга и контроля усталости водителя в упрощенном виде состоит из трех модулей:

Модуль детектирования лица водителя в кадре.
Модуль распознавания глаз по ключевым признакам.
Модуль отслеживания лица на следующих кадрах.

Входной информацией для такой системы является последовательность фото, снятых с определенной частотой. К каждому из них применяется алгоритм детектирования лица водителя. Получив область кадра с объектом, необходимо произвести сравнение ключевых признаков полученного объекта с имеющимися в БД. В результате чего, получаем подтверждение или опровержение утверждения «это лицо». В случае отсутствия совпадений, запишем новый вектор признаков в БД. Затем производится отслеживание на обнаруженном лице водителя положение глаз и проверяется на усталость с помощью имеющихся методов. Обобщённая схема работы подсистемы мониторинга и контроля усталости водителя изображена на рисунке 2.

Рисунок 2 – обобщенная схема работы подсистемы мониторинга и контроля усталости водителя

3. Анализ предметной области

Все ADAS-системы можно условно разделить по форме представления на две категории:

мобильные приложения, устанавливаемые на смартфон из магазина приложений (Google Play / AppStore);

стоимость таких систем остается достаточно высокой;

они доступны в основном только в виде дополнительной опции для дорогих и эксклюзивных автомобилей.

3.1 Обзор инструментальных средств

В связи с новизной исследования в рамках предметной области, в процессе исследования рынка программного обеспечения был найден всего один программный продукт, схожих своей функциональностью с рассматриваемой в рамках магистерской работы системы.

Одним из наиболее популярных мобильных приложений в сфере ADAS-систем является решение iOnRoad3. Приложение использует встроенные в смартфон тыловую камеру, сенсоры и датчики для обнаружения впереди идущих автомобилей и предупреждения водителя в случае опасности. Данная система фиксирует объекты впереди водителя в реальном времени, высчитывая текущую скорость с помощью сенсоров. При надвигающейся опасности всплывает звуковое и графическое предупреждение о возможности столкновения, позволяя водителю вовремя затормозить.

Мобильные приложения имеют, в свою очередь, свои недостатки. Главным из них является то, что мобильные ADAS-решения не умеют отслеживать одновременно и поведение водителя, и движение ТС, и в таких приложениях задействуется только одна из имеющихся на смартфоне камер. Таким образом, мобильные ADAS-решения не учитывают весь спектр небезопасных дорожных ситуаций, с которыми может столкнуться водитель ТС. Кроме того, в таких мобильных решениях все интенсивные вычисления по обработке и анализу изображений и дорожных ситуаций выполняются только на смартфоне водителя, что может быть не всегда приемлемо ввиду ограниченности ресурсов мобильных устройств. Таким образом, развертывание и выполнение процессов мобильных приложений не представлено в облачной среде.

Рисунок 3 – Пример работы ADAS системы

3.2 Анализ методов решения

Если рассматривать задачу мониторинга и контроля усталости водителя, то её можно разделить на три подзадачи–обнаружение, распознавание и отслеживание.

обнаружение (detection) – выделение областей на изображении, которые могут содержать интересующий нас объекты, в нашем случае лицо водителя;
распознавание (recognition) – уточнение типов найденных объектов, а именно глаза водителя;
сопровождение (tracking) – локализация на следующих кадрах распознанных объектов.

Существует два способа отслеживания лица водителя на фото. Первый–обнаружение объекта в каждом кадре и второй – сопровождение через обнаружения в первом кадре, то есть выделяется объект, распознается и в дальнейшем отслеживается на каждом последующем кадре. Данный способ является вычислительно эффективным в отличии от первого, где приходится искать объекты в каждом кадре, что ведет к существенной вычислительной нагрузки на систему.

3.3 Анализ методов детектирования объектов

1. Один из возможных подходов к решению задачи поиска объектов состоит в том, чтобы использовать алгоритмы машинного обучения для построения моделей классов объектов (человек, мотоцикл, самолет, автомобиль, автобус и т.д.) и алгоритмы вывода для определения положения объектов на изображении.

Построение модели состоит из двух этапов:

извлечение признаков (числовых характеристик), характерных для объектов класса, на некотором множестве изображений – построение характеристических векторов признаков для особых точек объекта (углов, 20 линий, ребер, контуров) или для всего объекта. На данном этапе, по существу, формируется тренировочная выборка.

построение модели объекта. Предполагает обучение классификатора на полученной выборке.

построение формального описания объекта – извлечение признаков объекта из тестового изображения. На данном этапе используется такой же алгоритм извлечения, что и при построении модели.

определение положения объектов на изображении. Входными данными алгоритма поиска положения являются формальное описание объекта и модель класса объектов. На основании этой информации выполняется сравнение формального описания с моделью. Значение меры сходства можно рассматривать как степень достоверности того, что объект принадлежит классу, который определяется заданной моделью.

Поиск объектов на основании некоторого шаблона предполагает, что имеется изображение объекта – шаблон – и тестовое изображение, которое сопоставляется с этим шаблоном (рисунок 1.5). В простейшем случае в качестве шаблона может выступать матрица интенсивностей цветов, наиболее характерных для объекта. Более сложные методы рассматриваемой группы в качестве шаблона используют наборы векторов признаков (дескрипторы), геометрическое представление объекта или вероятностные модели объектов, которые содержат информацию о распределениях интенсивностей пикселей. Сопоставление (matching) с шаблоном подразумевает сравнение описаний тестового и шаблонного изображений по некоторой выбранной метрике – как правило, выбирается Евклидово расстояние, норма L1, взвешенная свертка квадратичных ошибок, либо корреляция.

4. Научная новизна и практическая ценность

Научная новизна прежде всего заключается в том, что для исследования взят малоизученный объект, а именно модель определения лица и выделения глаз, что добавляет сложность в изучении предметной области. В процессе изучения предметной области, были собраны различные материалы для дальнейшего анализа, и выбора направления собственного исследования. Сложность исследования заключается прежде всего в нестабильности большинства алгоритмов к распознаванию лиц, а именно сложность их распознавания при незначительных поворотах и наклонах. На основе изученных материалов, был сформулирована математическая постановка задачи детектирования объектов.

По итогам проведенного обзора было принято решение использовать метод категориального распознавания объектов на изображении. В настоящий момент самым популярным в силу высокой скорости и эффективности является представленный в 2001 году метод Виолы – Джонса.

Основные принципы метода Виолы-Джонса таковы:

используются изображения в интегральном представлении;

используются признаки Хаара, с помощью которых происходит

поиск нужного объекта (в данном контексте, лица и его черт);

используется бустинг (от англ. boost – улучшение, усиление) для выбора наиболее подходящих признаков для искомого объекта;

все признаки поступают на вход классификатору, который даёт результат «верно» либо «ложь»;

используются каскады признаков для быстрого отбрасывания окон, где не найдено лицо.

Характеристики метода:

Виола-Джонс является одним из лучших по соотношению показателей эффективность распознавания/скорость работы.

Обладает крайне низкой вероятностью ложного обнаружения.

Алгоритм хорошо работает и распознает объект под небольшим углом, примерно до 30 градусов. При угле наклона больше 30 градусов процент обнаружений резко падает.

Основу методы Виолы-Джонса составляют примитивы Хаара. В оригинальной версии алгоритма использовались только примитивы без поворотов, а значение признака вычислялось как простая разность сумм яркостей пикселей в подобластях. В дальнейшем были предложены примитивы с наклоном на 45 градусов, а также несимметричных конфигураций. Вместо вычисления простой разности было предложено приписывать каждой подобласти определенный вес и вычислять значение признака как взвешенную сумму пикселей разнотипных областей. Признаки вычисляются в пределах перемещающегося по изображению сканирующего окна переменного размера.

Вычисляемым значением такого признака будет: F = X-Y

где Х – сумма значений яркостей точек, закрываемых светлой частью признака, а Y – сумма значений яркостей точек, закрываемых темной частью признака.

Для их вычисления используется понятий интегрального вычисления (англ. Summed Area Table – SAT): в каждом пикселе изображения записана сумма всех пикселей левее и выше данного.

В алгоритме Виолы – Джонса используется так называемый бустинг [(англ. boosting) – комплекс методов, способствующих повышению точности аналитических моделей, или усиление «слабых» моделей. Это процедура последовательного построения композиции алгоритмов машинного обучения, когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих. В данном случае применяется алгоритм бустинга AdaBoost.

Метод Виолы – Джонса использует каскадную модель сильных классификаторов. Она представляет собой дерево принятия решений, где каждый узел построен так, чтобы детектировать все интересующие образы и отклонять области, не являющиеся образами.

Каскад применяется по следующим правилам:

работа ведется с простыми классификаторами;

только положительное значение одного классификатора запускает следующий, более приспособленный;

отрицательное значение классификатора приводит к немедленному переходу к следующему сканирующему окну и отбрасыванию текущего;

цепочка классификаторов становится все более сложной, и количество ошибок сокращается.

Для задачи отслеживания объекта было принято использовать фильтр Кальмана, который позволяет получить вероятные положения найденных ранее объектов в новом кадре на основе истории его предыдущих положений.

Основные особенности данного алгоритма:

позволяет отслеживать траекторию объекта даже в том случае, когда он не был распознан на нескольких кадрах подряд по той или иной причине;

если найденная на кадре область, содержащая фигуру человека, не была сопоставлена ни с одной из текущих траекторий, она ставится началом новой траектории;

если на протяжении некоторой последовательности кадров к траектории объекта не добавляются новые положения, объект считается покинувшим кадр, и траектория завершается.

При написании данного реферата магистерская работа еще не завершена. Окончательное завершение: апрель 2020 года. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.

Список источников

Culjak I., Abram D., Pribanic T., Dzapo H., Cifrek M. A brief introduction // 2012 Proceedings of the 35th International Convention MIPRO. Opatija, Croatia. 2012. P. 1725-1730.
Kalman R.E. A new approach to linear filtering and prediction problems // Journal of Basic Engineering, Vol. 82(1), 1960. P. 35-45.
Cristianini N., Shawe-Taylor J. An Introduction to Support Vector Machines and Other Kernel based Learning Methods. New York: Cambridge University Press, 2000.
Dalal N., Triggs B. Histograms of oriented gradients for human detection // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2005. Vol. 1. P. 886-893.
Amos B., Ludwiczuk B., Satyanarayanan M. Openface: A general-purpose face recognition library with mobile applications, CMU School of Computer Science, Pittsburgh, Pennsylvania, United States, CMU-CS-16-118, 2016.
Viola P., Jones M. Rapid Object Detection using a Boosted Cascade of Simple Features // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Kaiai, Hawaii, USA. 2001. Vol. 1. P. 511-518.
Bay H., Ess A., Tuytelaars T., Van Gool L. Speeded-Up Robust Features (SURF) // Computer Vision and Image Understanding. June 2008. Vol. 110(3). P. 346-359.

Кожухов Артем Сергеевич

Факультет компьютерных наук и технологий

Кафедра автоматизированных систем управления

Специальность Информационные системы и технологии в технике и бизнесе

Система мониторинга и контроля усталости водителя

Научный руководитель: к.т.н., доц. Васяева Татьяна Александровна