АЛГОРИТМЫ И МЕТОДЫ ПОИСКА СОБЫТИЙ В ВИДЕОПОТОКЕ

Вороной А.С.

Донецкий национальный технический университет

Доклад, сделанный на региональной конференции "Компьютерный мониторинг и информационные технологии", ДонНТУ 24 мая 2007 года. В докладе рассматриваются основные методы обнаружения событий в видеопотоке, их недостатки и способы преодоления.

В данном докладе будут рассмотрены основные проблемы имеющихся алгоритмов поиска событий в видеопотоке, а также будет предложен вариант решения некоторых проблем, связанных с наложением движущихся объектов друг на друга.

  1. Обзор имеющихся подходов к решению проблемы поиска событий в видеопотоке.
    С дальнейшим ростом возможностей вычислительной техники большее развитие могут получать системы, занимающиеся автоматическим распознаванием событий в видеопотоках. При решении этой задачи можно выделить такие подходы: На каждом из этих подходов базируется несколько алгоритмов распознавания:

    Рассмотрим эти алгоритмы подробнее.
    Вычитание двух последовательных кадров основано на том, что вычитая значения цветов на последовательных кадрах изображения можно отследить перемещения объектов. Также используя битовую маску, можно выяснить, перемещалась ли некоторая точка изображения или нет.
    Метод вычитания, базирующийся на использовании базового кадра отличается от ранее рассмотренного метода лишь тем, что вычитаются не последовательные кадры, а текущий кадр и некоторый базовый кадр, который, по сути, представляет собой недвижимый фон изображения. Такое небольшое изменение помогает уменьшить время распознавания.
    Использование методов, базирующихся на применении битовой маски, заключается в том, что благодаря некоторой обработке исходного изображения можно найти участки, кардинально отличающиеся от общего фона и, таким образом, вероятно принадлежащим предметам, которые могут вызвать срабатывание тех или иных событий.
    Функция корреляции изображения позволяет сравнивать области различных кадров, давая ответ на вопрос, попал ли объект из некоторой области первого кадра в некоторую область другого кадра.
    Однако, рассмотренные алгоритмы обладают некоторыми недостатками, а именно: низкая точность распознавания, если распознаваемые объекты налагаются друг на друга, кроме того, распознавание требует высоких вычислительных ресурсов и занимает достаточно много времени.

  2. Пути преодоления существующих недостатков систем распознавания событий в видеопотоке.
    Существует несколько путей преодоления недостатков существующих методов распознавания:

    Уменьшение количества цветов приведет к уменьшению занимаемой памяти, а также, вероятно, уменьшит время, необходимое для обработки изображений. Уменьшение числа цветов может происходить несколькими способами:

    Палитра представляет собой цвета, записанные отдельным массивом. В этом случае объем памяти, занимаемый изображением, уменьшится в разы, если палитра будет состоять из небольшого числа цветов, а остальные цвета будут усреднены. Кодирование же представляет собой следующее: вместо 24-х бит цвета записывается только некоторые из его бит, определяющие цвет. Сам же цвет по ним восстанавливается с некоторой погрешностью. Следует отметить, что у самого метода уменьшения количества цветов есть недостаток – необходимость выбора достаточного количества цветов.
    Разбиение изображения на несколько, хоть и увеличивает объем требуемой для работы программы оперативной памяти за счет того, что вместо одного кадра появляется несколько, содержащие разные объекты из первоначального, но и позволяет избежать некоторых недостатков распознавания. Разбиение одного кадра на несколько планируется проводить по цветовому признаку – зная цвета различных объектов, после вычитания можно перенести часть из них на другие кадры, избежав, таким образом, наложений.
    Уменьшение разрешения изображения, безусловно, скажется на качестве самого изображения, но, если уменьшение проводить в разумных пределах, не должно сказаться на качестве распознавания, позволив значительно сократить занимаемое изображением место в оперативной памяти.
  3. Заключение Таким образом, используя три вышеописанных метода планируется получить выигрыш в качестве распознавания, не увеличивая требуемый объем вычислительного ресурса.

Литература

  1. Н.С. Байгарова, Ю.А. Бухштаб Некоторые принципы организации поиска видеоданных. Программирование, N 3, 1999, стр. 165-170
  2. Jain, R. and Gupta, A., Visual Information Retrieval, Communications of the ACM, 1997, vol. 40, no. 5.

Назад