ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ В ТВ СИСТЕМАХ НАБЛЮДЕНИЯ И ОХРАНЫ
Н.Уваров
Источник:http://www.spytek.ru/articles/412
CCTV focus #3, 2004
Цифровые технологии в телевидении отождествляют, прежде всего, с передачей видеоинформации по каналам связи и регистрацией (архивацией) видеоинформации на жёстких магнитных дисках или интегральных цифровых ЗУ. Здесь применение цифровых технологий целенаправленно на повышение помехоустойчивости и сокращение избыточности. Другая область применения цифровых технологий это обработка изображений (видеоинформации) для достижения конкретных целей в различных приложениях науки и техники, космических исследованиях и военном деле, то есть там, где телевидение используется как средство получения видеоинформации или как средство отображения пространственного распределения признака невидимых физических полей. Примерами применения могут служить улучшение качества биологических и медицинских изображений, включая рентгенограммы, термограммы изображения радиоизотопной и ультразвуковой диагностики. Повышение контраста и чёткости изображений, создаваемых электронным микроскопом и промышленными рентгеновскими установками. Коррекция искажений изображений, принимаемых из космоса, автоматический анализ характера местности, исследование природных ресурсов спектрозональными ТВ системами и другие сферы применения [1].
В общем случае обработка изображений это один из видов преобразования сигналов. А вот особенности изображения как сигнала состоят в следующем,
- во-первых, этот сигнал двухмерный (чёрно-белое изображение) или многомерный (спектрозональное или цветное изображение), здесь существенна не форма представления, а статистические связи (например, многомерное представление белого шума не создаёт изображения);
- во-вторых, изображение представлено, как правило, так что размерность формы представления не совпадает с его собственной размерностью (в телевидении, например, изображение представлено одномерным видеосигналом);
- в третьих, изображение всегда представлено на конечном интервале – оно ограничено рамками кадра, значит, нужна осторожность в использовании спектральных оценок, истинных на бесконечных интервалах, в вопросах обеспечения изотропности обработки в краевых зонах и т.п.
При такой интерпретации изображений сигналами, возврат в исходное пространство, в целях исследования и изменения корреляционных связей (а только они придают смысловой характер изображению, ибо изображение белого шума смысловой информации лишено), возможен, пожалуй, только с помощью цифровых технологий. Цифровые технологии позволяют интерпретировать временное распределение признака в пространственное распределение цифровых отсчётов в ячейках памяти, с последующим фрагментарным доступом к отсчётам для целей обработки.
В обработке изображений, как и вообще в обработке сигналов, всегда встают два вопроса: зачем обрабатывать и какими средствами обрабатывать. В телевидении традиционно обрабатывают для того, чтобы лучше было видно. Долгое время становления телевидения шёл процесс совершенствования аппаратуры для передачи и воспроизведения изображений, и с тех пор сохранилось представление об обработке как средстве коррекции аппаратных погрешностей. В те далёкие времена родились, например, такие виды обработки, как апертурная и шейдинг-коррекции, первый вид обработки процветает до сих пор, а второй уже давно забыт. Основной задачей обработки тогда было обеспечение высокой точности воспроизведения, то есть реставрация изображения. Эта операция обработки направлена на преобразование параметра изображения так, чтобы компенсировать, заранее известные, вносимые аппаратурой искажения, обеспечивая принцип достоверности передачи видеоинформации.
Однако уже на ранних стадиях развития становилось ясно, что верность воспроизведения не всегда хороша. Нужно ли точно воспроизводить освещённость, если в природе она изменяется от 100000 люкс в яркий солнечный день до 100 люкс в сумерки или даже до 0,005 люкс тёмной ночью? Кому нужно изображение, воспроизводимое на мониторе с яркостью эквивалентной освещённости 0,005 люкс? Значит в отношении освещённости, по крайней мере, точность воспроизведения не нужна. Здесь требуется привести эквивалентную яркость монитора к тем условиям, в которых изображение наблюдают, то есть нормировать яркость. Отсюда следует вторая задача обработки приведение одного из параметров изображения к оптимальному значению - нормализация.
В прикладном телевидении ТВ система, как правило, должна активно содействовать достижению целей функционирования потребителя телевизионного сообщения. И в этом случае активное содействие реализуется путём предварительной обработки изображения, специально направленной на постоянное поддержание (нормирование) этих наилучших условий.
Третья задача обработки изображения – помехоподавление – не требует особых объяснений. Необходимость подавления флуктуационных шумов, фоновых и импульсных помех вполне очевидна практически во всех сферах использования ТВ-средств.
Отдельную четвёртую задачу обработки изображений связывают с семантическим анализом, то есть со смысловой дешифровкой изображения. Изображение анализируют тогда, когда хотят узнать из него что-нибудь новое. Достоверно неизвестно, как людям удаётся это делать. В известной же технической практике процесс анализа изображений обычно представляет собой комбинацию измерительных операций и актов принятия решения, причём нередко эта комбинация бывает довольно сложной и многократной.
Вопрос о выборе средств обработки нельзя рассматривать в отрыве от содержания обработки. Известно, например, что быстрая форма простейшего интегрального преобразования Уолша-Адамара для одномерной последовательности из N отсчётов требует N log2N операций сложения вычитания [2], а двумерное преобразование требует N2 – кратного повторения процедуры. Итого получается N3 log2N операций при обработке квадратного фрагмента изображения со стороной в N отсчётов. То есть для простейшей высокочастотной обработки изображения с фрагментом 3Х3 потребуется около 30 операций на один элемент изображения. Таким образом, получается, что для стандартной телевизионной камеры с полосой частот видеосигнала 5 МГц, для неискажённого представления сигнала, необходимо взять не менее 10 миллионов отсчётов в секунду. А быстродействие процессора для случая обработки по фрагменту 3Х3, в темпе работы телевизионной системы, составит 300 миллионов операций в секунду. Увеличение размерности фрагмента резко повышает требования к быстродействию средств обработки. Существует несколько способов снижения требований к вычислительной производительности аппаратных средств, например, с помощью многопроцессорных ЭВМ распараллеливания вычислительного процесса или растяжке процедуры обработки на время генерирования всех элементов фрагмента и прочее. Пока все эти способы - сплошная экзотика для применения в телевизионных системах наблюдения и охраны (СНО), где количество телевизионных камер исчисляется десятками, а иногда сотнями.
Одним из путей осуществления обработки изображений состоит в создании специализированных вычислительных устройств, то есть реализация ценой отказа от преимуществ универсальных вычислительных машин. По этому пути и пошли разработчики и производители телевизионного оборудования СНО. Надо сказать, что и здесь имеются существенные ограничения. Так для выделения низкочастотных пространственных составляющих, например, необходимо обрабатывать всё изображение форматом 600Х800 элементов и не пофрагментно, а как единый массив. Конечно же, это не удаётся сделать в темпе телевизионной системы, даже ценой отказа от программного управления.
Поэтому в обработке изображений СНО не стали отбрасывать «старомодные» средства аналоговой техники. Здесь оказался оправданным прагматический подход к выбору средств реализации, то есть выбор средств, минимизирующих затраты при заданных ограничениях на качество обработки и на массогабаритные характеристики аппаратуры. При таком подходе выбор средств оказывается обусловленным физическим смыслом параметра изображения, преобразуемого данной функцией. В этом отношении параметры изображений можно сгруппировать так:
Преобразование изображения по любому параметру может решать любую из перечисленных задач обработки. Если операция обработки преобразует параметр так, чтобы компенсировать вносимые аппаратурой искажения, то решается задача реставрации изображения. При этом исходят из известных погрешностей, вносимых аппаратурой (например, погрешности фотоэлектрического преобразования). Если параметр приводиться к оптимальному значению, то решается задача нормализации. В данном случае исходят из критериев оценки качества изображения получателем телевизионной информации. Если распределение по данному параметру изображения и помехи различно, то это различие можно использовать для селекции сигнала на фоне помехи, то есть в целях помехоподавления и достижения необходимого отношения сигнал/шум. Если различия распределения обусловлены элементами изображения, то обработка распределения по этому параметру позволяет выбирать элементы изображения в целях семантического анализа. В случае семантического анализа исходят из свойств самого изображения (например, размеров объектов, связанности контуров, параметров движения и прочее).
Отличительной особенностью телевизионных систем наблюдения и охраны, как правило, является значительное превышение в телевизионной сети системы числа видеокамер над числом мониторов. В связи с этим, аппаратные средства обработки видеосигналов традиционно размещают непосредственно в видеокамерах. Этим достигается: во-первых, использование специализированных вычислительных устройств, адаптированных к конкретному фотоэлектрическому преобразователю; во-вторых, решается важнейшая задача СНО - нормализации параметров видеосигнала уже на выходе видеокамеры. Действительно, организовать обработку видеоинформации, что называется на проходе, в одном специализированном цифровом устройстве практически невозможно, да и нецелесообразно. А вот работать с нормированными видеосигналами в телевизионной сети техническим средствам коммутации, регистрации и отображения видеоинформации гораздо проще и надёжнее.
Важнейшей функцией нормирования параметров видеосигнала является поддержание стабильного размаха видеосигнала на выходе телевизионной камеры при изменении освещённости на наблюдаемой сцене. Для этого в камере используются специальные механизмы управления её чувствительностью. При этом важно электронными устройствами в видеокамере адекватно с телевизионным оператором оценить (измерить) и установить величину видеосигнала, обеспечивающую на мониторе оптимальные условия наблюдения визуальной обстановки на объекте охраны. Задача измерения осложняется тем, что телевизионный видеосигнал по природе униполярный и форма его совершенно не похожа на формы гармонических функций, вследствие чего традиционное понятие амплитуды теряет смысл. Отождествление величины видеосигнала с его средним значением или со среднеквадратичным (стандартным) отклонением так же некорректно, так как у реальных телевизионных сигналов отклонения от нормального закона распределения очень существенны. Поэтому на практике приходится либо ограничивать аномальные отсчёты перед измерением, либо обращаться к устойчивым (робастным) мерам величины сигнала. Любое усечение многообразия свойств телевизионного сигнала границами конкретного набора измеряемых параметров всегда таит в себе риск упустить из виду именно то, что затем может оказаться чрезвычайно важным. В таких случаях предпочитают непараметрическое оценивание сигнала посредством построения гистограмм уровневого распределения. Корректно это возможно только при цифровой обработке видеоинформации всего кадра и это реализовано в современных цифровых видеокамерах. Кроме того, в целях обеспечения устойчивости работы контуров автоматического управления чувствительностью телевизионной камеры, последовательность уровневых оценок видеосигнала за кадр подвергается статистической обработке цифровым фильтром с параметрами адаптированными к динамике изменений входной освещённости. Таким образом, традиционная оценка уровня видеосигнала в аналоговых камерах посредством пикового или квазипикового детектирования, чреватая неадекватностью выбора значения «пиковости» распределению яркости в сюжете, уходит в прошлое. Из практики эксплуатации аналоговых телевизионных камер известно, что выбор оценки видеосигнала близкой к среднему значению приводит к заплыванию в «белое» на ярких фрагментах изображения, оценка же ближе к пиковой, при появлении в поле зрения камеры малоразмерного светящегося или яркого объекта, приводит к ослеплению - уходу всего изображения в «чёрное». Указанной выше адекватности практически невозможно было достичь у поворотных камер, для которых структура распределения освещённости в кадре нестационарна и порой подвергается довольно резким изменениям во времени.
Цифровые алгоритмы измерения и уровневой обработки видеосигнала, для целей управления чувствительностью, позволяют более тонко реализовать функции управления компенсацией засветки фона, автоматической компенсации уровня чёрного, управления системой электронного экспонирования.
Рисунок 1 - Видеоизображение до (вверху) и после (внизу)
компенсации уровня черного в видеосигнале
Цифровые алгоритмы позволяют программно задавать изменение режимов их работы во времени или изменении внешних обстоятельств. В отличие от аналоговых камер, функции которых однозначно определены аппаратными средствами, в цифровых камерах функции определяются программным обеспечением, что и обеспечивает им высокую управляемость, то есть практически неограниченные возможности адаптации к конкретным условиям.
Одновременно с этими возможностями цифровые технологии позволяют реализовать сервисные функции по установке и обслуживанию объективов видеокамер. В режиме сервисного меню «Lens wizard» автоматически определяется тип привода диафрагмы объектива «Manual», «Direct Drive» или «Auto Iris», отображается шкала или цифровой отсчёт уровня видеосигнала при его регулировке, автоматически полностью открывается диафрагма объектива при настройке заднего фокуса. Преимущества цифровых технологий очевидны, однако широкое использование их в части обработки видеоинформации в интересах охранного телевидения впервые, в достаточно полном объёме, реализовано в видеокамерах серии «DINION-XF» компании «BOSCH». Кроме таких традиционных для цифровых камер видов обработки как двумерное оконтуривание, гамма-коррекция, компенсация засветки фона, компенсация уровня чёрного, автоматический баланс белого, которые в «DINION-XF» превосходно реализованы, здесь впервые в практике телекамер введена функция нормализации контраста на основе эквализации гистограммы уровней распределения яркостного сигнала. Эта функция позволяет значительно повысить контраст сюжетно важных деталей в изображении, что особенно важно делать в условиях значительных яркостных перепадов, типа «свет-тень», а так же при недостаточно равномерном освещении объектов наблюдения.
Рисунок 2 - Видеоизображение до (вверху) и после (внизу)
эквализации уровневого распределения
В цветных телекамерах серии «DINION-XF», кроме традиционных вычислений методом интерполяции значений RGB-сигналов, присущих каждому пикселю ПЗС-сенсора, введена довольно радикальная форма взаимной нормализации цветоделённых сигналов – декорреляция. Выполнена она подобно обычной цветностной реставрации, но коэффициенты матрицирования выбираются адаптивно, так чтобы устранить из сигналов общие, присущие им всем составляющие, и оставить лишь те, которые отличают каждый отдельный сигнал от всех остальных. Конечно, декорреляция искажает оттенки цвета, но взамен позволяет резко увеличить насыщенность, способствуя тем самым выявлению чрезвычайно слабых цветовых контрастов, а это весьма важно при выполнении операций обнаружения и опознавания.
Рисунок 3 - Исходное видеоизображение (вверху) и
изображение после нормирования цветоделённых сигналов (внизу)
Используемая в «DINION-XF» 15-битная технология цифровой обработки видеосигнала в совокупности с мощным видеопроцессором DSP (Digital Signal Processing – «HERCULES») обеспечивает высококачественную обработку видеоинформации, позволяющую оператору успешно выполнять операции обнаружения, опознавания и идентификации даже в очень сложных условиях наблюдения. Система подавления шумов - Dynamic Noise Reduction (DNR), примененная в этой камере, в сочетании со сверхвысокой чувствительностью и высоким отношением сигнал/шум, позволяет получать изображение высокой четкости с тщательной проработкой по полутонам, с хорошей цветовой насыщенностью даже при низких уровнях освещённости.
Рисунок 4 - Цветное изображение при низкой освещённости (вверху) и переход в чёрно-белый режим с системой подавления шумов (внизу)
В видеокамерах серии «DINION-XF» реализован четырёхзональный
видеодетектор движения, с индивидуальной настройкой параметров для каждой зоны.
Также имеется возможность компенсации потерь в коаксиальном кабеле в зависимости
от длины и типа кабеля. Обеспечена возможность дистанционного управления и
настройки параметров камеры по коаксиальной линии передачи видеосигнала,
обновление её встроенного программного обеспечения (Bilinx Technology). Для чего
имеется специальное небольшое устройство и ПО для инсталлятора. Экранное меню
для управления и настройки видеокамеры существенно упрощают работы с ней как на
стадии установки, так и на стадии эксплуатационного обслуживания [ 3 ].
В современных цифровых купольных видеокамерах, кроме описанных выше средств уровневой обработки видеосигнала, широко используется обработка исходной видеоинформации по частотным и пространственно-частотным параметрам для целей автоматического управления, например фокусировкой или положением линии визирования. Здесь при анализе изображений также прибегают к непараметрической оценке посредством построения спектральных распределений и автокорреляционных функций, которые сами по себе в качестве сигналов для непосредственного управления малопригодны. Однако эти результаты измерений с помощью алгоритмов двумерной пространственной обработки в цифровом процессоре доводятся до отдельных параметров управления исполнительными механизмами. Частотные параметры, выражающие среднюю спектральную плотность частотного диапазона, с успехом используют, например, для осуществления экстремального регулирования в системах автоматической фокусировки. А вот, когда изображение анализируют, не изолировано, а в составе какого-либо ансамбля изображений, например последовательности кадров, тогда в совокупность измеряемых параметров включают оценки мер их взаимосвязи или их взаимного отношения. Так, усреднение модуля межкадровой разности даёт оценку общей подвижности сюжета, а усреднение произведений отсчётов произвольных сопоставляемых изображений даёт коэффициент ковариации, статистически характеризующих меру их подобия. На основе аналогичных процедур, реализованных в DSP, корреляционные алгоритмы, позволяют вычислить величину взаимного координатного рассовмещения сопоставляемых изображений, которая служит управляющим воздействием в установках автоматического позиционирования, а в следящих системах обеспечивает сопровождение подвижных объектов.
Все вычисляемые параметры не обязательно относить к изображению в целом, цифровые технологии позволяют вычислить их пофрагментно, получая пространственное распределение соответствующего признака в пределах исходного изображения. И это обстоятельство широко используется при идентификации образов, в детекторах движения, при построении и отображении трасс движения на экране монитора. Однако важно помнить, что по мере сокращения размеров фрагментов уменьшается достоверность корреляционных оценок, а пространственно-частотный анализ постепенно теряет спектральную селективность.
Пожалуй, нет смысла далее раскрывать технические подробности использования цифровых технологий в телевизионных камерах. Отметим только тенденцию их развития в части индивидуального оснащения средствами обработки видеоинформации для достижения цели «лучше видеть, да ещё то, что надо». И основополагающим здесь является критерий - нормализации параметров изображения, воспроизводимого на мониторе непосредственно от видеосигнала каждой телевизионной камеры систем наблюдения и охраны. Если согласиться с таким выводом, то можно утверждать, что на остальные аппаратные средства телевизионных систем наблюдения и охраны возлагаются функции распределения, коммутации и регистрации видеоинформации. Здесь цифровые технологии, в отличие от аналоговых, обеспечивают выполнение этих функций, практически, без потерь в качестве и это очень важно.
Надо отметить, что тенденция оснащения ТВ камер СНО простенькими видеодетекторами движения понятна, так как эта функция типична для телевизионных систем наблюдения и охраны. Однако если требуется более детальный смысловой анализ изображения, например, для тех же целей детектирования движения в сложных условиях визуальной обстановки, или, допустим, регистрации на объекте наблюдения факта оставления посторонних предметов, без специальных средств обработки видеоинформации здесь не обойтись.
Смысловая дешифровка изображения один из наиболее сложных видов обработки видеоинформации. В рамках СНО эта дешифровка, в основном сводится к сопоставительному анализу, например текущего изображения с эталонным, заложенным в памяти. Выявление сходства в сопоставляемых изображениях или фрагментов изображений можно оценить по разности между текущим и эталонным видеосигналами. Чтобы сократить объём памяти, требуемый для записи эталонного изображения, иногда запоминают только отдельные его параметры, если, конечно, подлежащую оцениванию характеристику соответствия изображений можно выразить через соотношение между их параметрами. Подходящими параметрами являются, в частности, коэффициенты интегральных преобразований (трансформанты). При этом, чаще всего используются двумерные преобразования Уолша и Фурье. Иногда прибегают к контурным описаниям изображений. Они, конечно, менее компактны, чем описание через отдельные трансформанты, но зато дают гораздо более точные и устойчивые оценки. Процесс формирования описания с помощью трансформант или контуров играет роль своеобразного фильтра, селектирующего лишь те признаки, которые априори сочтены информативными для решения поставленной задачи. Отличия же, выражаемые отброшенными признаками, уже нельзя обнаружить посредством сопоставления описаний. Без существенных потерь в описании работают корреляционные алгоритмы, связанные с нахождением максимума функции правдоподобия между текущим и эталонными изображениями. Однако они весьма нетерпимы к масштабно-ракурсным рассогласованиям анализируемого и эталонного изображений. Поэтому, например, при "Face-контроле" требуется жёсткая фиксация лица относительно видеокамеры, а при идентификации по сетчатке глаза, направление взгляда в одну точку.
В последнее время широко ведутся работы по созданию обзорно поисковых систем, позволяющих вести, например, дистанционный обзор и визуальную идентификацию людей и средств автотранспорта. Здесь, с помощью цифровых технологий, посредством топологических преобразований, текущее изображение из реального пространства трансформируется в пространство эталона. Недостаточно точное выполнение трансформации существенно усложняет дальнейший анализ и снижает вероятность правильной идентификации объекта. Именно интеллектуальные обзорно-поисковые системы сканирования охраняемого пространства, помогут освободить оператора от рутинного и утомительного созерцания мониторов, и возложить на них только функцию принятия решения при возникновении нештатной ситуации. Однако надо отметить, что эти задачи решаются не так интенсивно как, например, задачи цифровой записи и распределения видеоинформации по цифровым сетям. Системы дистанционного наблюдения и контроля всегда ассоциировались с возможностями контроля визуальной обстановки в значительном количестве мест охраняемого объекта с центрального пульта охраны. И эффективность работы системы определялась количеством видеокамер, правильной расстановкой их, качеством, получаемого с них изображения. Средства видеорегистрации всегда были на втором плане. В настоящее время, судя по продукции видеонаблюдения, представляемой на рынок, наблюдается значительный перекос в сторону средств цифровой регистрации видеоинформации, и эта тенденция пока сохраняется [ 4 ].
Концепция технических средств безопасности состоит в упреждении и пресечении опасных событий, а не в их регистрации с последующим исследованием архива видеозаписей в надежде найти что-нибудь. Цифровые технологии в технических средствах охраны должны развиваться именно в рамках этой концепции. Они должны содействовать успешному выполнению своих функций службой безопасности объекта охраны, а не последующему позже разбору произошедших опасных событий. Практика эксплуатации систем охранного телевидения свидетельствует о том, что главным звеном в системе безопасности остается человек. На оператора-охранника до сего времени ложится значительная часть работы по оценке визуальной обстановки на объектах, просматриваемых с помощью телекамер. И в этом плане тенденция использования цифровых технологий в телевизионных камерах, в части обеспечения принципа «лучше видеть, да ещё то, что надо», является определяющей.
Литература:
1. У. Прэтт, «Цифровая обработка изображений», Издательство «МИР», М, 1982.
2. Н. Ахмед, К.Р. Рао, «Ортогональные преобразования при обработке цифровых
сигналов», Издательство «Связь», М, 1980.
3. «Больше, чем просто камера
Dinion LTC 0610 от BOSCH Securite Sistems». «Системы Безопасности», №6, 2004,
стр 48-52.
4. А. Попов, «Техника и безопасность: единство или борьба»,
«БДИ», № 5-6, 2003.
Об авторе: Уваров Николай Егорович, кандидат технических наук, руководитель Учебного центра ЗАО «Компания безопасность»
Источник статьи автора: http://www.sec.ru/