Актуальность.
Использование одномерных методов анализа, таких как концепции мгновенной частоты и групповой задержки часто не дает удовлетворительных результатов, поскольку они не адаптированы к большому числу нестационарных сигналов. Концепция мгновенной частоты предполагает, что сигнал должен содержать в каждый момент времени только одну компоненту. Концепция групповой задержки предполагает, что одна частотная компонента появляется единожды на анализируемом интервале. Таким образом, для анализа сложных нестационарных, которыми является абсолютное большинство реальных сигналов, необходимо рассматривать совместные частотно-временные распределения.
Существующие методы.
Кратковременное преобразование Фурье.
Наиболее распространенным частотно-временным распределением, существующим на сегодняшний день, является кратковременное превращение Фурье (кратковременный спектр).
(1)
где – кратковременное аналитическое окно, локализованное вокруг t=0 и t=0.
Перемножение сигнала с относительно коротким окном эффективно подавляет этот сигнал за пределами некоторой окрестности мгновения t=t. КПФ – это локальный спектр сигнала x(t) вокруг мгновения t. Исходя из того, что кратковременное окно имеет конечную энергию, возможно провести операцию обратную КПФ:
(2)
где Это выражение показывает, что весь сигнал может быть восстановлен как сумма взвешенных волновых форм.
(3)
Эти формы можно интерпретировать, как некоторые «строительные блоки» или «атомы». Каждый атом может быть получен путем переноса окна h(t) во времени и по частоте (модуляцией).
КПФ можно также выразить в терминах спектра сигнала и спектра аналитического окна:
(4)
где Х и Н соответственно спектры х и h.
Таким образом, кратковременное преобразование Фурье можно рассматривать как результат пропускания сигнала х(t) через фильтры с частотной характеристикой , то есть полученные из материнского фильтра путем перенесения его частотной характеристики на частоту f. Фактически КПФ является банком полосовых фильтров с постоянной полосой пропускания.
Разрешающую способность КПФ во времени можно получить, рассмотрев в качестве x импульс Диракля:
(5)
То есть разрешающая способность КПФ во времени пропорциональна эффективной длительности аналитического окна h. Аналогично, чтобы получить разрешающую способность КПФ по частоте необходимо рассмотреть комплексную синусоиду (импульс Диракля в частотной области):
(6)
То есть разрешающая способность КПФ пропорциональна эффективной полосе аналитического окна h. Отсюда следует, что разрешающая способность по частоте и во времени для кратковременного преобразования Фурье всегда является компромиссом: с одной стороны, большая разрешающая способность во времени требует короткого окна h(t); с другой стороны, большая разрешающая способность по частоте требует узкополосного фильтра, то есть длинного окна h(t). К сожалению оба этих условия не могут быть гарантированы одновременно.
Чтобы уменьшить избыточность непрерывного кратковременного преобразования Фурье, можно дискретизировать его по времени и по частоте. Поскольку атомы, которые используются, можно определить из окна h(t) его перенесением во времени и по частоте (модуляция), то естественной будет дискретизация КПФ как квадратной решетки:
. (7)
Проблема заключается в выборе интервалов дискретизации t0 и f0, чтобы минимизировать избыточность без потери информации. Для последнего необходимо, чтобы выполнялось условие . Тогда атомы hnt0,mf0 образуют семейства дискретных неортогональных элементов, которые называют кадрами. Если же , тогда частотно-временная проекция будет недостаточно «покрыта» атомами hnt0,mf0, то есть будут иметь место пробелы между соседними атомами.
Если , то семейства атомов hnt0,mf0, могут образовывать ортогональный базис при соответствующем выборе аналитического окна h(t). Но можно показать, что невозможно получить такой базис из окна h, которое хорошо локализовано во времени и по частоте. Следовательно, для хорошо локализованного окна (например гауссовского) формула для воссоздания сигнала будет численно неустойчивой.
Для дискретного случая формула для воссоздания сигнала из кратковременного преобразования Фурье имеет следующий вид:
(8)
где .
Это отношение действительно, когда периоды дискретизации t0 и f0,, аналитическое окно h, и синтезирующее окно g, связаны соотношением:
(9)
определяется как и , если .
Для дискретизированого сигнала x[n], период дискретизации какого Т, t0 должен быть избран таким образом, чтобы t0=kТ, . Исходя из этого имеем следующие формулы для анализа и синтеза:
(10)
(11)
Вейвлет преобразование.
Идея непрерывного вейвлет преобразования заключается в нахождении проекций сигнала x на семейство функций с нулевым средним значением (вейвлетов), которые выводятся из материнского вейвлета путем его переноса во времени и расширения:
(12)
где .
Переменная а соответствует так называемому масштабирующему фактору в том смысле, что |а|>1 расширяет вейвлет, а |а|<1 сужает его. Следовательно, исходя из определения, вейвлет преобразование, является больше масштабно-временным, чем частотно-временным преобразованием. Однако, для вейвлетов, которые хорошо локализованы около некоторой ненулевой частоты f0 при масштабирующем факторе |а|=1 возможна частотно-временная интерпретация благодаря формальному определению f =f0/а.
Принципиальная разница между кратковременным преобразованием Фурье и непрерывным вейвлет преобразованием заключается в том, что когда изменяется масштабирующий фактор а, то изменяется и эффективная длительность вейвлета, и его эффективная полоса, но его форма остается неизменной.
В отличие от кратковременного преобразования Фурье, которое использует одно единственное аналитическое окно, НВП использует более длинные окна на низких частотах и менее длинные окна на высоких частотах. Это частично оещает проблему разрешающей способности, которая существует при КПФ.
Эффективная полоса В пропорциональная f или В/f=q=const. Таким образом, НВП можно рассматривать как анализ с использованием банка полосовых фильтров, каждый из которых имеет постоянную относительную полосу пропускания.
Сигнал х можно восстановить из его НВП в соответствии с формулой:
(13)
где F - так называемый синтезирующий вейвлет. При этом необходимо, чтобы выполнялось следующее условие:
(14)
Разрешающая способность НВП зависит от частоты. Чем выше частота, тем хуже разрешающая способность по частоте и тем лучше разрешающая способность по времени и наоборот.
Если рассматривать дискретный случай НВП, то наиболее естественным будет дискретизировать частотно-временное представление неравномерно:
,; (15)
Дискретное вейвлет преобразование определяется как:
. (16)
где .
Спектрограмма.
Рассмотренные частотно-временные распределения разбивают сигнал на элементарные компоненты (атомы), которые хорошо локализованы во времени и по частоте. Эти распределения получают путем линейного преобразования сигнала.
Но существует ряд методов, которые позволяют найти частотно-временные распределения энергии сигнала или энергетические ЧВР. Такие распределения получают путем квадратичного преобоазования сигнала. Одним из таких распределений является спектрограмма.
Если рассмотреть квадрат модуля КПФ, то мы получим спектральную плотность энергии выделенного с помощью окна h сигнала:
(17)
Выражение (17) определяет понятие спектрограммы. Спектрограмма представляет собой ЧВР, котрое имеет действительные и неотрицательные значения. Исходя из предположения, что окно h имеет конечную энергию, спектрограмма удовлетворяет условию глобального распределения энергии:
(18)
Таким образом, спектрограмму можно интерпретировать как меру энергии сигнала, которая приходится в частотно-временной области на некоторую окрестность с центром в точке и форма которой не зависит от локализации.
Поскольку спектрограмма фактически представляет из себя квадратичное значение кратковременного преобразования Фурье, то вполне очевидно, что ее частотно-временная разрешающая способность будет такой же, как и для КПФ. То есть опять будет иметь место компромисс между разрешающей способностью по частоте и разрешающей способностью по времени, что является главным недостатком этого распределения.
Кроме того, поскольку это квадратичное (или билинейное) распределение, то спектрограмма суммы двух сигналов уже не будет являться суммой двух спектрограмм:
(19)
где фактически является результатом интерференции между и . Но эта интерференция будет достаточно значительной лишь в тех местах ЧВР, где и перекрываются.
Скалограмма.
Как и в случае со спектрограммой по отношению к кратковременному преобразованию Фурье, можно найти частотно-временное распределение по отношению к непрерывному вейвлет преобразованию:
(20)
Поскольку НВП представляет собой разложение сигнала по ортогональному базису, то можно показать, что имеет место сохранение энергии сигнала в этом распределении:
(21)
Также как и для вейвлет преобразования, разрешающая способность скалограммы зависит от частоты. Чем больше частота, тем лучше разрешающая способность по времени и хуже разрешающая способность по частоте. И наоборот, чем меньше частота, тем лучше разрешающая способность по частоте и хуже разрешающая способность по времени. И так же, как и для скалограммы, будет иметь место интерференция между разными компонентами сигнала в тех местах частотно-временного области, где автоскалограмсы перекрываются. То есть, если две компоненты достаточно отдалены друг от друга в частотно-временной области, то их кросскалограмма будет близкой к нулю.
Проведенные исследования.
Изначально была поставлена цель прикладного использования частотно-временного анализа. В частности, планировалось создание голосового кодека с использованием в цепочке анализа частотно-временных распределений. Структурная схема кодека показана на рисунке 1.
Рисунок 1. Структура речевого кодека.
Основной проблемой является выбор конкретного частотно-временного распределения в цепочке анализа. Проблемы с разрешающей способностью кратковременного преобразования Фурье и вейвлет преобразования заставили обратить внимание на распределения класса Коэна. На рисунке 2 представлены 4 разных распределения для одного и того же сигнала. Этот сигнал представляет собой следующее: сначала включается синусоида низкой частоты на четверть общей длительности сигнала, затем две четверти сигнал равен нулю, после этого на последнюю четверть включается синусоида более высокой частоты, чем первая.
Рисунок 2. Четыре разных распределения класса Коэна для одного и того же сигнала. Рисунок анимирован с помощью Gif Animator, 5 кадров, 3 цикла.
Как видно из этого рисунка, все распределения, кроме распределения Чои-Вильямса, имеют интерференционные компоненты очень значительной интенсивности. В связи с этим было принято решение использовать распределение Чои-Вильямса.
Было проведено моделирование с использованием языка Matlab. В качестве тестового сигнала использовался речевой сигнал. На рисунке 3 представлен исходный сигнал и сигнал после синтеза.
Рисунок 3. Исходный и синтезированный речевой сигнал.
Исходный сигнал представляет собой слово «Габор», в котором есть два четко выраженных слога. После синтеза также наблюдаются два всплеска, которые соответствуют этим слогам. Однако, видно, что временная диаграмма синтезированного сигнала достаточно сильно отличается от временной диаграммы исходного сигнала. Но судить только по временной диаграмме о качестве воспроизведения речи тяжело, поэтому был проведен психоакустический анализ, который подтвердил, что это качество довольно низко.
Дальнейшие исследования.
После получения отрицательных результатов в реализации голосового кодека, использующего частотно-временной анализ, было принято решение значительно изменить направление поиска. В частности, наиболее перспективным видится применение ЧВР к узкополосным сигналам, когда соотношение сигнала к шуму очень мало. Это имеет место быть, например, в спутниковой связи. Радиосигнал, идущий со спутника испытывает сильное затухание на пути к земле и, часто, соотношение сигнала к шуму при приеме не в пользу сигнала. В спутниковой связи применяется, как правило, угловые виды модуляции, для которых имеет место быть так называемый пороговый эффект. То есть при снижении соотношения сигнал-шум до определенного уровня (порога) наблюдается очень резкое снижение качества приема (высокий уровень битовых ошибок). В таких случаях может быть полезен частотно-временной анализ с использованием распределений класса Коэна. В данный момент я веду разработку модели демодулятора, основанного на частотно-временном анализе. После того как модель будет готова, планирую провести сравнительные исследования качества демодуляции сильно зашумленных сигналов традиционными демодуляторами и демодулятором, использующим частотно-временной анализ. Исследования планируется завершить к концу 2008 года.
|