В докладе рассматривается проблема обеспечения учебного процесса средствами преобразования звуковой информации. Основной целью является разработка учебного программного обеспечения.
Анализ большинства современных программ, связанных с обработкой звуковых сигналов, показал, что условно их можно разделить на два класса. Первые ориентированы на демонстрацию строго заданного набора разложений звукового сигнала без возможности изменения каких-либо параметров. Вторые, профессиональные, являются слишком сложными для использования в учебном процессе. Наличие программ второго типа (как условно бесплатных, так и коммерческих) говорит о том, насколько широко возможно использование различных методов обработки звука.
Например, Adobe Audition предоставляет возможность исследования амплитудной характеристики и частотного спектра сигнала, что дает возможность редактирования звука, но не позволяет изучить суть алгоритмов кодирования звуковой информации.
В качестве наглядной системы обучения можно было бы использовать среду Mathlab, но студент, который впервые пользуется данным программным обеспечением, наверняка потратит много времени для того, чтобы разобраться в нем.
Таким образом, в рамках дисциплины «Теория и алгоритмы обработки звуковых сигналов» имеется необходимость разработки специализированного обучающего программного обеспечения, которое позволяло бы обеспечить режимы, ориентированные на изучение алгоритмов обработки звуковой информации и контроль полученных знаний.
В качестве алгоритмической основы учебной программы предлагается использовать методы вейвлет-преобразования, которые являются базовыми для современных кодировщиков звуковых данных, а также применяются в других областях обработки цифровых сигналов.
Преимущество вейвлет-преобразований перед разложениями Фурье состоит в том, что оно дает возможность судить не только о частотном спектре полученного сигнала, но и о том, в какой именно момент времени в сигнале присутствует гармоника той или иной частоты. Также результаты такого разложения, как правило, имеют значения равные или близкие к нулю, что увеличивает степень их сжатия.
Программа должна работать в следующих режимах:
1) Режим считывания данных звукового сигнала (набора отсчетов) из текстового или бинарного файла и представления исходных данных в числовом и графическом виде.
2) Режим задания вейвлет-функции через определения количества коэффициентов и значения этих коэффициентов.
3) Режим задания параметров преобразования. Таких как максимальный и минимальный масштаб, число шагов разложения.
4) Непосредственно режим вейвлет-преобразования сигнала.
5) Режим вывода результатов на экран и в файл в числовом и графическом виде.
6) Режим обратного вейвлет-преобразования с выводом результата в числовом и графическом виде.
Также, согласно [1], если для выбора коэффициентов вейвлет-преобразования предварительно использовать частотный спектр, полученный путем преобразования Фурье, то среднеквадратичную ошибку восстановленного сигнала можно уменьшить на 5-15%. Поэтому, имеет смысл добавить дополнительно еще набор режимов работы, которые дадут возможность разложения сигнала в частотный спектр.
Из методов вейвлет-преобразований, указанных в [2], выбран метод преобразования на основе матричного умножения. Согласно этому методу для получения аппроксимирующие и детализирующие коэффициенты получаются как произведение матрицы характеристик вейвлета, который был задан пользователем.
Источники: www.autex.spb.ru/cgi-bin/download.cgi?dspa2000_1_28 | www.autex.spb.ru/cgi-bin/download.cgi?wvlt_artc40