Доклад на международной студенческой научно-технической конференции "Информатика и компьютерные технологии 2006"

Учебная система исследования алгоритмов кодирования звуковой информации

 В докладе рассматривается проблема обеспечения учебного процесса средствами преобразования звуковой информации. Основной целью является разработка учебного программного обеспечения.

     Анализ большинства современных программ, связанных с обработкой звуковых сигналов, показал, что условно их можно разделить на два класса. Первые ориентированы на демонстрацию строго заданного набора разложений звукового сигнала без возможности изменения каких-либо параметров. Вторые, профессиональные, являются слишком сложными для использования в учебном процессе. Наличие программ второго типа (как условно бесплатных, так и коммерческих) говорит о том, насколько широко возможно использование различных методов обработки звука.

     Например, Adobe Audition предоставляет возможность исследования амплитудной характеристики и частотного спектра сигнала, что дает возможность редактирования звука, но не позволяет изучить суть алгоритмов кодирования звуковой информации.

     В качестве наглядной системы обучения можно было бы использовать среду Mathlab, но студент, который впервые пользуется данным программным обеспечением, наверняка потратит много времени для того, чтобы разобраться в нем.

     Таким образом, в рамках дисциплины «Теория и алгоритмы обработки звуковых сигналов» имеется необходимость разработки специализированного обучающего программного обеспечения, которое позволяло бы обеспечить режимы, ориентированные на изучение алгоритмов обработки звуковой информации и контроль полученных знаний.

     В качестве алгоритмической основы учебной программы предлагается использовать методы вейвлет-преобразования, которые являются базовыми для современных кодировщиков звуковых данных, а также применяются в других областях обработки цифровых сигналов.

     Преимущество вейвлет-преобразований перед разложениями Фурье состоит в том, что оно дает возможность судить не только о частотном спектре полученного сигнала, но и о том, в какой именно момент времени в сигнале присутствует гармоника той или иной частоты. Также результаты такого разложения, как правило, имеют значения равные или близкие к нулю, что увеличивает степень их сжатия.

     Программа должна работать в следующих режимах:

     1) Режим считывания данных звукового сигнала (набора отсчетов) из текстового или бинарного файла и представления исходных данных в числовом и графическом виде.

     2) Режим задания вейвлет-функции через определения количества коэффициентов и значения этих коэффициентов.

     3) Режим задания параметров преобразования. Таких как максимальный и минимальный масштаб, число шагов разложения.

     4) Непосредственно режим вейвлет-преобразования сигнала.

     5) Режим вывода результатов на экран и в файл в числовом и графическом виде.

     6) Режим обратного вейвлет-преобразования с выводом результата в числовом и графическом виде.

     Также, согласно [1], если для выбора коэффициентов вейвлет-преобразования предварительно использовать частотный спектр, полученный путем преобразования Фурье, то среднеквадратичную ошибку восстановленного сигнала можно уменьшить на 5-15%. Поэтому, имеет смысл добавить дополнительно еще набор режимов работы, которые дадут возможность разложения сигнала в частотный спектр.

     Из методов вейвлет-преобразований, указанных в [2], выбран метод преобразования на основе матричного умножения. Согласно этому методу для получения аппроксимирующие и детализирующие коэффициенты получаются как произведение матрицы характеристик вейвлета, который был задан пользователем.

Источники: www.autex.spb.ru/cgi-bin/download.cgi?dspa2000_1_28 | www.autex.spb.ru/cgi-bin/download.cgi?wvlt_artc40