Русский    Українська    English  
Магистр ДонНТУ Нестеренко Дмитрий Сергеевич

Нестеренко Дмитрий Сергеевич

Факультет: Вычислительной техники и информатики
Специальность: Программное обеспечение автоматизированных систем
Тема выпускной работы:

Автоматическое распознавание изолированных слов русского языка на основе вейвлет-анализа

Научный руководитель: доцент, к.т.н. Федяев О.И.


Реферат по теме выпускной работы

Введение

В современных компьютерных системах все больше внимания уделяется построению интерфейса естественного ввода-вывода информации. Одним из перспективных направлений на сегодняшний день является использование систем речевого диалога, которая предполагает автоматический синтез и распознавание речи.

При разработке системы автоматического распознавания речи, представляющей собой наиболее сложную подсистему речевого диалога, используют различные методы. В последнее время большие перспективы в решении проблемы распознавания речи связывают с применением вейвлет-анализа речевого сигнала. Методы, использующие вейвлет преобразование, преодолевают многие ограничения и трудности, возникающие при распознавании речи, к тому же обладают существенными преимуществами, так как позволяют судить не только о частотном спектре сигнала, но также о том, в какой момент времени появилась та или иная гармоника.

В современной науке, вейвлеты являются эффективным математическим инструментом во многих исследованиях. Основная причина их использования – возможность получения в результатах анализа некоторого сигнала не только перечень его характерных частот, но и сведения о локальных координатах, при которых эти частоты проявляют себя.

Актуальность темы

В настоящее время вейвлеты начинают широко применяться при решении различных прикладных задач: распознавание образов, при обработке и синтезе различных сигналов (например, речевых), при анализе изображений и во многих других случаях. За относительно недолгое время существования теории вейвлетов сформировался на её основе развитый математический аппарат. Однако учёные и исследователи ещё не успели в достаточном объёме отразить все преимущества вейвлет преобразований на практике. Все эти факты, установленные в результате анализа научных и прикладных работ в этой области, обуславливают актуальность настоящей работы.

Связь работы с научными программами, планами, темами

Исследования по данной тематике проводятся на кафедре прикладной математики и информатики ДонНТУ в рамках выполнения государственной темы № Н-39-2005 «Алгоритмическое и программное обеспечение высокопроизводительных и интеллектуальных вычислительных сетей» и Договора о сотрудничестве между кафедрой ПМИ и ООО «Центр интеллектуальных технологий» (г. Пермь, Россия).

Цель работ

Целью работы является теоретическое обоснование применения вейвлет анализа к разработке системы, позволяющей эффективно решать задачу автоматического распознавания изолированных слов русского языка.

Основные задачи разработки и исследований

В целом исследования посвящены анализу существующих методов вейвлет-преобразования и последующему применению лучшего из них для разработки системы распознавания слов. При этом планируется решение следующих задач:

  1. Анализ существующих работ, исследований и разработок по теме;
  2. Алгоритмизация процессов вейвлет-преобразований;
  3. Разработка алгоритмов и программных моделей на основе методов вейвлет-анализа для исследования процессов обработки речевых сигналов;
  4. Разработка методики и системы автоматического распознавания изолированных слов русской речи на основе вейвлет-анализа.

Предмет разработки и исследований

Предметом исследований является математический аппарат вейвлет-анализа голосовых сигналов, позволяющий наиболее эффективно представить речевой сигнал с помощью вейвлетов, а также методы теории распознавания речевых образов.

Объект разработки и исследований

Объектом исследования являются программно-аппаратные средства автоматического распознавания речевого сигнала.

Методика и методы исследований

Для решения поставленных задач использованы методы теории вейвлет-преобразований, теории цифровой обработки сигналов, теории искусственных нейронных сетей, теории нечётких систем и теории распознавания речевых образов.

Научная новизна

Предложен новый подход к цифровому представлению речевого сигнала с помощью вейвлетов, позволяющий улучшить нейро-нечёткое распознавание изолированных слов русской речи.

Практическое значение полученных результатов

Полученные результаты позволят оценить эффективность предложенного способа решения научной задачи автоматического распознавания речевых слов и применить разработанные алгоритмы для построения систем речевого взаимодействия человека с ЭВМ. Разработанные структуры нейросетевых и нечётких систем, а также программное обеспечение будут использоваться на кафедре ПМИ ДонНТУ в учебном процессе и при проведении научных исследований по этой проблеме.

Апробация работы

В результате проведенных исследований, автор участвовал в международной научно-технической конференции "Информатика и компьютерные технологии", прошедшей 12-15 мая 2009 г. в Донецком Национальном Техническом Университете. Представлен доклад на тему: «Анализ математического описания представления сигналов вейвлетами».

Обзор исследований и разработок по теме

Локальный

На уровне университета, применяемые методы присутствуют в работах:

Национальный

В последнее время во всем мире активизировался интерес к теории вейвлетов. Украина не стала исключением. Однако книг и статей по вейвлетам практически нет, чего нельзя сказать о России.

Глобальный

Еще в начале 90-х годов прошлого века были предложены вейвлеты и основанные на них вейвлет-преобразования. В дальнейшем, теория вейвлетов очень интенсивно развивались. Наибольший вклад в разработку теоретических основ вейвлетов внесли Мейер (Meyer), Добеши (Daubechies), Маал (Mallat) и другие ученые, опубликовавшие первые теоретические работы в этом направлении и сумевшие донести их до широкой научной общественности. К настоящему времени за рубежом в области вейвлет-преобразований опубликованы сотни книг, а число статей исчисляется многими тысячами [1].

Среди всего многообразия статей по данной тематике, можно выделить некоторые из них:

Основное содержание работы

В настоящее время семейство функций-анализаторов, названных вейвлетами, начинает широко применяться в задачах распознавания образов, при обработке и синтезе различных сигналов, например, речевых, при анализе изображений, для упаковки (свертки) больших объемов информации и во многих других случаях. Однако они еще недостаточно широко известны исследователям, занимающихся анализом данных [2]. Именно поэтому была написана настоящая работа, позволяющая понять и разобраться в сущности вейвлет-преобразования, при помощи основных математических формул и наглядных образов.

Термин «вейвлет» был впервые введен специалистом по сейсмографии Морле (J.Morlet) в 80-х годах в связи с анализом свойств сейсмических и акустических сигналов. В переводе с английского буквально означает «короткая (или маленькая) волна» [1].

Вейвлеты представляют собой функции, обладающие некоторыми важными свойствами, среди которых следует выделить возможность переноса по времени и масштабируемость.

Изначально вейвлеты были предложены мировому сообществу математиками и поэтому основополагающие работы по вейвлетам написаны на довольно сложном математическом языке, зачастую даже для многих математиков.

Рассмотрим вейвлет типа «мексиканская шляпа» (MHAT), являющийся второй производной функции Гаусса. Его временной образ задается выражением:

где

График MHAT вейвлета c различными значениями масштаба и переноса по времени изображен на рис. 1.


Графическое представление вейвлета MHAT с различными параметрами (Анимация)
Рисунок 1 - Графическое представление вейвлета MHAT с различными параметрами (Анимация состоит из 8 кадров, 6 повторений, объем 48 КB)

Хорошо видно, что данный вейвлет напоминает затухающее синусоидальное колебание. Причем суммарная площадь (над осью времени и под ней) равна нулю. Именно эта особенность позволяет отнести временную зависимость MHAT к вейвлетам.

Задача вейвлет-анализа сводится к представлению исходного сигнала в виде набора вейвлетов.

Можно представить вейвлеты как некоторые волновые функции, способные осуществлять преобразование Фурье не по всей временной оси, а локально по месту своего расположения. Число вейвлетов, используемых при разложении сигнала, задает уровень декомпозиции сигнала. При этом за нулевой уровень декомпозиции сигнала принимается сам исходный сигнал.

Очевидно, что для представления сигналов в виде набора вейвлетов, необходимо иметь возможность сжимать или растягивать вейвлеты и перемещать их по временной оси.

Процесс разложения произвольного входного сигнала в виде совокупности вейвлетов получил название «прямое вейвлет-преобразование» (ПВП). Используемые при этом вейвлеты должны обладать следующими важными свойствами [1]:

ПВП можно рассматривать как разложение сигнала с помощью вейвлетов со всеми возможными сдвигами и растяжениями/сжатиями. При этом выполняется задача вычисления вейвлет-коэффициентов.

Вейвлет задается выражением:

где

Формально вычисление вейвлет-коэффициентов реализуется следующим способом:

где

Для примера, рассмотрено прямое вейвлет-преобразование функции


Графическое представление исходного сигнала изображено на рис. 2.


Исходный сигнал
Рисунок 2 - Графическое представление исходного сигнала

Для выполнения вычислений использовалась система компьютерной математики Mathcad. Разработанная программа получения вейвлет-коэффициентов представлена на рис. 3.


Программа прямого вейвлет-преобразования сигнала в системе Mathcad
Рисунок 3 - Прямое вейвлет-преобразование сигнала в системе Mathcad

В результате выполнения программы, были получены вейвлет коэффициенты для указанного диапазона масштабов и сдвигов.

Полученные коэффициенты, представлены в виде поверхности. Она изображена на рис. 4.


Представление вейвлет-коэффициентов в виде поверхности
Рисунок 4 - Представление вейвлет-коэффициентов в виде поверхности

Однако для удобства и повышения информативности, вейвлет коэффициенты представляют с помощью вейвлет-спектрограмм. Они позволяют легко выявить мельчайшие локальные особенности функций, сигналов, изображений с привязкой их ко времени или координатам пространства. Полученные вейвлет-коэффициенты, представленные в виде вейвлет-спектрограммы изображены на рис. 5.


Представление вейвлет-коэффициентов в виде вейвлет-спектрограммы
Рисунок 5 - Вейвлет-спектрограмма

На полученной вейвлет-спектрограмме наглядно видны все характеристики сигнала при определенном масштабе и сдвиге вейвлета. Таким образом, ее можно использовать в дальнейшем как графический образ для распознавания, решая задачу определения принадлежности к определенному классу образов. С помощью вейвлетов возможно также предварительное разделение речевого сигнала на фонемы с последующим построением их спектрограмм и распознаванием полученного набора графических образов.

Выводы

Теория вейвлетов является той базой, основой, эффективным инструментом, который позволяет решить множество практических задач. Основной областью применения вейвлетных преобразований является анализ и обработка сигналов и функций, когда результаты анализа должны содержать не только общую частотную характеристику сигнала, но и сведения об определенных локальных характеристиках и особенностях сигнала.

Несмотря на то, что математический аппарат вейвлет-анализа хорошо разработан и теория, в общем, оформилась, вейвлеты оставляют обширное поле для исследований. Достаточно сказать, что выбор вейвлета, наиболее подходящего для анализа конкретных данных, представляет собой скорее искусство, чем рутинную процедуру [3]. Кроме того, огромное значение имеет задача разработки приложений, использующих вейвлет-анализ, которые могут быть применены во многих областях.

Список используемой литературы

  1. Дьяконов В.П. От теории к практике. Изд 2-е, перераб и доп.- М.: СОЛОН-Пресс, 2004. – 400 с.
  2. Астафьева Н.М. Вейвлет-анализ: Основы теории и примеры применения. – Успехи физических наук, т.166, № 11, 1996 г, стр. 1145-1170.
  3. Основы теории вейвлет-преобразования. // Библиотека BaseGroup.ru – Сайт http://www.basegroup.ru/library/cleaning/intro-to-wavelets/
  4. Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование. - Успехи физических наук, т. 171, 2001 г, №5 с. 465-500.
  5. Дремин И.М.,Иванов О.В., Нечитайло В.А. Практическое применение вейвлет-анализа // Наука производству, 2000. – № 6. – С. 13–15.
  6. Леонович А.А. Вейвлет-обработка речевых сигналов в распознавании речи. - Конференции ИВТ СО РАН, Красноярский Государственный Технический Университет, 2004 г.
  7. Новиков Л.В. Основы вейвлет-анализа сигналов. Учебное пособие. 1999. - 152 с.: ил.
  8. Смолнецев Н.К. Основы теории вейвлетов. Вейвлеты в MATLAB. – М.: ДМК Пресс, 2005. – 304с., ил.
  9. Добеши И. Десять лекций по вейвлетам. М.: РХД – 2001г.
  10. Левкович-Маслюк Л. Дайджест вэйвлет-анализа, в двух формулах и 22 рисунках, журнал «КОМПЬЮТЕРРА» №8, от 02/03/98. - Сайт http://offline.computerra.ru/1998/236/1123
  11. Шаховая И.А. «Нейросетевая модель мониторинга технологического процесса выплавки стали» / Портал магистров ДонНТУ, - http://masters.donntu.ru/2008/fvti/shakhovaya/
  12. Рябиченко А.В. «Специализированная компьютерная система анализа вызванных потенциалов головного мозга человека на основе Вейвлет преобразований» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2007/kita/ryabichenko/
  13. Киселёв А.Ю. «Использование метода вейвлет анализа для контроля технического состояния поршневых компрессоров» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2006/kita/kiselyov/
  14. Скляренко М.И. «Анализ нестационарных сигналов при помощи вейвлет преобразования» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2006/kita/sklyarenko/
  15. Стояновский С.Ю. «Разработка и исследование алгоритма сжатия голосовых данных с использованием вейвлет-преобразований» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2005/kita/stoyanovsky/

Замечание

При написании данного автореферата магистерская работа еще не завершена. Планируемое завершение: декабрь 2009 г. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.