Русский    Українська    English  
Магистр ДонНТУ Нестеренко Дмитрий Сергеевич

Нестеренко Дмитро Сергійович

Факультет: Обчислювальної техніки та інформатики
Спеціальність: Програмне забезпечення автоматизованих систем
Тема випускної роботи:

Автоматичне розпізнавання ізольованих слів російської мови на основі вейвлет-аналізу

Керівник: доцент, к.т.н. Федяєв О.І.


Реферат з теми випускної роботи

Вступ

У сучасних комп'ютерних системах усе більше уваги приділяється побудові інтерфейсу природного введення-виводу інформації. Одним з перспективних напрямків на сьогоднішній день є використання систем мовного діалогу, що припускає автоматичний синтез і розпізнавання мови.

При розробці системи автоматичного розпізнавання мови, що є найбільш складною підсистемою мовного діалогу, використають різні методи. Останнім часом великі перспективи у вирішенні проблеми розпізнавання мови пов’язують із застосуванням вейвлет-аналізу мовного сигналу. Методи, що використовують вейвлет перетворення, долають багато обмежень і труднощі, що виникають при розпізнаванні мови, до того ж мають істотні переваги, оскільки дозволяють робити висновки не тільки про частотний спектр сигналу, але також про те, у який момент часу з'явилася та або інша гармоніка.

У сучасній науці, вейвлети є ефективним математичним інструментом в багатьох дослідженнях. Основна причина їх використання – можливість отримання в результатах аналізу деякого сигналу не лише перелік його характерних частот, але і відомості про локальні координати, при яких ці частоти проявляють себе.

Актуальність теми

У цей час вейвлети починають широко застосовуватися при рішенні різних прикладних завдань: розпізнавання образів, при обробці і синтезі різних сигналів (наприклад, мовних), при аналізі зображень і в багатьох інших випадках. За відносно недовгий час існування теорії вейвлетів сформувався на її основі розвинений математичний апарат. Проте вчені і дослідники ще не встигли в достатньому обсязі продемонструвати всі переваги вейвлет перетворень на практиці. Всі ці факти, встановлені в результаті аналізу наукових і прикладних робіт в цій області, підкреслюють актуальність роботи.

Зв'язок роботи з науковими програмами, планами, темами

Дослідження з даної тематики проводяться на кафедрі прикладної математики й інформатики ДонНТУ в рамках виконання державної теми № Н-39-2005 "Алгоритмічне й програмне забезпечення високопродуктивних й інтелектуальних обчислювальних мереж" і Договору про співробітництво між кафедрою ПМІ й ТОВ "Центр інтелектуальних технологій" (м. Перм, Росія).

Мета робіт

Метою роботи є теоретичне обґрунтування застосування вейвлет аналізу до розробки системи, що дозволяє ефективно вирішувати задачу автоматичного розпізнавання ізольованих слів російської мови.

Основні завдання розробки й досліджень

В цілому дослідження присвячені аналізу існуючих методів вейвлет-перетворення і подальшому вживанню кращого з них для розробки системи розпізнавання слів. При цьому планується вирішення наступних завдань:

  1. Аналіз існуючих робіт, досліджень і розробок по темі;
  2. Алгоритмізація процесів вейвлет- перетвореннь;
  3. Розробка алгоритмів і програмних моделей на основіметодів вейвлет-аналізу для дослідження процесів обробки мовних сигналів;
  4. Розробка методики і системи автоматичного розпізнавання ізольованих слів російської мови на вейвлет-аналізу.

Предмет розробки й досліджень

Предметом досліджень є математичний апарат вейвлет-аналізу голосових сигналів, що дозволяє найбільше ефективно представити мовний сигнал за допомогою вейвлетів, а також методи теорії розпізнавання мовних образів.

Об'єкт розробки й досліджень

Об'єктом дослідження є програмно-апаратні засоби автоматичного розпізнавання мовного сигналу.

Методика й методи досліджень

Для вирішення поставлених завдань використані методи теорії вейвлет-перетворень, теорії цифрової обробки сигналів, теорії штучних нейронних мереж, теорії нечітких систем і теорії розпізнавання мовних образів.

Наукова новизна

Запропонований новий підхід до цифрового подання мовного сигналу за допомогою вейвлетів, що дозволяє поліпшити нейро-нечітке розпізнавання ізольованих слів російської мови.

Практичне значення отриманих результатів

Отримані результати дозволять оцінити ефективність запропонованого способу вирішення наукового завдання автоматичного розпізнавання слів мови і застосувати розроблені алгоритми для побудови систем мовної взаємодії людини з ЕОМ. Розроблені структури нейромережевих і нечітких систем, а також програмне забезпечення будуть використовуватися на кафедрі ПМІ ДонНТУ в навчальному процесі і при проведенні наукових досліджень з цієї проблеми.

Апробація роботи

У результаті проведених досліджень, автор брав участь у міжнародній науково-технічній конференції "Інформатика й комп'ютерні технології", що пройшла 12-15 травня 2009 р. у Донецьком Національному Технічному Університеті. Представлено доповідь на тему: "Аналіз математичного опису відображення сигналів вейвлетами".

Огляд досліджень і розробок по темі

Локальний

На рівні університету, застосовані методи присутні в роботах:

Національний

Останнім часом у всьому світі активізувався інтерес до теорії вейвлетів. Україна не стала виключенням. Проте книжок і статей з вейвлетів практично немає, чого не можна сказати про Росію.

Глобальний

Ще на початку 90-х років минулого століття були запропоновані вейвлети і засновані на них вейвлет-перетворення. Надалі, теорія вейвлетів дуже інтенсивно розвивалася. Найбільший внесок у розробку теоретичних основ вейвлетів внесли Мейер (Meyer), Добеши (Daubechіes), Маал (Mallat) і інші вчені, що опублікували перші теоретичні роботи в цьому напрямку і зуміли донести їх до широкої наукової громадськості. До теперішнього часу за кордоном в області вейвлет-перетворень опубліковані сотні книг, а число статей обчислюється багатьма тисячами [1].

Серед усього різноманіття статей по даній тематиці, можна виділити деякі з них:

Основний зміст роботи

В даний час сімейство функцій-аналізаторів, названих вейвлетамі, починає широко застосовуватися в завданнях розпізнавання образів, при обробці і синтезі різних сигналів, наприклад, мовних, при аналізі зображень, для упаковки (згортки) великих об'ємів інформації і в багатьох інших випадках. Проте вони ще недостатньо широко відомі дослідникам, що займаються аналізом даних [2]. Саме тому була написана ця робота, що дозволяє зрозуміти і розібратися у суті вейвлет-перетворення, за допомогою основних математичних формул і наочних образів.

Термін «вейвлет» був вперше введений фахівцем з сейсмографії Морле (J.Morlet) в 80-х роках у зв'язку з аналізом властивостей сейсмічних і акустичних сигналів. У перекладі з англійської буквально означає «коротка (або маленька) хвиля» [1].

Вейвлети є функціями, що моють деякі важливі властивості, серед яких слід виділити можливість переносу за часом і масштабованість.

Спочатку вейвлети були запропоновані світовій спільноті математиками і тому основоположні роботи з вейвлетів написані на досить складній математичній мові, дуже часто навіть для багатьох математиків.

Розглянемо вейвлет типу "мексиканський капелюх" (MHAT), що є другою похідною функції Гаусса. Його образ задається формулою:

де

Графік MHAT вейвлета c різними значеннями масштабу й переносу за часом зображений на рис. 1.


Графічний образ вейвлета MHAT з різними параметрами (Анімація)
Рисунок 1 - Графічний образ вейвлета MHAT з різними параметрами (Анімація складається з 8 кадрів, 6 повторень, обсяг 48 КB)

Добре видно, що даний вейвлет нагадує загасаюче синусоїдальне коливання. Причому сумарна площа (над віссю часу і під нею) дорівнює нулю. Саме ця особливість дозволяє віднести часову залежність MHAT до вейвлетів.

Завдання вейвлет-анализу зводиться до відтворення вхідного сигналу у вигляді набору вейвлетів.

Можна представити вейвлети як деякі хвилеві функції, здатні здійснювати перетворення Фур'є не по всій часовій осі, а локально по місцю свого розташування. Число вейвлетів, використаних при розкладанні сигналу, задає рівень декомпозиції сигналу. При цьому за нульовий рівень декомпозиції сигналу береться сам вхідний сигнал.

Очевидно, що для відтоврення сигналів у вигляді набору вейвлетів, необхідно мати можливість стискати або розтягувати вейвлети і переміщати їх по часовій осі.

Процес розкладання довільного вхідного сигналу у вигляді сукупності вейвлетов отримав назву «Пряме вейвлет-перетворення» (ПВП). Використовувані при цьому вейвлети повинні володіти наступними важливими властивостями [1]:

ПВП можна розглядати як розкладання сигналу за допомогою вейвлетів з усіма можливими зсувами й розтягненнями/стисками. При цьому вирішується проблема обчислення вейвлет-коэффициентів.

Вейвлет задається формулою:

де

Формальне обчислення вейвлет-коефіцієнтів реалізується в такий спосіб:

де

Для приклада, розглянуте пряме вейвлет-перетворення функції


Графічний образ вхідного сигналу зображен на рис. 2.


Вхідний сигнал
Рисунок 2 - Графічний образ вхідного сигналу

Для виконання обчислень використовувалася система комп'ютерної математики Mathcad. Розроблена програма знаходження вейвлет-коєфіцієнтів представлена на рис. 3.


Програма прямого вейвлет-перетворення сигналу в системі Mathcad
Рисунок 3 - Пряме вейвлет-перетворення сигналу в системі Mathcad

У результаті виконання програми, були отримані вейвлет коефіцієнти для зазначеного діапазону масштабів і зсувів.

Отримані коефіцієнти, представлені у вигляді поверхні. Вона зображена на рис. 4.


Зображення вейвлет-коефіцієнтів у вигляді поверхні
Рисунок 4 - Зображення вейвлет-коефіцієнтів у вигляді поверхні

Однак для зручності й підвищення інформативності, вейвлет коефіцієнти зображують за допомогою вейвлет-спектрограм. Вони дозволяють легко виявити дрібні локальні особливості функцій, сигналів, зображень із прив'язкою їх до часу або координат простору. Отримані вейвлет-коефіцієнти, забражені у вигляді вейвлет-спектрограми зображені на мал. 5.


Зображення вейвлет-коефіцієнтів у вигляді вейвлет-спектрограми
Рисунок 5 - Вейвлет-спектрограма

На отриманій вейвлет-спектрограмі наочно видні всі характеристики сигналу при певному масштабі й зсуву вейвлета. Таким чином, її можна використати надалі як графічний образ для розпізнавання, вирішуючи задачу визначення належності до певного класу образів. За допомогою вейвлетів можливий також попередній поділ мовного сигналу на фонеми з наступною побудовою їхніх спектрограм і розпізнаванням отриманого набору графічних образів.

Висновки

Теорія вейвлетів є тією базою, основою, ефективним інструментом, що дозволяє вирішити безліч практичних завдань. Основною областю застосування вейвлетних перетворень є аналіз й обробка сигналів і функцій, коли результати аналізу повинні містити не тільки загальну частотну характеристику сигналу, але й відомості про певні локальні характеристики й особливості сигналу.

Незважаючи на те, що математичний апарат вейвлет-анализу добре розвинений та теорія, загалом, оформлена, вейвлети залишають велике поле для досліджень. Досить сказати, що вибір вейвлета, найбільш підходящого для аналізу конкретних даних, являє собою скоріше мистецтво, чим рутинну процедуру [3]. Крім того, величезне значення має задача розробки програм, що використовують вейвлет-аналіз, які можуть бути застосовані в багатьох областях.

Література

  1. Дьяконов В.П. От теории к практике. Изд 2-е, перераб и доп.- М.: СОЛОН-Пресс, 2004. – 400 с.
  2. Астафьева Н.М. Вейвлет-анализ: Основы теории и примеры применения. – Успехи физических наук, т.166, № 11, 1996 г, стр. 1145-1170.
  3. Основы теории вейвлет-преобразования. // Библиотека BaseGroup.ru – Сайт http://www.basegroup.ru/library/cleaning/intro-to-wavelets/
  4. Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование. - Успехи физических наук, т. 171, 2001 г, №5 с. 465-500.
  5. Дремин И.М.,Иванов О.В., Нечитайло В.А. Практическое применение вейвлет-анализа // Наука производству, 2000. – № 6. – С. 13–15.
  6. Леонович А.А. Вейвлет-обработка речевых сигналов в распознавании речи. - Конференции ИВТ СО РАН, Красноярский Государственный Технический Университет, 2004 г.
  7. Новиков Л.В. Основы вейвлет-анализа сигналов. Учебное пособие. 1999. - 152 с.: ил.
  8. Смолнецев Н.К. Основы теории вейвлетов. Вейвлеты в MATLAB. – М.: ДМК Пресс, 2005. – 304с., ил.
  9. Добеши И. Десять лекций по вейвлетам. М.: РХД – 2001г.
  10. Левкович-Маслюк Л. Дайджест вэйвлет-анализа, в двух формулах и 22 рисунках, журнал «КОМПЬЮТЕРРА» №8, от 02/03/98. - Сайт http://offline.computerra.ru/1998/236/1123
  11. Шаховая И.А. «Нейросетевая модель мониторинга технологического процесса выплавки стали» / Портал магистров ДонНТУ, - http://masters.donntu.ru/2008/fvti/shakhovaya/
  12. Рябиченко А.В. «Специализированная компьютерная система анализа вызванных потенциалов головного мозга человека на основе Вейвлет преобразований» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2007/kita/ryabichenko/
  13. Киселёв А.Ю. «Использование метода вейвлет анализа для контроля технического состояния поршневых компрессоров» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2006/kita/kiselyov/
  14. Скляренко М.И. «Анализ нестационарных сигналов при помощи вейвлет преобразования» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2006/kita/sklyarenko/
  15. Стояновский С.Ю. «Разработка и исследование алгоритма сжатия голосовых данных с использованием вейвлет-преобразований» / Портал магистров ДонНТУ, - http://www.masters.donntu.ru/2005/kita/stoyanovsky/

Зауваження

При написанні даного автореферату магістерська робота ще не завершена. Плановане завершення: грудень 2009 р. Повний текст роботи й матеріали за темою можуть бути отримані у автора або його керівника після зазначеної дати.