Нестеренко Дмитро СергійовичФакультет: Обчислювальної техніки та інформатикиСпеціальність: Програмне забезпечення автоматизованих системТема випускної роботи:Автоматичне розпізнавання ізольованих слів російської мови на основі вейвлет-аналізуКерівник: доцент, к.т.н. Федяєв О.І. |
У сучасних комп'ютерних системах усе більше уваги приділяється побудові інтерфейсу природного введення-виводу інформації. Одним з перспективних напрямків на сьогоднішній день є використання систем мовного діалогу, що припускає автоматичний синтез і розпізнавання мови.
При розробці системи автоматичного розпізнавання мови, що є найбільш складною підсистемою мовного діалогу, використають різні методи. Останнім часом великі перспективи у вирішенні проблеми розпізнавання мови пов’язують із застосуванням вейвлет-аналізу мовного сигналу. Методи, що використовують вейвлет перетворення, долають багато обмежень і труднощі, що виникають при розпізнаванні мови, до того ж мають істотні переваги, оскільки дозволяють робити висновки не тільки про частотний спектр сигналу, але також про те, у який момент часу з'явилася та або інша гармоніка.
У сучасній науці, вейвлети є ефективним математичним інструментом в багатьох дослідженнях. Основна причина їх використання – можливість отримання в результатах аналізу деякого сигналу не лише перелік його характерних частот, але і відомості про локальні координати, при яких ці частоти проявляють себе.
У цей час вейвлети починають широко застосовуватися при рішенні різних прикладних завдань: розпізнавання образів, при обробці і синтезі різних сигналів (наприклад, мовних), при аналізі зображень і в багатьох інших випадках. За відносно недовгий час існування теорії вейвлетів сформувався на її основі розвинений математичний апарат. Проте вчені і дослідники ще не встигли в достатньому обсязі продемонструвати всі переваги вейвлет перетворень на практиці. Всі ці факти, встановлені в результаті аналізу наукових і прикладних робіт в цій області, підкреслюють актуальність роботи.
Дослідження з даної тематики проводяться на кафедрі прикладної математики й інформатики ДонНТУ в рамках виконання державної теми № Н-39-2005 "Алгоритмічне й програмне забезпечення високопродуктивних й інтелектуальних обчислювальних мереж" і Договору про співробітництво між кафедрою ПМІ й ТОВ "Центр інтелектуальних технологій" (м. Перм, Росія).
Метою роботи є теоретичне обґрунтування застосування вейвлет аналізу до розробки системи, що дозволяє ефективно вирішувати задачу автоматичного розпізнавання ізольованих слів російської мови.
В цілому дослідження присвячені аналізу існуючих методів вейвлет-перетворення і подальшому вживанню кращого з них для розробки системи розпізнавання слів. При цьому планується вирішення наступних завдань:
Предметом досліджень є математичний апарат вейвлет-аналізу голосових сигналів, що дозволяє найбільше ефективно представити мовний сигнал за допомогою вейвлетів, а також методи теорії розпізнавання мовних образів.
Об'єктом дослідження є програмно-апаратні засоби автоматичного розпізнавання мовного сигналу.
Для вирішення поставлених завдань використані методи теорії вейвлет-перетворень, теорії цифрової обробки сигналів, теорії штучних нейронних мереж, теорії нечітких систем і теорії розпізнавання мовних образів.
Запропонований новий підхід до цифрового подання мовного сигналу за допомогою вейвлетів, що дозволяє поліпшити нейро-нечітке розпізнавання ізольованих слів російської мови.
Отримані результати дозволять оцінити ефективність запропонованого способу вирішення наукового завдання автоматичного розпізнавання слів мови і застосувати розроблені алгоритми для побудови систем мовної взаємодії людини з ЕОМ. Розроблені структури нейромережевих і нечітких систем, а також програмне забезпечення будуть використовуватися на кафедрі ПМІ ДонНТУ в навчальному процесі і при проведенні наукових досліджень з цієї проблеми.
У результаті проведених досліджень, автор брав участь у міжнародній науково-технічній конференції "Інформатика й комп'ютерні технології", що пройшла 12-15 травня 2009 р. у Донецьком Національному Технічному Університеті. Представлено доповідь на тему: "Аналіз математичного опису відображення сигналів вейвлетами".
На рівні університету, застосовані методи присутні в роботах:
Останнім часом у всьому світі активізувався інтерес до теорії вейвлетів. Україна не стала виключенням. Проте книжок і статей з вейвлетів практично немає, чого не можна сказати про Росію.
Ще на початку 90-х років минулого століття були запропоновані вейвлети і засновані на них вейвлет-перетворення. Надалі, теорія вейвлетів дуже інтенсивно розвивалася. Найбільший внесок у розробку теоретичних основ вейвлетів внесли Мейер (Meyer), Добеши (Daubechіes), Маал (Mallat) і інші вчені, що опублікували перші теоретичні роботи в цьому напрямку і зуміли донести їх до широкої наукової громадськості. До теперішнього часу за кордоном в області вейвлет-перетворень опубліковані сотні книг, а число статей обчислюється багатьма тисячами [1].
Серед усього різноманіття статей по даній тематиці, можна виділити деякі з них:
В даний час сімейство функцій-аналізаторів, названих вейвлетамі, починає широко застосовуватися в завданнях розпізнавання образів, при обробці і синтезі різних сигналів, наприклад, мовних, при аналізі зображень, для упаковки (згортки) великих об'ємів інформації і в багатьох інших випадках. Проте вони ще недостатньо широко відомі дослідникам, що займаються аналізом даних [2]. Саме тому була написана ця робота, що дозволяє зрозуміти і розібратися у суті вейвлет-перетворення, за допомогою основних математичних формул і наочних образів.
Термін «вейвлет» був вперше введений фахівцем з сейсмографії Морле (J.Morlet) в 80-х роках у зв'язку з аналізом властивостей сейсмічних і акустичних сигналів. У перекладі з англійської буквально означає «коротка (або маленька) хвиля» [1].
Вейвлети є функціями, що моють деякі важливі властивості, серед яких слід виділити можливість переносу за часом і масштабованість.
Спочатку вейвлети були запропоновані світовій спільноті математиками і тому основоположні роботи з вейвлетів написані на досить складній математичній мові, дуже часто навіть для багатьох математиків.
Розглянемо вейвлет типу "мексиканський капелюх" (MHAT), що є другою похідною функції Гаусса. Його образ задається формулою:
Графік MHAT вейвлета c різними значеннями масштабу й переносу за часом зображений на рис. 1.
Добре видно, що даний вейвлет нагадує загасаюче синусоїдальне коливання. Причому сумарна площа (над віссю часу і під нею) дорівнює нулю. Саме ця особливість дозволяє віднести часову залежність MHAT до вейвлетів.
Завдання вейвлет-анализу зводиться до відтворення вхідного сигналу у вигляді набору вейвлетів.
Можна представити вейвлети як деякі хвилеві функції, здатні здійснювати перетворення Фур'є не по всій часовій осі, а локально по місцю свого розташування. Число вейвлетів, використаних при розкладанні сигналу, задає рівень декомпозиції сигналу. При цьому за нульовий рівень декомпозиції сигналу береться сам вхідний сигнал.
Очевидно, що для відтоврення сигналів у вигляді набору вейвлетів, необхідно мати можливість стискати або розтягувати вейвлети і переміщати їх по часовій осі.
Процес розкладання довільного вхідного сигналу у вигляді сукупності вейвлетов отримав назву «Пряме вейвлет-перетворення» (ПВП). Використовувані при цьому вейвлети повинні володіти наступними важливими властивостями [1]:
ПВП можна розглядати як розкладання сигналу за допомогою вейвлетів з усіма можливими зсувами й розтягненнями/стисками. При цьому вирішується проблема обчислення вейвлет-коэффициентів.
Вейвлет задається формулою:
Формальне обчислення вейвлет-коефіцієнтів реалізується в такий спосіб:
Для приклада, розглянуте пряме вейвлет-перетворення функції
Графічний образ вхідного сигналу зображен на рис. 2.
Для виконання обчислень використовувалася система комп'ютерної математики Mathcad. Розроблена програма знаходження вейвлет-коєфіцієнтів представлена на рис. 3.
У результаті виконання програми, були отримані вейвлет коефіцієнти для зазначеного діапазону масштабів і зсувів.
Отримані коефіцієнти, представлені у вигляді поверхні. Вона зображена на рис. 4.
Однак для зручності й підвищення інформативності, вейвлет коефіцієнти зображують за допомогою вейвлет-спектрограм. Вони дозволяють легко виявити дрібні локальні особливості функцій, сигналів, зображень із прив'язкою їх до часу або координат простору. Отримані вейвлет-коефіцієнти, забражені у вигляді вейвлет-спектрограми зображені на мал. 5.
На отриманій вейвлет-спектрограмі наочно видні всі характеристики сигналу при певному масштабі й зсуву вейвлета. Таким чином, її можна використати надалі як графічний образ для розпізнавання, вирішуючи задачу визначення належності до певного класу образів. За допомогою вейвлетів можливий також попередній поділ мовного сигналу на фонеми з наступною побудовою їхніх спектрограм і розпізнаванням отриманого набору графічних образів.
Теорія вейвлетів є тією базою, основою, ефективним інструментом, що дозволяє вирішити безліч практичних завдань. Основною областю застосування вейвлетних перетворень є аналіз й обробка сигналів і функцій, коли результати аналізу повинні містити не тільки загальну частотну характеристику сигналу, але й відомості про певні локальні характеристики й особливості сигналу.
Незважаючи на те, що математичний апарат вейвлет-анализу добре розвинений та теорія, загалом, оформлена, вейвлети залишають велике поле для досліджень. Досить сказати, що вибір вейвлета, найбільш підходящого для аналізу конкретних даних, являє собою скоріше мистецтво, чим рутинну процедуру [3]. Крім того, величезне значення має задача розробки програм, що використовують вейвлет-аналіз, які можуть бути застосовані в багатьох областях.