ДонНТУ > Портал магистров ДонНТУ || Библиотека

УДК 681.3
Нейросетевой алгоритм распознавания сигналов акустической эмиссии

Деглина Ю.Б.
ИПММ НАН Украины, г. Донецк, Украина
e-mail: ulca@mail.ru


Источник: Искусственный интеллект. - 2006 .- № 4. - С. 731-734, http://iai.dn.ua/public/JournalAI_2006_4/...


Рассмотрена задача классификации акустических сигналов импульсной природы. Предложен и программно реализован нейросетевой алгоритм такой классификации, учитывающий определенные аспекты восприятия аудиальной информации человеком.

Введение

Сфера применения методов распознавания образов постоянно расширяется. В ряде производственных задач для корректной работы и безопасности производства используется мониторинг акустической информации различного типа, как правило, осуществляемый человеком, причем в большинстве случаев распознавание сигналов, несущих информацию о потенциально опасной либо аварийной ситуации, проводится на фоне техногенных помех.

Поскольку интерпретация получаемой информации осуществляется человеком, это создает определенные проблемы, в частности проблему подготовки квалифицированного персонала. Как показывает практика, эффективность решения подобных задач на производстве существенным образом зависит от личного опыта, на приобретение которого требуется значительный промежуток времени. Таким образом, актуальной является задача построения алгоритмов автоматизированного распознавания акустической информации, реализация которых в промышленных системах мониторинга позволила бы уменьшить влияние человеческого фактора на процесс обнаружения критических ситуаций.

Целью работы является построение алгоритма для автоматизации процесса выделения и распознавания акустических сигналов с помощью нейросетевых алгоритмов классификации.

Постановка задачи. Звуковая информация используется, в частности, для прогнозирования внезапных выбросов угля и газа [1]. Прогнозирование ведется на основе анализа звукового сигнала, поступающего из шахты, на наличие в нем импульсов акустической эмиссии пласта, количество, распределение и характеристики которых свидетельствуют о наличии опасных зон. В настоящее время выделением и анализом этих сигналов занимаются операторы. Задача усложняется наличием многочисленных промышленных помех импульсной природы, которые сложно отличить от настоящих сейсмоакустических импульсов.

В процессе угледобычи запись акустической информации ведется в цифровом виде с помощью соответствующих аппаратно-программных комплексов регистрации.

Объектом исследования являются звуковые файлы, содержащие выделенные экспертом образцы сейсмоакустических импульсов и импульсных промышленных помех, а также звуковые файлы записей реального процесса угледобычи.

В связи с тем, что формализованного описания импульсов акустической эмиссии и импульсных помех не существует, предлагаемый алгоритм распознавания использует нейросетевой подход, поскольку одной из существенных особенностей нейронных сетей является способность агрегировать слабо структурированную информацию [2].

1. Представление данных

Исходными данными являются звуковые файлы помех, импульсов, а также рабочие записи технологического процесса, т.е. временное представление сигнала. Для целей распознавания в качестве исходных данных было использовано спектральное представление сигнала, полученное из временного представления с помощью дискретного преобразования Фурье.

Поскольку алгоритм призван имитировать работу эксперта-человека, при выборе способа представления данных был использован физиологический подход к анализу звуковой информации, основанный на данных когнитивной психологии, примененный в [3].

Для дополнительной обработки спектрального представления сигнала используется шкала барков, т.е. частотных диапазонов с границами, рассчитанными с учетом экспериментально полученных исследователями в когнитивной психологии данных. В основу модели положены такие факты из когнитивной психологии: весь слышимый диапазон от 20 Гц до 20 кГц покрывается 24 барками; до 500 Гц ширина барков «примерно одинакова», а после 500 Гц – изменяется «примерно логарифмически»; на весь частотный диапазон реагируют примерно 3500 волосковых клеток органа Корти; в каждом барке содержится постоянное количество волосковых клеток (144 – 150 шт.); в каждом барке наблюдается постоянное количество ступеней различия однотональных сигналов по высоте (34 – 36 шт.); каждой ступени различия соответствует постоянное число волосковых клеток (4 – 5 шт.).

Значения стационарных границ барков приведены в таблице 1.


Таблица 1 – Значения стационарных границ барков


№ баркаДиапазон, Гц№ баркаДиапазон, Гц№ баркаДиапазон, Гц
120-1009753-925173882-4764
2100-18010925-1135184764-5848
3180-260111135-1393195848-7178
4260-340121393-1710207178-8811
5340-420131710-209921811-10815
6420-500142099-25762313275-16294
7614-753152576-31622313275-16294
8614-753163162-38822416294-20000

В каждом из диапазонов вычисляется средний уровень энергии сигнала и полученные значения нормируются. Экспериментальным образом было установлено, что значащими являются только первые десять значений каждого из полученных векторов, которые и используются для дальнейшей работы.

2. Архитектура нейронной сети

Для распознавания импульсов была предложена нейронная сеть, состоящая из двух компонент: сети Хопфилда и сети прямого распространения. Графически структура сети представлена на рис. 1


Рисунок 1 – Архитектура двухкомпонентной нейронной сети

Рисунок 1 – Архитектура двухкомпонентной нейронной сети


Сеть Хопфилда используется как ассоциативная память: ее функцией является сведение поступающих на вход сети образов к поданным при обучении эталонам. После обработки с помощью сети Хопфилда образ предъявляется для классификации с помощью сети прямого распространения.

Сеть прямого распространения является двухслойной, с 5 нейронами в первом слое и одним – во втором.

Настройка каждой из компонент сети производится раздельно. Обучение сети прямого распространения проводится методом обратного распространения ошибки в варианте Левенберга-Марквардта.

3. Описание и обсуждение результатов

Предложенный алгоритм был реализован средствами системы Matlab [4]. При экспериментах были использованы звуковые файлы, содержащие выделенные экспертом образцы импульсов акустической эмиссии и промышленных импульсных помех, а также файлы записей технологического процесса угледобычи.

В процессе тестирования было проведено несколько экспериментов, в каждом из которых обучающая и контрольная выборка формировались случайным образом, причем работа описанной выше двухкомпонентной сети тестировалась в сравнении с работой одной из компонент, а именно – сети прямого распространения.

Результаты экспериментов приведены в табл. 2. Нечетные строки соответствуют экспериментам с однокомпонентной сетью, а четные представляют результаты работы двухкомпонентной сети.


Таблица 2 – Результаты экспериментов


№ эксп.Кол-во эталонов в сети ХопфилдаКол-во распознанных импульсовКол-во нераспознанных импульсов% распознанных импульсовКол-во распознанных ударовКол-во нераспознанных ударов% распознанных ударов
1-252929564
217234858657
3-234855935
423252926843
5-1987011379
621189677750
7-216788657
823225816843

Таким образом, по результатам можно сказать, что процент правильной классификации импульсов достаточно высок (в среднем 81 %), но при этом высок и процент ошибочных классификаций импульсных помех как импульсов (в среднем 46 %).

Заключение

В работе был предложен вариант нейросетевого алгоритма классификации сигналов импульсной природы, учитывающий физиологические аспекты восприятия звуковой информации человеком. Поскольку в процессе экспериментирования были выявлены такие недостатки предложенного подхода, как большое количество ошибочных классификаций помех, дальнейшее усовершенствование алгоритма будет направлено на устранение именно этого рода ошибок, возможно, через введение в структуру системы дополнительных нейросетевых компонент других типов. Еще одним направлением работы может быть работа по поиску другого способа представления данных, позволяющего провести более четкую границу между классами сигналов.

Литература

  1. Деглин Б.М. Разработка метода контроля выбросоопасности угольного пласта по спектральным параметрам искусственного акустического поля: Автореф. дисс… канд. М.: ИГД им. А.А. Скочинского, 1986.
  2. Осовский С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинского. – М.: Финансы и статистика, 2002. – 344 с.
  3. Асланов О.Є. Інтерпретація акустичних даних у задачах моніторингу виробничих шумів: Автореф. дис… канд. – Донецьк, 2005.
  4. Медведев В.С., Потемкин В.Г. Нейронные сети. MATLAB 6. – М.: ДИАЛОГ-МИФИ, 2002. – 496 с.