ИСПОЛЬЗОВАНИЕ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ ДЛЯ РЕШЕНИЯ ЗАДАЧ ДИАГНОСТИКИ

Червинская Н.В., ст. гр. АСУ-00а, Светличная В.А., к.т.н., доц.

Донецкий Национальный Технический Университет





В последнее время наблюдается высокий интерес к нейронным сетям (НС), которые нашли применение в разнообразнейших областях человеческой деятельности. Нейронные сети представляют собой нелинейные системы, которые позволяют значительно лучше классифицировать данные, чем линейные статистические методы, которые используются обычно.

Нейронные сети способны принимать решения, основываясь на скрытых в многомерных данных закономерностях, которые обнаруживаются ими. Отдельное свойство нейронных сетей состоит в том, что они не программируются – не используют никаких правил вывода для определения функциональной зависимости, а обучаются делать это на примерах. Вот некоторые важные типы задач, в которых были успешно использованы нейросетевые методы: мониторинг; прогнозирование на фондовом рынке; предоставление кредита; системы наблюдения за состоянием оборудования; диагностика оборудования и т.д.

В медицинской диагностике НС дают возможность значительно повысить точность диагноза и прогноза протекания болезни. Диагностика является частным случаем классификации действий, причем наибольшую ценность представляет классификация тех действий, которые будут отсутствовать в наборе, с помощью которого обучается нейросеть. В этом проявляется преимущество нейросетевых технологий – они способны осуществлять такую классификацию, обобщая прежний опыт и применяя его в новых случаях. Можно привести много примеров использования нейросетей в различных областях медицинской практики: кардиография, онкология, аллергические реакции и др.

Диагностика и лечение заболеваний являются важнейшей областью применения нейросетевых технологий. Использование НС в области медицины позволяет помочь врачу выбрать тактику лечения, а использование компьютеров – уменьшить время, необходимое для анализа результатов исследования и разработки стратегии лечения. Также параллельно производится сбор информации для дальнейшего использования статистических данных.

Искусственная нейронная сеть – это набор нейронов, объединенных между собой. Важной чертой нейронных сетей является глобальность связей, параллельность обработки информации. Базовые элементы искусственных НС – формальные нейроны – нацелены на работу с векторной информацией. Каждый нейрон сети, как правило, связан со всеми нейронами предыдущего и последующего слоев обработки данных. Некоторые входы нейронов обозначаются как внешние входы сети, а некоторые выходы – как внешние выходы сети. Подавая любые числа на входы сети, мы получаем какой-то набор чисел на выходах сети. Таким образом, работа НС состоит в преобразовании входного вектора в выходной вектор, причем это преобразование задается весами сети – синаптическими коэффициентами. Как правило, передаточные функции всех нейронов в сети зафиксированы, а весовые коэффициенты являются параметрами сети и могут изменяться.

Определение значений весовых коэффициентов называется обучением сети. К настоящему времени разработан целый ряд методов обучения.

Процедура, известная сейчас как алгоритм обратного распространения (back propagation algorithm), стала одним из наиболее важных инструментов в обучении НС. Она используется для обучения многослойной НС. В них связь между собой имеют только соседние слои, при этом каждый нейрон предыдущего слоя связан со всеми нейронами следующего слоя. Между входным и выходным слоями располагается один или несколько скрытых слоев. Определение числа скрытых слоев и числа нейронов в каждом слое для конкретного случая является неформальной задачей.

Алгоритм оказался на удивление эффективным в обучении сетей с большим количеством слоев решения широкого класса задач. Но наиболее эффективен он в ситуациях, когда отношения между входом и выходом нелинейные, а количество данных велико.

Данный алгоритм был использован для диагностики и определения продолжительности лечения аллергических заболеваний. В качестве входного вектора НС были выбраны 14 составляющих (значения начального обследования пациентов), а в качестве выходного – значение количества дней, которые пациент, возможно, проведет на стационарном лечении.

Для принятия решения о структуре нейронной сети необходимо было выбрать количество скрытых слоев, количество нейронов в каждом слое, функцию активации нейронов. Различное влияние на конечный результат обучения имеет и модификация метода обучения обратного распространения. Оптимальная структура нейронной сети определялась на основе экспериментов путем сравнения количественных показателей обучения – количества эпох и величины ошибки.

Реализация алгоритма осуществлялась с помощью пакета прикладных программ Neural Network Toolbox ядра системы MATLAB. Обучение во всех случаях должно было заканчиваться после выполнения 1000 эпох или достижения заданной ошибки – 0,01. Сравнительные характеристики сетей, обучение которых было успешным, приведены в таблице.

Таблица 1. Сравнение нейронных сетей.

Функция

Скр. слои

Нейроны

Функции активации

Метод

Циклы

Ошибка

1

newff

2

14-7-4-1

3-3-3-1

trainrp

129

10-2

2

newcf

2

14-5-2-1

1-2-2-1

traincgp

258

10-2

3

newcf

2

14-5-2-1

1-2-2-1

trainlm

150

10-2

4

newff

2

14-5-2-1

1-2-2-1

traincgp

326

0,8

5

newcf

2

14-5-2-1

3-2-2-1

traingd

1000

0,4

6

newcf

2

14-5-2-1

3-2-2-1

traingda

1000

10-1

7

newcf

2

14-4-2-1

3-2-2-1

traincgf

143

10-2

Следует отметить, что из приведенного наиболее оптимальной оказалась структура под № 1, приведенная на рисунке 1.

Рисунок 1. Структура сети

Она, с одной стороны, достигла заданной ошибки за наименьшее количество эпох, а, с другой стороны, имела хорошую кривую обучения, хотя она и обладает более громоздкой структурой.

Приведенная структура НС может быть использована в медицинских учреждениях для проведения прогнозирования результатов лечения.



Литература:

  1. Применение нейронных сетей в медицине. А. Ежов, В. Чечеткин. http://www.macworldexpo.ru/
  2. Нейрокомпьютерная техника. Ф. Уоссерман. М.: “М”, 1992г.
  3. Математические пакеты расширения MATLAB В.П. Дьяконов, В.В. Круглов, Специальный справочник. СПб.:Питер, 2001г. 480 с.