М.Ю. Борисенко, Е.В. Перинская - Интеллектуальные способы распознавания плоскостопия: многослойный перцептрон и сверточная нейронная сеть

Автор:М.Ю. Борисенко, Е.В. Перинская
Источник: Современные информационные технологии в образовании и научных исследованиях (СИТОНИ - 2024) - 2024 / Материалы IX Всероссийской научно-технической конференции. - Донецк, ДонНТУ - 2024.

Аннотация

М.Ю. Борисенко, Е.В. Перинская. Интеллектуальные способы распознавания плоскостопия: многослойный перцептрон и сверточная нейронная сеть. Рассмотрены интеллектуальные способы распознавания плоскостопия такие, как: многослойный перцептрон и сверточная нейронная сеть. Представлены оценки качества моделей данных алгоритмов.

Введение

В медицине важную роль играет диагностика. Своевременный диагноз позволяет легко подобрать метод лечения, а также существенно повысить шансы выздоровления пациента. Применение нейросетей – один из способов улучшения эффективности диагностики медицины [1].

Точность диагноза и то, насколько быстро он может быть поставлен, зависит от многих факторов: состояние пациента, имеющаяся информация о симптомах и признаках болезни, результаты лабораторных исследований, суммарное число медицинских сведений о наблюдении аналогичных симптомов при самых разнообразных заболеваниях и непосредственно квалификации врача. Важная роль в данном процессе принадлежит человеческому фактору, который часто приводит к неудачам.

Ниже приведена часть конкретных затруднений медицинской диагностики, которые следует учитывать [2].

Базой для качественного диагноза является достаточный практический опыт, который можно получить непосредственно на середине врачебной карьеры, и он является невосполнимым к окончанию академического образования.

В частности, это касается немногих или недавно изученных заболеваний, когда врачи, имеющие опыт, находятся в том же положении, что и начинающие.

1 Многослойный перцептрон

Многослойный перцептрон – это тип искусственной нейронной сети, который состоит из трех или более слоев: входного, одного или нескольких скрытых и выходного (см. рис. 1). Каждый нейрон в этих слоях связан с нейронами следующего слоя весовыми коэффициентами, которые корректируются в процессе обучения сети.

Рисунок 1 – Архитектура многослойного перцептрона

Входной слой принимает вектор признаков и передает его в первый скрытый слой. Нейроны входного слоя обычно не выполняют вычислений, а лишь распределяют входные данные по нейронам следующего слоя.

Скрытые слои являются основными вычислительными элементами многослойного перцептрона. Каждый нейрон в скрытом слое принимает взвешенную сумму от нейронов предыдущего слоя, применяет к ней активационную функцию (например, сигмоидальную или ReLU) и передает результат следующему слою. Активационные функции вносят нелинейность в процесс обработки данных, что позволяет многослойному перцептрону моделировать сложные зависимости.

Выходной слой состоит из одного или нескольких нейронов, которые выдают конечный результат работы сети. В зависимости от задачи, это может быть классификация (где активационная функция часто является softmax) или регрессия (с линейной активационной функцией).

Обучение многослойного перцептрона осуществляется с использованием алгоритма обратного распространения ошибки, который корректирует веса сети на основе разницы между фактическим выходом сети и желаемым результатом. Процесс обучения включает в себя два этапа [3]:

Прямое распространение, где входные данные проходят через сеть, и вычисляется выходной сигнал.
Обратное распространение, где вычисляется градиент функции потерь по отношению к весам сети, и веса корректируются с использованием методов оптимизации, таких как стохастический градиентный спуск.

Принцип работы многослойного перцептрона в распознавании плоскостопия заключается в следующем:

сбор данных (для начала необходимо собрать достаточное количество рентгеновских снимков стопы, которые уже классифицированы специалистами как примеры с плоскостопием и без него);
предварительная обработка (изображения подвергаются предварительной обработке для улучшения качества и выделения характерных признаков, таких как контуры костей стопы, углы и расстояния между определенными точками);
обучение сети (с помощью алгоритма обратного распространения ошибки многослойный перцептрон обучается распознавать паттерны, соответствующие плоскостопию, где в процессе обучения сеть корректирует веса связей между нейронами, минимизируя разницу между фактическими и предсказанными значениями);
тестирование и валидация (после обучения сеть тестируется на новом наборе данных, чтобы оценить ее способность к распознаванию плоскостопия, что позволяет определить точность и надежность модели).

Математическое описание многослойного перцептрона рассчитывается для каждого нейрона j в слое с выходом y как (1):

(1)

где w– вес связи между нейроном i предыдущего слоя l-1 и нейроном j текущего слоя l, b – смещение нейрона j, а f – функция активации, например, сигмоидная функция или ReLU.

В медицине использование многослойного перцептрона для распознавания плоскостопия позволяет автоматизировать процесс диагностики, уменьшая нагрузку на рентгенологов и повышая точность определения заболевания. Это особенно важно в условиях большого потока пациентов и необходимости быстрого принятия решений.

С учетом текущих достижений в области искусственного интеллекта и машинного обучения, можно ожидать дальнейшего усовершенствования методов распознавания плоскостопия с помощью многослойного перцептрона. Это включает в себя интеграцию с другими медицинскими информационными системами, улучшение алгоритмов обработки изображений и расширение обучающих наборов данных для повышения точности и универсальности моделей.

В таблице 1 приведены среднестатистические результаты классификации многослойного перцептрона для задачи распознавания плоскостопия. Эти метрики в совокупности предоставляют полную картину эффективности и надежности модели многослойного перцептрона в задаче диагностики плоскостопия.

Таблица 1 – Оценка качества модели многослойного перцептрона

Метрика	Значение	Описание
Точность (Accuracy)	0.95	Доля правильных ответов модели из всех прогнозов
Полнота (Recall)	0.90	Доля истинно положительных результатов из всех реальных положительных случаев
Точность (Precision)	0.92	Доля истинно положительных результатов из всех положительных прогнозов модели
F1-мера	0.91	Среднее гармоническое полноты и точности, баланс между ними
ROC AUC	0.96	Площадь под кривой ошибок, чем ближе к 1, тем лучше качество модели

2 Сверточная нейронная сеть

Сверточная нейронная сеть представляет собой специализированную архитектуру искусственных нейронных сетей (см. рис. 2), разработанную для эффективного распознавания образов и анализа данных с пространственной структурой, таких как изображения [4]. Основная идея сверточных нейронных сетей заключается в использовании сверточных слоев для автоматического выделения важных признаков из входных данных.

Рисунок 2 – Архитектура сверточной нейронной сети

Сверточные нейронные сети являются одним из наиболее мощных инструментов в области компьютерного зрения и распознавания образов. Они особенно эффективны в задачах, связанных с анализом изображений, благодаря своей способности выделять иерархические признаки. В контексте распознавания плоскостопия сверточные нейронные сети могут быть обучены на рентгеновских снимках стопы для автоматического определения наличия и степени заболевания.

Архитектура сверточных нейронных сетей состоит из нескольких типов слоев [5]:

сверточные слои (используют фильтры для выделения локальных признаков на изображении);
функция активации (добавляет нелинейность в модель, позволяя ей учиться более сложным паттернам);
пулинг слои (уменьшают размерность данных, сохраняя при этом важные признаки);
полносвязные слои (классифицируют изображение на основе выделенных признаков).

Процесс обучения сверточной нейронной сети заключается в первичной подготовке данных, которая включает в себя сбор большого количества аннотированных рентгеновских снимков стопы. На следующем этапе выполняется предобработка, заключающаяся в нормализации изображений и возможном увеличении данных (data augmentation) для повышения обобщающей способности сети [6]. Непосредственно при обучении используются алгоритмы обратного распространения ошибки для настройки весов сети. По окончанию наступает этап валидации, где выполняется проверка точности модели на отдельном наборе данных.

Математическое описание сверточной нейронной сети для создания карты признаков заключается в применении к исходному изображению в сверточном слое фильтра (2):

(2)

где F – значение в карте признаков, b – функция активации (например, ReLU), I – входное изображение, K – ядро свертки, b – смещение, m,n – индексы в пределах размера ядра свертки.

Сверточные нейронные сети могут быть интегрированы в медицинские информационные системы для предоставления быстрой и точной диагностики плоскостопия [7]. Это позволяет врачам сосредоточиться на более сложных задачах и улучшает качество лечения пациентов.

С улучшением алгоритмов обучения и увеличением доступных данных можно ожидать дальнейшего повышения точности и универсальности сверточных нейронных сетей в задачах медицинской диагностики.

В таблице 2 приведены среднестатистические результаты классификации сверточной нейронной сети для задачи распознавания плоскостопия. Эти метрики в совокупности предоставляют полную картину эффективности и надежности модели сверточной нейронной сети в задаче диагностики плоскостопия.

Таблица 2 – Оценка качества модели сверточной нейронной сети

Метрика	Значение	Описание
Точность (Accuracy)	0.98	Доля правильных ответов модели из всех прогнозов
Полнота (Recall)	0.97	Доля истинно положительных результатов из всех реальных положительных случаев
Точность (Precision)	0.96	Доля истинно положительных результатов из всех положительных прогнозов модели
F1-мера	0.97	Среднее гармоническое полноты и точности, баланс между ними
ROC AUC	0.99	Площадь под кривой ошибок, чем ближе к 1, тем лучше качество модели

Выводы

В контексте медицинской диагностики, своевременность и точность диагноза играют критическую роль в определении эффективности лечения и улучшении прогноза для пациента. Традиционные методы диагностики зависят от множества переменных, включая клинический опыт врача, доступность и качество медицинских данных, а также от индивидуальных характеристик пациента. Однако, человеческий фактор может вносить элемент неопределенности в процесс диагностики, что потенциально приводит к ошибкам.

С учетом ограничений традиционных подходов, внедрение искусственных нейронных сетей (ИНС) представляет собой перспективное направление в области медицинской диагностики. ИНС могут обрабатывать большие объемы данных, выявлять сложные закономерности и предоставлять поддержку в принятии решений, что способствует повышению точности и скорости диагностического процесса.

Список использованной литературы

Грибанов А.В., Джос Ю.С. О стратегических направлениях медико биологических исследований // Вестн. Сев. (Арктич.) федер. ун-та. Сер.: Мед.-биол. науки. 2013. № 1. С. 10–18.
Головинова В.Ю., Киреев С.В., Котенко П.К., Минаев Ю.Л., Штамбург И.Н., Кузьмин С.В. Нейросетевые модели прогнозирования заболеваемости в организованных коллективах // Вестн. Рос. воен.-мед. акад. 2013. № 3(47). С. 150–153.
Чаша Т.В., Харламова Н.В., Климова О.И., Ясинский Ф.Н., Ясинский И.Ф. Применение нейронных сетей для прогнозирования течения постгипоксических нарушений сердечно-сосудистой системы у новорожденных детей // Вестн. ИГЭУ. 2009. Вып. 3. С. 57–59.
Сбоев А.В., Горохова С.В., Черний Н.Н. Разработка нейросетевой методики раннего диагностирования ишемической болезни сердца и коронарного атеросклероза // Вестн. ВГУ. Сер.: Химия. Биология. Фармация. 2011. № 1. С. 204–213.
Colak M.C., Colak C., Kocaturk H., Sagiroglu S., Barutcu I. Predicting Coronary Artery Disease Using Different Artificial Neural Network Models // Anadolu Kardiyol. Derg. 2008. Vol. 8, № 3. P. 249–253.
Atkov O.Yu., Gorokhova S.G., Sboev A.G., Generozov E.V., Muraseyeva E.V., Moroshkina S.Y., Cherniy N.N. Coronary Heart Disease Diagnosis by Artificial Neural Networks Including Genetic Polymorphisms and Clinical Parameters // J. Cardiol. 2011. Vol. 59, № 1. P. 190–193.
Niranjana Murthy H.S., Meenakshi M. ANN Model to Predict Coronary Heart Disease Based on Risk Factors // Bonfring. Int. J. Man Mach. Interface. 2013. Vol. 3, № 1. Р. 13–18.