Автор:М.Ю. Борисенко, Е.В. Перинская
Источник: Современные информационные технологии в образовании и научных исследованиях (СИТОНИ - 2024) - 2024 / Материалы IX Всероссийской научно-технической конференции. - Донецк, ДонНТУ - 2024.
М.Ю. Борисенко, Е.В. Перинская. Интеллектуальные способы распознавания плоскостопия: многослойный перцептрон и сверточная нейронная сеть. Рассмотрены интеллектуальные способы распознавания плоскостопия такие, как: многослойный перцептрон и сверточная нейронная сеть. Представлены оценки качества моделей данных алгоритмов.
В медицине важную роль играет диагностика. Своевременный диагноз позволяет легко подобрать метод лечения, а также существенно повысить шансы выздоровления пациента. Применение нейросетей – один из способов улучшения эффективности диагностики медицины [1].
Точность диагноза и то, насколько быстро он может быть поставлен, зависит от многих факторов: состояние пациента, имеющаяся информация о симптомах и признаках болезни, результаты лабораторных исследований, суммарное число медицинских сведений о наблюдении аналогичных симптомов при самых разнообразных заболеваниях и непосредственно квалификации врача. Важная роль в данном процессе принадлежит человеческому фактору, который часто приводит к неудачам.
Ниже приведена часть конкретных затруднений медицинской диагностики, которые следует учитывать [2].
Базой для качественного диагноза является достаточный практический опыт, который можно получить непосредственно на середине врачебной карьеры, и он является невосполнимым к окончанию академического образования.
В частности, это касается немногих или недавно изученных заболеваний, когда врачи, имеющие опыт, находятся в том же положении, что и начинающие.
Многослойный перцептрон – это тип искусственной нейронной сети, который состоит из трех или более слоев: входного, одного или нескольких скрытых и выходного (см. рис. 1). Каждый нейрон в этих слоях связан с нейронами следующего слоя весовыми коэффициентами, которые корректируются в процессе обучения сети.
Рисунок 1 – Архитектура многослойного перцептрона
Входной слой принимает вектор признаков и передает его в первый скрытый слой. Нейроны входного слоя обычно не выполняют вычислений, а лишь распределяют входные данные по нейронам следующего слоя.
Скрытые слои являются основными вычислительными элементами многослойного перцептрона. Каждый нейрон в скрытом слое принимает взвешенную сумму от нейронов предыдущего слоя, применяет к ней активационную функцию (например, сигмоидальную или ReLU) и передает результат следующему слою. Активационные функции вносят нелинейность в процесс обработки данных, что позволяет многослойному перцептрону моделировать сложные зависимости.
Выходной слой состоит из одного или нескольких нейронов, которые выдают конечный результат работы сети. В зависимости от задачи, это может быть классификация (где активационная функция часто является softmax) или регрессия (с линейной активационной функцией).
Обучение многослойного перцептрона осуществляется с использованием алгоритма обратного распространения ошибки, который корректирует веса сети на основе разницы между фактическим выходом сети и желаемым результатом. Процесс обучения включает в себя два этапа [3]:
Принцип работы многослойного перцептрона в распознавании плоскостопия заключается в следующем:
Математическое описание многослойного перцептрона рассчитывается для каждого нейрона j в слое с выходом y как (1):
![]() | (1) |
где w– вес связи между нейроном i предыдущего слоя l-1 и нейроном j текущего слоя l, b – смещение нейрона j, а f – функция активации, например, сигмоидная функция или ReLU.
В медицине использование многослойного перцептрона для распознавания плоскостопия позволяет автоматизировать процесс диагностики, уменьшая нагрузку на рентгенологов и повышая точность определения заболевания. Это особенно важно в условиях большого потока пациентов и необходимости быстрого принятия решений.
С учетом текущих достижений в области искусственного интеллекта и машинного обучения, можно ожидать дальнейшего усовершенствования методов распознавания плоскостопия с помощью многослойного перцептрона. Это включает в себя интеграцию с другими медицинскими информационными системами, улучшение алгоритмов обработки изображений и расширение обучающих наборов данных для повышения точности и универсальности моделей.
В таблице 1 приведены среднестатистические результаты классификации многослойного перцептрона для задачи распознавания плоскостопия. Эти метрики в совокупности предоставляют полную картину эффективности и надежности модели многослойного перцептрона в задаче диагностики плоскостопия.
Таблица 1 – Оценка качества модели многослойного перцептрона
Метрика | Значение | Описание |
Точность (Accuracy) | 0.95 | Доля правильных ответов модели из всех прогнозов |
Полнота (Recall) | 0.90 | Доля истинно положительных результатов из всех реальных положительных случаев |
Точность (Precision) | 0.92 | Доля истинно положительных результатов из всех положительных прогнозов модели |
F1-мера | 0.91 | Среднее гармоническое полноты и точности, баланс между ними |
ROC AUC | 0.96 | Площадь под кривой ошибок, чем ближе к 1, тем лучше качество модели |
Сверточная нейронная сеть представляет собой специализированную архитектуру искусственных нейронных сетей (см. рис. 2), разработанную для эффективного распознавания образов и анализа данных с пространственной структурой, таких как изображения [4]. Основная идея сверточных нейронных сетей заключается в использовании сверточных слоев для автоматического выделения важных признаков из входных данных.
Рисунок 2 – Архитектура сверточной нейронной сети
Сверточные нейронные сети являются одним из наиболее мощных инструментов в области компьютерного зрения и распознавания образов. Они особенно эффективны в задачах, связанных с анализом изображений, благодаря своей способности выделять иерархические признаки. В контексте распознавания плоскостопия сверточные нейронные сети могут быть обучены на рентгеновских снимках стопы для автоматического определения наличия и степени заболевания.
Архитектура сверточных нейронных сетей состоит из нескольких типов слоев [5]:
Процесс обучения сверточной нейронной сети заключается в первичной подготовке данных, которая включает в себя сбор большого количества аннотированных рентгеновских снимков стопы. На следующем этапе выполняется предобработка, заключающаяся в нормализации изображений и возможном увеличении данных (data augmentation) для повышения обобщающей способности сети [6]. Непосредственно при обучении используются алгоритмы обратного распространения ошибки для настройки весов сети. По окончанию наступает этап валидации, где выполняется проверка точности модели на отдельном наборе данных.
Математическое описание сверточной нейронной сети для создания карты признаков заключается в применении к исходному изображению в сверточном слое фильтра (2):
![]() | (2) |
где F – значение в карте признаков, b – функция активации (например, ReLU), I – входное изображение, K – ядро свертки, b – смещение, m,n – индексы в пределах размера ядра свертки.
Сверточные нейронные сети могут быть интегрированы в медицинские информационные системы для предоставления быстрой и точной диагностики плоскостопия [7]. Это позволяет врачам сосредоточиться на более сложных задачах и улучшает качество лечения пациентов.
С улучшением алгоритмов обучения и увеличением доступных данных можно ожидать дальнейшего повышения точности и универсальности сверточных нейронных сетей в задачах медицинской диагностики.
В таблице 2 приведены среднестатистические результаты классификации сверточной нейронной сети для задачи распознавания плоскостопия. Эти метрики в совокупности предоставляют полную картину эффективности и надежности модели сверточной нейронной сети в задаче диагностики плоскостопия.
Таблица 2 – Оценка качества модели сверточной нейронной сети
Метрика | Значение | Описание |
Точность (Accuracy) | 0.98 | Доля правильных ответов модели из всех прогнозов |
Полнота (Recall) | 0.97 | Доля истинно положительных результатов из всех реальных положительных случаев |
Точность (Precision) | 0.96 | Доля истинно положительных результатов из всех положительных прогнозов модели |
F1-мера | 0.97 | Среднее гармоническое полноты и точности, баланс между ними |
ROC AUC | 0.99 | Площадь под кривой ошибок, чем ближе к 1, тем лучше качество модели |
В контексте медицинской диагностики, своевременность и точность диагноза играют критическую роль в определении эффективности лечения и улучшении прогноза для пациента. Традиционные методы диагностики зависят от множества переменных, включая клинический опыт врача, доступность и качество медицинских данных, а также от индивидуальных характеристик пациента. Однако, человеческий фактор может вносить элемент неопределенности в процесс диагностики, что потенциально приводит к ошибкам.
С учетом ограничений традиционных подходов, внедрение искусственных нейронных сетей (ИНС) представляет собой перспективное направление в области медицинской диагностики. ИНС могут обрабатывать большие объемы данных, выявлять сложные закономерности и предоставлять поддержку в принятии решений, что способствует повышению точности и скорости диагностического процесса.