Ссылка: Гембицкий А.В. Интеграция моделей машинного обучения в сферу здравоохранения / А.В. Гембицкий, И.А. Коломойцева // VIII Международная научно-техническая конференция Современные информационные технологии в образовании и научных исследованиях
(СИТОНИ-2023) - 2023 - №4 - С.200-204
Автор: Коломойцева И. А., Гембицкий А. В.
Источник: VIII Международная научно-техническая конференция Современные информационные технологии в образовании и научных исследованиях
(СИТОНИ-2023)
Коломойцева И. А., Гембицкий А. В. Интеграция моделей машинного обучения в сферу здравоохранения. Исследование направлено на анализ перспективного влияния интеллектуальных систем в области здравоохранения. Развитие компьютерной диагностики, оптимизация планов лечения с использованием машинных алгоритмов, постоянный мониторинг жизненных функций и эффективный анализ медицинских данных обещают улучшение точности диагностики и снижение человеческих ошибок. Эти технологии могут существенно сократить смертность от сердечно-сосудистых заболеваний и повысить продолжительность жизни. Однако для успешной реализации необходима цифровая трансформация медицинских данных и переход к информационным системам в больницах.
Современное здравоохранение сталкивается с растущей необходимостью использования передовых технологий для оптимизации процессов, повышения точности диагностики и эффективности лечения.
Одной из наиболее актуальных областей, привлекающих внимание исследователей и практиков на сегодняшний день, является интеграция моделей машинного обучения в медицину.
На протяжении последних десятилетий мы стали свидетелями стремительного развития методов машинного обучения, от классических алгоритмов до глубоких нейронных сетей. Эти технологии показывают потенциал трансформации здравоохранения, предоставляя инструменты для анализа массивных объемов медицинских данных и выявления скрытых закономерностей.
Однако, несмотря на значительные достижения, существует ряд проблем, мешающих эффективному внедрению моделей машинного обучения в практику здравоохранения. Среди них - сложности в обеспечении конфиденциальности и безопасности медицинских данных, недостаточная интерпретируемость моделей, а также трудности в их интеграции в существующие клинические процессы.
Цель статьи - проанализировать текущее состояние исследований в области интеграции моделей машинного обучения в сферу здравоохранения, выявить препятствия на пути их успешного внедрения, а также предложить перспективные стратегии для преодоления данных трудностей.
В области здравоохранения применяются различные методы машинного обучения. Наиболее распространенными считаются: логистическая регрессия, метод опорных векторов, глубокие нейронные сети, решающие деревья, случайные леса, кластеризация методом k-средних, методы обработки естественного языка и байесовские методы.
Логистическая регрессия — это метод машинного обучения, применяемый для бинарной классификации и оценки вероятности принадлежности объекта к определенному классу. В отличие от обычной линейной регрессии, логистическая регрессия использует логистическую функцию для преобразования выхода в диапазон от 0 до 1. Модель обучается на основе весов признаков, предсказывая вероятность принадлежности объекта к классу 1. Эффективна в задачах, где требуется разделение на два класса, таких как медицинская диагностика.
Метод опорных векторов (SVM) — это метод машинного обучения, применяемый для задач классификации и регрессии. Он стремится построить оптимальную гиперплоскость, которая максимально разделяет объекты разных классов в признаковом пространстве. SVM особенно эффективен в пространствах высокой размерности и может использоваться с ядерными функциями для работы с нелинейными данными. Этот метод широко применяется в областях, таких как распознавание образов, анализ текстов и биоинформатика.
Метод глубоких нейронных сетей (Deep Neural Networks, DNN) представляет собой модель машинного обучения, вдохновленную биологической структурой мозга. Он состоит из многочисленных слоев нейронов, где каждый слой обрабатывает определенные характеристики данных. Глубокие нейронные сети успешно применяются в задачах распознавания образов, обработки естественного языка, компьютерного зрения и других областях. Обучение таких сетей требует большого объема размеченных данных и обычно выполняется с использованием алгоритмов обратного распространения ошибки. Глубокие нейронные сети считаются мощным инструментом для решения сложных задач в машинном обучении.
Метод решающих деревьев представляет собой модель, которая использует древовидную структуру для принятия решений. Каждый узел дерева представляет собой тест по одному из признаков данных, а каждая ветвь - возможный результат этого теста. Цель состоит в том, чтобы разделить данные на подгруппы таким образом, чтобы в каждой подгруппе объекты были максимально однородными по отношению к целевой переменной. Решающие деревья применяются в задачах классификации и регрессии, а их преимущества включают интерпретируемость и способность работать с различными типами данных, в том числе категориальными. Однако, они могут быть склонны к переобучению, что требует применения стратегий обрезки или ансамблевых методов, таких как случайные леса.
Метод случайных лесов (Random Forests) представляет собой ансамбль решающих деревьев. Он создается путем построения нескольких деревьев на различных подмножествах данных и случайных подмножествах признаков. Каждое дерево вносит свой вклад в принятие решения, и затем результат усредняется или принимается голосованием. Случайные леса широко используются для задач классификации и регрессии. Их преимущества включают устойчивость к переобучению, способность обрабатывать большое количество данных и эффективность при работе с разнотипными признаками. Этот метод также поддерживает оценку важности признаков, что делает его полезным инструментом в анализе данных.
Метод кластеризации k-средних используется для группировки набора данных на k кластеров на основе их сходства. Алгоритм итеративно присваивает точки данных ближайшему центру кластера и обновляет центры, минимизируя среднее квадратичное расстояние между точками и центрами кластеров. K-средних подходит для разделения данных на группы, когда количество кластеров известно заранее. Он широко используется в области маркетинга, биологии, обработки изображений и других областях, где требуется выделение скрытых паттернов в данных.
Метод обработки естественного языка (Natural Language Processing, NLP) направлен на разработку алгоритмов, способных понимать, интерпретировать и взаимодействовать с человеческим языком. NLP включает в себя широкий спектр задач, таких как распознавание речи, машинный перевод, извлечение информации, классификация текстов и генерация текста. Этот метод играет ключевую роль в создании систем, способных анализировать и взаимодействовать с текстовой информацией, что делает его востребованным в приложениях, таких как виртуальные ассистенты, поисковые системы, анализ социальных медиа и других областях, где важна обработка текстовых данных.
Метод временных направлен на анализ и прогнозирование изменений в данных в зависимости от времени. Он используется для моделирования временных шаблонов, трендов и сезонных колебаний в данных, таких как ежедневные температуры, финансовые показатели или производственные объемы. Методы временных рядов включают в себя анализ автокорреляции, выявление цикличности и использование моделей, таких как ARIMA (авторегрессионная интегрированная скользящая средняя) и LSTM (долгая краткосрочная память) нейронные сети. Этот метод находит применение в прогнозировании будущих значений временных данных, что полезно в финансах, экономике, метеорологии и других областях.
Байесовский метод основан на теореме Байеса и принципе байесовского вывода. Он использует вероятностные модели для оценки вероятности событий и обновления этих оценок при получении новой информации. Байесовский метод применяется в задачах классификации, регрессии и кластеризации, позволяя учитывать неопределенность в данных и принимать решения на основе вероятностных выводов. Преимущества включают адаптивность к новым данным и способность обрабатывать ограниченные обучающие выборки. Этот метод находит применение в медицине, финансах, анализе текстов и других областях, где важна оценка вероятностей и учет неопределенности.
В зависимости от цели данные методы могут применятся по одиночке или в различных комбинациях, что может привести к существенному увеличению их эффективности.
На текущий момент написано большое количество работ, которые тем или ины образом затрагивают тему машинного обучения в сфере здравоохранения. Ниже приведено краткое описание наиболее интересных из них.
В [1] приводится классификация схем машинного обучения в здравоохранении. Методы машинного обучения и выявление похожей проблемы представлены в [2].
В работе [3] рассматривается использование машинного обучения при разработке лекарств, а также проблемы, связанные с интерпретацией и валидацией данных, и этические проблемы, связанные с использованием искусственного интеллекта в клинических исследованиях.
В [4] проводится анализ и разработка программного комплекса для внедрения алгоритма, базирующегося на системах многозначной логики. Сравнения архитектурных характеристик подходов машинного обучения с радиомиками и глубоким обучением нейронных сетей приведены в [5].
В работе [6] рассматриваются общие достижения и планы внедрения искусственного интеллекта в Российскую медицину. В [7] раскрыты ключевые преимущества и риски использования моделей машинного обучения.
В [8] показано применение в медицине, алгоритмов включающих регуляризованную общую линейную модель регрессии, машины опорных векторов с ядром радиальной базисной функции и однослойные искусственные нейронные сети.
В приведенных выше работах рассматриваются и реализуются крайне перспективные методы машинного обучения, способные значительно повысить качество диагностики и лечения. Однако в них практически не затрагивается текущее положение дел и приспособленность сферы здравоохранения для их внедрения. Данная статья ставит перед собой задачу предложения некоторых стратегий позволяющих успешную интеграцию вышеописанных методов в современную медицину.
Один из основных вызовов при внедрении методов машинного обучения в медицину связан с отсутствием необходимого компьютерного оборудования в больницах и использованием устаревших методов хранения медицинских карт. Первоочередной шаг заключается в обеспечении больниц современными вычислительными средствами. Однако, переход к электронному хранению данных требует установления единой базы данных для всех медицинских учреждений, учитывая, что данные одной поликлиники недостаточны для полноценного обучения нейронных сетей.
Для решения этой проблемы, необходимо оцифровать все существующие медицинские карты. Введение нескольких сканеров в каждую больницу может занять продолжительное время, и в этом контексте разумным решением является использование крупных многоканальных сканеров, способных эффективно обрабатывать несколько карт параллельно.
Однако, реализация этих шагов также влечет за собой юридические сложности. Помимо обеспечения анонимности данных при обучении моделей, необходима всесторонняя поддержка и регуляция со стороны государства. Успешное разрешение этих вопросов сделает возможным эффективное внедрение машинного обучения в медицинскую практику.
Проведя анализ текущих интеллектуальных систем в сфере здравоохранения, можно утверждать, что основное направление развития технологий связано с компьютерной диагностикой. Однако для реализации этих технологий требуется обширный объем данных, который можно получить путем оцифровывания медицинских карт и перехода к информационным системам в больницах, что упростит сбор и обработку данных. Применение алгоритмов машинного обучения приведет к значительному ускорению диагностики и снижению человеческих ошибок. Внедрение этих технологий снизит смертность, ускорит поиск новых лекарств и, вероятно, увеличит продолжительность жизни.
1. Rahmani A.M. Machine Learning (ML) in Medicine: Review, Applications, and Challenges / A.M. Rahmani, E. Yousefpoor, M.S.Yousefpoor, Z. Mehmood, A.H. Malik, M. Hosseinzadeh, R.A. Naqvi // Mathematics, 2021. Vol. 9(22) – PP. 52. URL: https://www.researchgate.net/publication/356379003_Machine_Learning_ML_in_Medicine_Review_Applications_and_Challenges.
2. Бишоп, К. М. Машинное обучение и распознавание образов / К. М. Бишоп. - М.: Диалектика, 2020. - №2 - 960 c.
3. Peng J. Machine Learning Techniques for Personalised Medicine Approaches in Immune-Mediated Chronic Inflammatory Diseases: Applications and Challenges / J. Peng, E.C. Jury, P. Donnes, C. Ciurtn // Inflammation Pharmacology, 2021. Vol. 12 – PP. 18. URL: https://www.frontiersin.org/articles/10.3389/fphar.2021.720694/full.
4. Лютикова Л.А. Применение метода машинного обучения для решения задачи медицинской диагностики / Л.А. Лютикова, Е.В. Шматова // Известия Кабардино-Балкарского научного центра РАН, 2021 - №6 (104) - С. 58-65.
5. Castigloni I. AI applications to medical images: From machine learning to deep learning / I. Castigloni, L. Rundo, M. Codari, G. Di Leo, C. Salvatore, M. Interlenghi, F. Gallivannone, A. Cozzi, N.C. D’Amico, F. Sardanelli // European Journal of Medical Physics, 2021. Vol. 83 – PP. 16. URL: https://www.physicamedica.com/action/showPdf?pii=S1120-1797%2821%2900094-6.
6. Алексеева М.Г. Искусственный интеллект в медицине / М.Г. Алексеева, А.И. Зубов, М.Ю. Новиков // Международный научно-исследовательский журнал, 2022 - №7 (121) – C. 10-13.
7. Saria S Better medicine through machine learning: What’s real, and what’s artificial? / S. Saria, A. Butte, A. Sheikh // PLoS Med, 2018. Vol. 15(12) URL: https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.1002721.
8. Sidey-Gibbons J.A.M. Machine learning in medicine: a practical introduction / J.A.M. Sidey-Gibbons, C.J. Sidey-Gibbons // BMC Medical Research Methodology, 2019. Vol. 64 – PP. 18. URL: https://bmcmedresmethodol.biomedcentral.com/articles/10.1186/s12874-019-0681-4.
Коломойцева И. А., Гембицкий А. В. Интеграция моделей машинного обучения в сферу здравоохранения. Исследование направлено на анализ перспективного влияния интеллектуальных систем в области здравоохранения. Развитие компьютерной диагностики, оптимизация планов лечения с использованием машинных алгоритмов, постоянный мониторинг жизненных функций и эффективный анализ медицинских данных обещают улучшение точности диагностики и снижение человеческих ошибок. Эти технологии могут существенно сократить смертность от сердечно-сосудистых заболеваний и повысить продолжительность жизни. Однако для успешной реализации необходима цифровая трансформация медицинских данных и переход к информационным системам в больницах.
Ключевые слова: методы машинного обучения, здравоохранение, медицина, интеграция, нейронная сеть, исследование.
Kolomoiceva I. A., Gembickiy A. V. Integration of machine learning models in the field of healthcare. The research is aimed at analyzing the prospective impact of intelligent systems in the field of healthcare. The development of computer diagnostics, optimization of treatment plans using machine algorithms, constant monitoring of vital functions and effective analysis of medical data promise to improve diagnostic accuracy and reduce human errors. These technologies can significantly reduce mortality from cardiovascular diseases and increase life expectancy. However, the successful implementation requires the digital transformation of medical data and the transition to information systems in hospitals.
Keywords: machine learning methods, healthcare, medicine, integration, neural network, research.