Автореферат
>ENG >RUSВведение
Одной из основных задач, стоящих перед врачом, является диагностика заболевания. Для этого необходимо отнести больного к одному из нескольких классов – например, "болен" и "здоров" – на основании данных о его текущем состоянии и истории болезни, т.е. решить задачу классификации. Построить систему, проводящую полную диагностику больного, достаточно сложно, поэтому, как правило, больного исследуют по определенному профилю. Соответственно, количество факторов, на основании которых такой диагноз может быть вынесен, существенно снижается, что позволяет повысить скорость и точность работы алгоритма.
Человеческий организм – высокоточный биологический механизм, который четко и, главное, довольно предсказуемо реагирует на различные факторы. Однако для того, чтобы верно спрогнозировать развитие болезни и шансы больного на выздоровление, необходимо оценивать большое количество факторов. Аналитическая система в данном случае призвана помочь поставить верный диагноз, от которого кардинальным образом будет зависеть методика лечения. Не претендуя на роль опытного врача, безошибочно ставящего диагноз, подобная система может оказаться весьма действенным помощником для специалиста, который и будет выносить окончательное решение. Практика показывает, что подобное сотрудничество человека и аналитической системы может быть весьма продуктивно.
Цель и задачи работы
Прогнозирование – одна из самых востребованных, но при этом и самых сложных, задач анализа. Проблемы при ее решении обусловлены многими причинами – недостаточное качество и количество исходных данных, изменения среды, в которой протекает процесс, воздействие субъективных факторов. Задача прогнозирования в общем случае сводится к получению оценки будущих значений упорядоченных во времени данных на основе анализа уже имеющихся данных. Существуют различные алгоритмы поиска закономерностей в существующих данных. Наряду со стандартными методами, использующими параметрические модели, в последнее время для этих целей стали применяться другие подходы, в частности, нейросетевые и эволюционные методы.
Прогнозирование является не разовой операцией, а процессом, в ходе которого необходимо решать задачи сбора и консолидации исходных данных, очистки и построению моделей, визуализации и верификации результатов.
Тема моей магистерской работы звучит как «СКС эволюционного прогнозирования ревматоидного артрита». В связи с этим были проанализированы материалы, связанные с диагностикой и лечением данного заболевания. Необходимо отметить, что комплексных работ по прогнозированию течения заболевания и стратегий его лечения было проведено очень немного, что связанно с различными практическими трудностями вследствие недостаточной изученности природы заболевания.
Обзор существующих исследований
Ревматоидный артрит (РА) по праву считается центральной проблемой современной ревматологии, поскольку это заболевание является наиболее распространенным во всем мире и наиболее тяжелым из воспалительных заболеваний суставов. РА характеризуется существенным снижением показателей качества жизни и представляет собой чрезвычайно серьезную социально-экономическую проблему даже в таких экономически развитых странах мира, как США.
Исследование иммунологических нарушений при РА открывает большие перспективы для усовершенствования методов диагностики и понимания клинической гетерогенности болезни, продолжаются поиски новых методов, адекватно отражающих иммунный статус при различных клинических вариантах ревматоидного артрита.
Исследования 60-70-х годов, хотя и способствовали лучшему пониманию влияния центральной (ЦНС) и периферической нервной системы (ПНС) (особенно симпатического отдела последней) на активность клинических проявлений РА и других аутоиммунных ревматических заболеваний, все же не привели к разработке принципиально новых методов базисной терапии, а интенсивность публикаций по данной теме существенно уменьшилась.
Своеобразный ренессанс в изучении роли нервной системы в возникновении и течении аутоиммунных заболеваний – последнее десятилетие. Одной из причин этого является появление новых сведений относительно медиаторов (трансмиттеров и котрансмиттеров) ПНС и ЦНС, в том числе принадлежащих к системе так называемых нейропептидов.
Пептиды известны уже достаточно давно. Среди них такие хорошо изученные, как ангиотензин II, эндотелин, вазопрессин (антидиуретический гормон), брадикинин и другие кинины (к которым относят группу активных сосудорасширяющих пептидов), предсердный натрийуретический пептид и др.
Нейропептиды (за исключением адренокортикотропного и кортикотропинрилизинг гормонов) изучены значительно хуже, а их функциональное значение до сих пор окончательно не ясно. Среди нейропептидов выделяют такие, как субстанцию Р, пептид связанный с геном кальцитонина (кокальцигенин, calcitonin generelated peptide, CGRP), гастринрилизинг-пептид (GRP), нейропептид Y (neuropeptide Y, NPY), вазоактивный кишечный пептид (VIP), нейротензин. Вначале было изучено влияние нейропептидов на сосудистый тонус различных сосудистых бассейнов организма (вазоконстрикция или вазодилатация). Однако впоследствии обнаружено, что некоторые из них принимают активное участие в воспалительных процессах.
Моделирование системы нейропептидов/нейропептидаз можно использовать в лечении больных. Нейропептиды, выделяющиеся in situ, имеют большое аутокринное и паракринное влияние на синовиальное микроокружение.
Пример потенциальных возможностей нейропептидов в лечении суставного воспаления – соматостатин. Этот пептид ингибирует выделение субстанции Р из нервных окончаний, имеет мощное противовоспалительное действие при экспериментальном артрите, способен ингибировать аберрантную функцию синовиальных клеток у больных РА, проявляет хороший эффект при внутрисуставном использовании при РА с уменьшением толщины синовии, и активно участвует в мощном противовоспалительном действии глюкокортикоидов при PA.
Благоприятное влияние на воспаление других нейропептидов, в особенности кокальцигенина и вазоактивного интестинального пептида, который может ингибировать пролиферацию ревматоидных синовиоцитов и продукцию ими прововоспалительных цитокинов и металлопротеиназ, может свидетельствовать о возможности применения в будущем этих пептидов в лечении ревматоидного и других артритов.
Так как задача прогнозирования и выбора правильных стратегий лечения должна базироваться на каких-то данных, полученных опытным путем, то были найдены реальные клинические данные, полученные в ИНВХ им. Гусака. Обучающая выборка состоит примерно из 80-ти человек, причем около 30 пациентов обладают полным набором данных, а остальные – нет, что свойственно для медицинских данных. Данные предоставляют информацию по различным показателям в динамике течения заболевания. Вводятся различные вычисляемые параметры, призванные помочь оценить состояние больного.
Обзор используемых прогностических методов
Методы извлечения новых знаний, применяемые в интеллектуальном анализе данных (ИАД), весьма различны – это и статистические процедуры, генетические алгоритмы, нейронные сети, деревья решений, индуктивное логическое программирование и т.д. Общим обстоятельством в различных реализациях ИАД является то, что данные недостаточно формализованы, но извлекаемость из них посредством компьютерных программ новых полезных знаний возможна. Для выбора математического аппарата, способного адекватно решить поставленные выше задачи были проанализированы многочисленные литературные источники. Для задач такого типа наиболее подходящим является математический аппарат искусственных нейронных сетей и эволюционных алгоритмов (ЭА). В последние годы проведено множество практических реализаций в этой сфере. Тенденцией стало применение ИНС, тогда как ЭА применяются куда реже и то в основном в задачах оптимизации, а не предикции. Поэтому с научной точки зрения, предпочтительней будет реализовать в данной работе ЭА и затем сравнить его эффективность с ИНС. Такая стратегия не потребует больших временных затрат для реализации собственно программного комплекса моделирования ИНС. В наши дни существует множество различных прикладных программ и математических пакетов, которые успешно реализуют основные парадигмы нейронных сетей. Поэтому сравнение эффективности ЭА и ИНС для данной конкретной задачи будет особенно интересно, так как опыта использования ЭА в предикции мало.
ЭА обладают следующими достоинствами и недостатками.
Достоинства ЭА:
Недостатки ЭА:
В силу ряда причин для реализации в создаваемой СКС эволюционного прогнозирования выбран такой тип эволюционного алгоритма, как генетический алгоритм. Генетические алгоритмы (ГА) есть поисковые алгоритмы, основанные на механизмах натуральной селекции и натуральной генетики. Они реализуют «выживание сильнейших» среди рассмотренных структур, формируя и изменяя поисковый алгоритм на основе моделирования эволюции. Простой генетический алгоритм был впервые описан Гольдбергом на основе работ Холланда. Механизм простого ГА (ПГА) несложен. Он копирует последовательности и переставляет их части. Предварительно ГА случайно генерирует популяцию последовательностей – стрингов (хромосом). Затем ГА применяет множество простых операций к начальной популяции и генерирует новые популяции.
Во многих проблемах имеются специальные знания, позволяющие построить апроксимационную модель. При использовании ГА это может уменьшить объем и время вычислений и упростить моделирование функций, сократить число ошибок моделирования. ГА – это мощная стратегия выхода из локальных оптимумов. Она заключается в параллельной обработке множества альтернативных решений с концентрацией поиска на наиболее перспективных из них. Причем периодически в каждой итерации можно проводить стохастические изменения в менее перспективных решениях. Предложенные схемы эффективно используются для решения задач искусственного интеллекта и комбинаторно-логических задач на графах. ГА позволяют одновременно анализировать некоторое подмножество решений, формируя квазиоптимальные решения. Временная сложность алгоритмов зависит от параметров генетического поиска и числа генераций.
Для упрощения построения адекватной модели, задача прогнозирования и выбора стратегий лечения в данной работе разбивается на несколько этапов. Первично прослеживается зависимость между состоянием больного, назначенным лечением и содержанием трех нейропептидов в крови больного. То есть на данном этапе стоит скорее задача классификации. Затем анализируются остальные данные и выбираются наиболее значимые. После этого осуществляется переход к созданию модели, способной выдавать заключение о прогнозе и стратегиях лечения ревматоидного артрита на основе входных данных, т.е. первый этап – классификация имеющихся данных, определение их значимости для решения поставленной задачи. Второй этап – построение прогностической модели и системы принятия решений касательно стратегий лечения.
Планируемые результаты
Структура магистерской работы в целом соответствует этапам, которые были приведены выше. Вначале производится фильтрация и отбор данных из обучающей выборки, затем создается собственная программная реализация эволюционного алгоритма. Для реализации выбран такой вид ЭА как генетический алгоритм. После создания рабочей системы эволюционного моделирования производится обработка имеющихся данных. На этом этапе программная реализация постепенно адаптируется к данной конкретной предметной области. После отладки программного комплекса и тестирования его на реальных данных, происходит получение рабочей модели, с помощью которой будут искаться стратегии для лечения ревматоидного артрита и прогнозирования течения заболевания. Затем планируется создание ИНС и обучение ее теми же данными, которые используются при создании эволюционной модели. После получения адекватно работающей ИНС станет возможным сравнение эффективности двух методов. Если ЭА окажется достаточно эффективным, то возможна дальнейшая разработка и усовершенствование прогностической системы на основе генетического алгоритма. В дальнейшем, после продолжительного тестирования и доказанной адекватности предлагаемых системой стратегий лечения возможно ее внедрение в медицинских учреждениях страны, публикация различных научных работ.
Заключение
Как уже отмечалось, ревматоидный артрит считается центральной проблемой современной ревматологии, поскольку данное заболевание является наиболее распространенным во всем мире и наиболее тяжелым из воспалительных заболеваний суставов. Вследствие этого, практическая ценность и востребованность разрабатываемой системы, в случае успешной ее реализации, несомненна.
Список литературы