Введение
1. Объект и предмет исследования
2.Цели и задачи
3. Методы прогнозирования артериального давления
4. Алгоритм предварительной обработки данных
Заключение
Список использованной литературы
Сердечно-сосудистые заболевания являются одной из главных причин смертности во всем мире. В среднем каждый третий человек умирает от болезней органов кровообращения. Для их предотвращения необходимо исследование гемодинамики, оценка влияния различных воздействий на организм и т.п. С этой целью создаются численные модели кровеносной системы.
Среди наиболее опасных ситуаций, которые возникают в палатах интенсивной терапии, являются эпизоды острой гипотензии, которые требуют эффективного оперативного вмешательства.
Артериальная гипотензия (гипотония) - это состояние, характеризующееся стойким понижением артериального давления. Различают физиологическую артериальную гипотензию и патологическую (острую и хроническую). Острая артериальная гипотензия развивается при острой сердечно-сосудистой или сосудистой недостаточности, при шоке различного генеза и коллапсе, при значительной кровопотере, интоксикациях и инфекционных заболеваниях, при тяжелой форме синдрома укачивания и при некоторых других патологических состояниях организма. Хроническая патологическая артериальная гипотензия бывает первичной (эссенциальной) и вторичной (симптоматической).
Первичная хроническая артериальная гипотензия зависит от нарушения функции высших вегетативных центров вазомоторной регуляции, в связи с чем происходит нарушение тонуса сосудов (дисфункция нервной и гуморальной системы) с нарушением микроциркуляции, капиллярной проницаемости и с нарушением реологических свойств крови.
Вторичная хроническая артериальная гипотензия зависит от какого-либо основного патологического процесса, определяющего пониженное артериальное давление. Клиническая симптоматика: на фоне конституционно или генетически обусловленной вегето-сосудистой дистонии возможно как повышение артериального давления, так и его понижение.
При отсутствии лечения, эпизоды острой артериальной гипотонии могут привести к необратимым повреждениям органов и смерти. Своевременные и надлежащие меры могут снизить эти риски, но неправильно выбранные мероприятия могут оказаться неэффективными или даже опасными. Определение того, что вмешательство уместно в каждом конкретном случае зависит от правильной диагностики причин возникновения эпизода, которыми могут быть сепсис, инфаркт миокарда, сердечная аритмия, легочная эмболия, кровоизлияния, обезвоживание, анафилаксия, влияние медикаментов, или любой из широкого спектра других причин гиповолемии, сердечной недостаточности или вазодиляторного шока. Часто наилучшим выбором может быть субоптимальное, но относительно безопасное вмешательство, просто для того, чтобы выиграть достаточно времени для выбора более эффективного лечения не подвергая больного на дополнительные риски.
Примерно у трети больных палат интенсивной терапии зарегистрированы случаи острой гипотонии. Уровень смертности для этих пациентов более чем в два раза выше, чем у остальных пациентов. Поэтому прогнозирование того, что можно ожидать эпизоды острой гипотензии, позволит создать возможность улучшения ухода за больными и увеличить вероятность выживания больных при наступлении этих эпизодов.
Целью моей магистерской работы является разработка информационной системы предсказания того, какие пациенты будут испытывать острый эпизод начала гипотензии в течении часа после текущего времени по временным рядам основных медицинских показателей.
Исходными данными для прогнозирования являются временные ряды среднего артериального давления (АВР) на минутных интервалах. Каждая запись временного ряда является средним значением артериального давления измеренного на лучевой артерии в течении минуты. По этим временным рядам необходимо определить тех пациентов, у которых будут наблюдаться эпизоды острой гипотензии. Эпизодами острой гипотензии будем считать любой период от 30 минут или более в течение которого, по меньшей мере, 90% всех измерений среднего артериального давления не поднималось выше 60 мм ртутного столба.
Для тестирования разрабатываемой системы взяты данные из базы данных MIMIC II Database [1] в которой содержится информация о 30000 больных палат интенсивной помощи.
Записи MIMIC II Database содержат большую часть информации, которая может появляться в медицинских отчетах, а также сигналы, которые доступны для наблюдения со стороны сотрудников палат интенсивной терапии. Другими словами MIMIC II Database является достаточно подробной для использования ее в исследованиях, которые могли бы потребовать доступ в палату интенсивной терапии. Поэтому эта база данных является хорошим источником информации для разработки и оценки диагностических и прогностических алгоритмов, и в частности для решения задачи моей магистерской работы.
3. Методы прогнозирования артериального давления
3.1 Модели сердечно-сосудистой системы человека
Современные «резервуарные» («компартментые») модели сердечнососудистой системы человека (СССЧ) инициированы, как известно, моделью Отто Франка, опубликованной в конце 19 века. Франк предложил представлять аорту в виде упругого резервуара, выполняющего функцию гемодинамического «демпфера» систолического потока крови из левого желудочка сердца. Теоретические исследования резервуарных моделей СССЧ стали популярными с середины 20 века и были ориентированы на разработку биологической концепции теории регулирования. Однако прикладные аспекты этой теории ограничивались выявлением зависимостей между средними («минутными») величинами давлений и потоков. Поэтому, в частности, отсутствует теория отношения конечного систолического давления (КСД) к конечному диастолическому давлению (КДД), которое широко используется в медицинской диагностике.
3.1.1 Однокамерная модель
Простейшая модель аорты и крупных артерий в виде общего упругого резервуара («камеры») аналитически задается системой трех линейных уравнений:
Согласно этим уравнениям, 1) скорость изменения «активного» объема камеры du/dt равна разности входного f
Система (1), содержащая одно линейное дифференциальное уравнение и два линейных алгебраических уравнений, допускает выделение одного обыкновенного дифференциального уравнения (ОДУ) относительно переменного давления p(t):
где α= 1/rc 1/ - фактор времени, а обратная величина τ - «постоянная времени».
В модели Франка источником крови служит входной поток f0(t) - заданная периодическая функция времени. Импульсы прямоугольной формы описывается функцией:
в 1-й формуле квадратные скобки обозначают функцию «целой части», 2-я формула определяет величину U ударного объема крови. Некоторые авторы представляют систолический поток импульсами параболической формы, тогда вместо (3) имеем поток:
Пусть в начальный момент времени p(0) ≡ p0 - известное конечное диастолическое давление (КДД), а p(T1) ≡ p1 - неизвестное конечное систолическое давление (КСД). Тогда, решая ОДУ (2) для импульсных потоков (3) и (4), получим пару функций, которые описывают изменения давления в смежных фазах систолы и диастолы,
t ∈[T1; T]: p(T)= pd(t)= p1 exp( -α(t-T1))+ P exp(- α(t-T1)); (5b)
где Exp(t) 1 - exp(t), а функция F(t) - вклад систолического импульса, который для импульсов прямоугольной и параболической форм определяется, соответственно, так:
Кусочно экспоненциальные описания двух фаз релаксационных колебаний давления, представленные парой функций (5a) и (5b), относятся к одному циклу. С целью получения многоциклового описания этих колебаний, пригодного для алгоритмического (компьютерного) построения графиков, следует использовать введенную выше «пилообразную » функцию времени θ(t), дополненную двумя логическими импликациями:
Из линейной связи выходного потока с давлением, см. 3-е уравнение (1), следует аналогичное функциональное описание релаксационных колебаний потока:
t ∈[T1; T]: f(t)= fd(t)= f1 exp( -α(t-T1)); (6b)
здесь f0≡ (p0- P)/ r - конечный диастолический поток (КДП), f1≡ (p0- P)/ r - конечный систолический поток (КСП).
3.1.2 Колебания давления и потока
Ударный объем такого параболического импульса, согласно (4), U = 80 мл - эта величина типична для гемодинамической нормы здорового человека. Чтобы прямоугольные импульсы обеспечивали такой же ударный объем, их амплитуду, см. (3) и (4), следует уменьшить в полтора раза. Используя решения (5) и (6), а также параметры (7), мы можем рекуррентным способом построить графики многоцикловых колебаний давления и потока для двух форм систолических импульсов (рис. 1). Из приведенных графиков видно, что при дополнительном условии равенства ударных объемов, выходные колебания потока для двух форм входных импульсов практически совпадают. В силу линейной связи, почти одинаковыми являются и графики колебаний давления на правом графике. Полученная теоретическая оценка отношения КСД/КДД≡ pes / ped = 128/82 дает величину ped = 82 ммHg, которая почти совпадает с начальным давлением p0 = 80 ммHg.
3.2 Методы прогнозирования временних рядов
3.2.1 Средние и скользящие средние
Самой простой моделью, основанной на простом усреднении является
Y(t+1)=(1/(t))*[Y(t)+Y(t-1)+...+Y(1)],
и в отличии от самой простой "наивной" модели, которой соответствовал принцип "завтра будет как сегодня", этой модели соответствует принцип "завтра будет как было в среднем за последнее время". Такая модель, конечно более устойчива к флуктуациям, поскольку в ней сглаживаются случайные выбросы относительно среднего. Несмотря на это, этот метод идеологически настолько же примитивен как и "наивные" модели и ему свойственны почти те же самые недостатки.
В приведенной выше формуле предполагалось, что ряд усредняется по достаточно длительному интервалу времени. Однако как правило, значения временного ряда из недалекого прошлого лучше описывают прогноз, чем более старые значения этого же ряда. Тогда можно использовать для прогнозирования скользящее среднее
Y(t+1)=(1/(T+1))*[Y(t)+Y(t-1)+...+Y(t-T)],
Смысл его заключается в том, что модель видит только ближайшее прошлое (на T отсчетов по времени в глубину) и основываясь только на этих данных строит прогноз.
При прогнозировании довольно часто используется метод экспоненциальных средних, который постоянно адаптируется к данным за счет новых значений. Формула, описывающая эту модель записывается как
Y(t+1)=a*Y(t)+(1-a)*^Y(t),
где Y(t+1) - прогноз на следующий период времени
Y(t) - реальное значение в момент времени t
^Y(t) - прошлый прогноз на момент времени t
a - постоянная сглаживания (0<=a<=1))
В этом методе есть внутренний параметр a, который определяет зависимость прогноза от более старых данных, причем влияние данных на прогноз экспоненциально убывает с "возрастом" данных.
Если производится прогнозирование с использованием модели экспоненциального сглаживания, обычно на некотором тестовом наборе строятся прогнозы при a=[0.01, 0.02, ..., 0.98, 0.99] и отслеживается, при каком a точность прогнозирования выше. Это значение a затем используется при прогнозировании в дальнейшем.
Хотя описанные выше модели (методы, основанные на средних, скользящих средних и экспоненциального сглаживания) используются при прогнозировании в не очень сложных ситуациях не рекомендуется использовать эти методы в задачах прогнозирования в виду явной примитивности и неадекватности моделей.
Вместе с этим хотелось бы отметить, что описанные алгоритмы вполне успешно можно использовать как сопутствующие и вспомогательные для предобработки данных в задачах прогнозирования. Например, для прогнозирования в большинстве случаев необходимо проводить декомпозицию временных рядов (т.е. выделять отдельно тренд, сезонную и нерегулярную составляющие). Одним из методов выделения трендовых составляющих является использование экспоненциального сглаживания.
3.2.2 Методы Хольта и Брауна
В середине прошлого века Хольт предложил усовершенствованный метод экспоненциального сглаживания, впоследствии названный его именем. В предложенном алгоритме значения уровня и тренда сглаживаются с помощью экспоненциального сглаживания. Причем параметры сглаживания у них различны.
Здесь первое уравнение описывает сглаженный ряд общего уровня. Второе уравнение служит для оценки тренда. Третье уравнение определяет прогноз на p отсчетов по времени вперед.
Постоянные сглаживания в методе Хольта идеологически играют ту же роль, что и постоянная в простом экспоненциальном сглаживании. Подбираются они, например, путем перебора по этим параметрам с каким-то шагом. Можно использовать и менее сложные в смысле количества вычислений алгоритмы. Главное, что всегда можно подобрать такую пару параметров, которая дает большую точность модели на тестовом наборе и затем использовать эту пару параметров при реальном прогнозировании.
Частным случаем метода Хольта является метод Брауна, когда a= β.
3.2.3 Метод Винтерса
Хотя описанный выше метод Хольта (метод двухпараметрического экспоненциального сглаживания) и не является совсем простым (относительно моделей, основанных на усреднении), он не позволяет учитывать сезонные колебания при прогнозировании. Говоря более строго, этот метод не может их "видеть" в предыстории. Существует расширение метода Хольта до трехпараметрического экспоненциального сглаживания. Этот алгоритм называется методом Винтерса. При этом делается попытка учесть сезонные составляющие в данных. Система уравнений, описывающих метод Винтерса выглядит следующим образом:
Дробь в первом уравнении служит для исключения сезонности из Y(t). После исключения сезонности алгоритм работает с "чистыми" данными, в которых нет сезонных колебаний. Появляются они уже в самом финальном прогнозе, когда "чистый" прогноз, посчитанный почти по методу Хольта умножается на сезонный коэффициент.
3.2.4 Регрессионные методы прогнозирования
Наряду с описанными выше методами, основанными на экспоненциальном сглаживании, уже достаточно долгое время для прогнозирования используются регрессионные алгоритмы. Коротко суть алгоритмов такого класса можно описать так.
Существует прогнозируемая переменная Y (зависимая переменная) и отобранный заранее комплект переменных, от которых она зависит - X1, X2, ..., XN (независимые переменные).
Модель множественной регрессии в общем случае описывается выражением
В более простом варианте линейной регрессионной модели зависимость зависимой переменной от независимых имеет вид:
Здесь β0, β1, β2, βN - подбираемые коэффициенты регрессии, ε- компонента ошибки. Предполагается, что все ошибки независимы и нормально распределены.
Для построения регрессионных моделей необходимо иметь базу данных наблюдений примерно такого вида:
№ | X1 | X2 | … | XN | Y |
1 | X11 | X12 | … | X1n | Y1 |
2 | X21 | X22 | … | X2n | Y2 |
… | … | … | … | … | … |
m | Xm1 | Xm2 | … | Xmn | Ym |
С помощью таблицы значений прошлых наблюдений можно подобрать (например, методом наименьших квадратов) коэффициенты регрессии, настроив тем самым модель.
При работе с регрессией надо соблюдать определенную осторожность и обязательно проверить на адекватность найденные модели. Существуют разные способы такой проверки. Обязательным является статистический анализ остатков, тест Дарбина-Уотсона. Полезно, как и в случае с нейронными сетями, иметь независимый набор примеров, на которых можно проверить качество работы модели.
3.2.5 Методы Бокса-Дженкинса (ARIMA)
В середине 90-х годов прошлого века был разработан принципиально новый и достаточно мощный класс алгоритмов для прогнозирования временных рядов. Большую часть работы по исследованию методологии и проверке моделей была проведена двумя статистиками, Г.Е.П. Боксом (G.E.P. Box) и Г.М. Дженкинсом (G.M. Jenkins). С тех пор построение подобных моделей и получение на их основе прогнозов иногда называться методами Бокса-Дженкинса. Более подробно иерархию алгоритмов Бокса-Дженкинса мы рассмотрим чуть ниже, пока же отметим, что в это семейство входит несколько алгоритмов, самым известным и используемым из них является алгоритм ARIMA. Он встроен практически в любой специализированный пакет для прогнозирования. В классическом варианте ARIMA не используются независимые переменные. Модели опираются только на информацию, содержащуюся в предыстории прогнозируемых рядов, что ограничивает возможности алгоритма. В настоящее время в научной литературе часто упоминаются варианты моделей ARIMA, позволяющие учитывать независимые переменные. В отличие от рассмотренных ранее методик прогнозирования временных рядов, в методологии ARIMA не предполагается какой-либо четкой модели для прогнозирования данной временной серии. Задается лишь общий класс моделей, описывающих временной ряд и позволяющих как-то выражать текущее значение переменной через ее предыдущие значения. Затем алгоритм, подстраивая внутренние параметры, сам выбирает наиболее подходящую модель прогнозирования. Как уже отмечалось выше, существует целая иерархия моделей Бокса-Дженкинса. Логически ее можно определить так
AR(p)+MA(q)->ARMA(p,q)->ARMA(p,q)(P,Q)->ARIMA(p,q,r)(P,Q,R)->...
AR(p) -авторегрессионая модель порядка p.
Модель имеет вид:
Y(t)=f_0+f_1*Y(t-1)+f_2*Y(t-2)+...+f_p*Y(t-p)+E(t)
где Y(t)-зависимая переменная в момент времени t. f_0, f_1, f_2, ..., f_p - оцениваемые параметры. E(t) - ошибка от влияния переменных, которые не учитываются в данной модели. Задача заключается в том, чтобы определить f_0, f_1, f_2, ..., f_p. Их можно оценить различными способами. Правильнее всего искать их через систему уравнений Юла-Уолкера, для составления этой системы потребуется расчет значений автокорреляционной функции. Можно поступить более простым способом - посчитать их методом наименьших квадратов.
MA(q) -модель со скользящим средним порядка q.
Модель имеет вид:
Y(t)=m+e(t)-w_1*e(t-1)-w_2*e(t-2)-...-w_p*e(t-p)
Где Y(t)-зависимая переменная в момент времени t. w_0, w_1, w_2, ..., w_p - оцениваемые параметры.
3.2.6 Нейросетевые модели прогнозирования
В настоящее время, на мой взгляд, самым перспективным количественным методом прогнозирования является использование нейронных сетей. Можно назвать много преимуществ нейронных сетей над остальными алгоритмами, ниже приведены два основных.
При использовании нейронных сетей легко исследовать зависимость прогнозируемой величины от независимых переменных.
Еще одно серьезное преимущество нейронных сетей состоит в том, что эксперт не является заложником выбора математической модели поведения временного ряда. Построение нейросетевой модели происходит адаптивно во время обучения, без участия эксперта. При этом нейронной сети предъявляются примеры из базы данных и она сама подстраивается под эти данные.
Недостатком нейронных сетей является их недетерминированность. Имеется в виду то, что после обучения имеется "черный ящик", который каким-то образом работает, но логика принятия решений нейросетью совершенно скрыта от эксперта. В принципе, существуют алгоритмы "извлечения знаний из нейронной сети", которые формализуют обученную нейронную сеть до списка логических правил, тем самым создавая на основе сети экспертную систему. К сожалению, эти алгоритмы не встраиваются в нейросетевые пакеты, к тому же наборы правил, которые генерируются такими алгоритмами достаточно объемные.
Тем не менее, для людей, умеющих работать с нейронными сетями и знающими нюансы настройки, обучения и применения, в практических задачах непрозрачность нейронных сетей не является сколь-нибудь серьезным недостатком.
Самый простой вариант применения искусственных нейронных сетей в задачах прогнозирования - использование обычного персептрона с одним, двумя, или (в крайнем случае) тремя скрытыми слоями. При этом на входы нейронной сети обычно подается набор параметров, на основе которого (по мнению эксперта) можно успешно прогнозировать. Выходом обычно является прогноз сети на будущий момент времени.
Еще одной часто используемой нейросетевой архитектурой, используемой в прогнозировании является нейронная сеть с общей регрессией. Несмотря на то что принцип обучения и применения таких сетей в корне отличается от обычных персептронов, внешне сеть используется таким же образом, как и обычный персептрон. Говоря другими словами, это совместимые архитектуры в том смысле, что в работающей системе прогнозирования можно заменить работающий персептрон на сеть с общей регрессией и все будет работать. Не потребуется проводить никаких дополнительных манипуляций с данными.
Если персептрон во время обучения запоминал предъявляемые примеры постепенно подстраивая свои внутренние параметры, то сети с общей регрессией запоминают примеры в буквальном смысле. Каждому примеру - отдельный нейрон в скрытом слое сети, а затем, во время применения сеть сравнивает предъявляемый пример с примерами, которые она помнит. Смотрит, на какие из них текущий пример похож и в какой степени и на основе этого сравнения выдаст ответ.
Отсюда следует первый недостаток такой архитектуры - когда база данных которые мы прогнозируем велика, сеть станет слишком большой и будет медленно работать. С этим можно бороться предварительной кластеризацией базы данных.
4.1 Описание обучающей и тестовой выборки
В качестве обучающей выборки взяты 30 записей из базы данных MIMIC II Database. Эти записи разбиты на 2 группы: группа C, в которую входят записи пациентов у которых не наблюдалось эпизодов острой артериальной гипотензии, и группа H, в которую вошли записи пациентов переживших эпизод острой артериальной гипотензии в течении получаса после контролируемого периода.
Тестовая выборка состоит из десяти записей взятых из базы данных MIMIC II Database. Половина из этих записей - это записи пациентов, переживших эпизод острой артериальной гипотензии в течения получаса после контрольного времени, а другая половина - записи пациентов, у которых не наблюдались эпизоды острой артериальной гипотензии.
Эта выборка будет использоваться для контроля разрабатываемых алгоритмов.
4.2 Программа формирования временных рядов
На языке Си с использованием специального API для работы с базой данных MIMIC II Database была разработана программа, которая определяет максимальное артериальное давление в период сокращение левого и правого желудочков (систола), и минимальное давление в период расслабления (диастола). Кроме того программа определяет длительности этих периодов сердечного цикла.
В работе дана постановка задачи прогнозирования эпизодов острой артериальной гипотензии у пациентов палат интенсивной терапии. Прогнозирование должно осуществляться на основе данных доступных медицинскому персоналу палат интенсивной терапии. Для разработки системы прогнозирования в качестве исходных данных предложено использовать базу данных физиологических сигналов PhysioNet.
Кроме этого был произведен анализ медицинской научной литературы с целью изучения вопросов связанных с артериальным давлением человека.
Проанализированы факторы, влияющие на артериальное давление. выделены следующие факторы: величнина сердечного выброса, минутный объем крови,частота сердцебиений, сопротивление артериол, ширина просвета капилляров и вен, количество и вязкость крови, сосудистый тонус, гуморальная система организма.
1. The MIMIC II Database http://www.physionet.org/physiobank/database/mimic2db/
2. Chao-Shun Lin, Jainn-Shiun Chiu,Ming-Hui Hsieh, Martin S. Mok, Yu-Chuan Li, Hung-Wen Chiu. Predicting hypotensive episodes during spinal anesthesia with the application of artificial neural networks. Comput. Methods Prog. Biomed. v98 i2. 193-197.
3. Frolich, M.A. and Caton, D., Baseline heart rate may predict hypotension after spinal anesthesia in prehydrated obstetrical patients. Can. J. Anaesth. v49 i2. 185-189.
4. Tarkkila, P. and Isola, J., A regression model for identifying patients at high risk of hypotension, bradycardia and nausea during spinal anesthesia. Acta Anaesthesiol. Scand. V36. 554-558.
5. Subasi, A. and Er?elebi, E., Classification of EEG signals using neural network and logistic regression. Comput. Methods Programs Biomed. V78. 87-99.
6. Hanss, R., Bein, B., Weseloh, H., Bauer, M., Cavus, E., Steinfath, M., Scholz, J. and Tonner, P.H., Heart rate variability predicts severe hypotension after spinal anesthesia. Anesthesiology. v104. 537-545.
7. Учебник физиологии (Быков, Владимиров, Делов, Конради, Слоним). Медгиз 1955 год;
8. Патологическая физиология (А.Д. Адо, М.А. Адо и др.);
9. Офтальмологическая симптоматика при врожденных и приобретенных заболеваниях (М.Д. Агатова).
10. Анатомия человека. С.С.Михайлов, Л.Л.Колесников, В.С.Братаков. 3-е изд., перераб. и дополн. - М.:Медицина, 1999 - 735с.
11. Анатомия человека. В 2-х томах. Т.2. Э.И.Борзяк, В.Я.Бочаров, М.Р.Сапин и др. Под ред. М.Р.Сапина. - 2-е изд. перераб. и доп. - М.:Медицина, 1993 - 560с.
12. Максимов В.И. Основы анатомии и физиологии человека. М.: КолосС, 2004 - 167с.