Автореферат к магистерской работе Актуальность Актуальность.С появлением вычислительной техники, а также медицинской аппаратуры, включающей в себя вычислительные функции, появилось понятие автоматизированного рабочего места медперсонала. Данная работа посвящена созданию специализированной компьютерной системы диагностики синдрома жировой эмболии. Жировая эмболия - это множественная окклюзия кровеносных сосудов каплями жира. Одно из самых грозных и тяжелых осложнений раннего периода травматической болезни. Первое упоминание о жировой эмболии относится к 1862 году, термин “жировая эмболия” был использован Ценкером, который обнаружил жировые капли в капиллярах легких мужчины, погибшего от скелетной травмы. В дальнейшем исследования жировой эмболии продолжили: R. Virchow в 1862 г., L .Aschoff в 1893 году сформулировал механическую теорию происхождения жировой эмболии, E. Lehman в 1927 году предложил коллоидно - химическую теорию, F. Noller в 1964 году выдвинул концепцию возникновения жировой эмболии на фоне травматического шока, L. Gelin в 1967 году установил дезэмульгирование липидов при травмах, а S. Bergents в 1971 году связал нарушения в свертывающей системе с жировой эмболией. Прогресс в изучении жировой эмболии был крайне неравномерен и заторможен, зачастую высказывались прямо противоположные мнения об этиологии, патогенезе и лечении. Лишь последние 20 лет резко возрос интерес к проблеме, что, очевидно, связано с ростом травматизма. Госпитальная летальность среди пострадавших с механической травмой остается высокой, составляя по данным различных авторов от 25 до 59%. Причиной этому является как тяжесть полученных повреждений, так и развитие осложнений, которые нередко принимают ведущее значение в течение травматической болезни и определяют ее исход. Высокая летальность объясняется тем, что на сегодняшний день механизмы развития синдрома жировой эмболии остаются недостаточно изученными, что влечет за собой, в ряде случаев, неэффективность профилактики и лечения. В современной литературе, в основном, рассматриваются узкие вопросы, касающиеся диагностики и лечения синдрома жировой эмболии (СЖЭ). Предлагаемые диагностические тесты направлены на выявление клинических симптомов СЖЭ. Лишь единичные работы представляют проблему синдрома жировой эмболии концептуально, с позиций учения о травматической болезни и учетом метаболических сдвигов, происходящих в организме в ответ на травму [1]. Актуальность подобной разработки в сфере медицинской диагностики достаточно очевидна в силу того, что потребность в квалифицированных специалистах по многим медицинским специальностям, зачастую, значительно превышает предложение. Обзор существующих исследований.На сегодняшний день отсутствуют программные средства, позволяющих диагностировать СЖЭ (возможно имеются отдельные работы, но они не зарегистрированы), поэтому рассмотрим применяемые методы математического моделирования, используемые при построении аналогичных систем. Неявные задачи медицины и биологии явились идеальным полем для применения нейросетевых технологий, и именно в этой области наблюдается наиболее яркий практический успех нейроинформационных методов. В приложении к медицинской диагностике нейронные сети дают возможность значительно повысить специфичность метода, не снижая его чувствительность. Отличительное свойство нейросетей состоит в том, что они не программируются - не используют никаких правил вывода для постановки диагноза, а обучаются делать это на примерах. В большинстве задач диагностики, дифференциальной диагностики, прогнозирования, выбора стратегии и тактики лечения и др. Достаточно легко набрать необходимое количество примеров для обучения НС. Медицинские задачи практически всегда имеют несколько способов решения и нечеткий характер ответа, совпадающий со способом выдачи результата нейронными сетями. Диагностика является частным случаем классификации событий, причем наибольшую ценность представляет классификация тех событий, которые отсутствуют в обучающем нейросеть наборе. Здесь проявляется преимущество нейросетевых технологий - они способны осуществлять такую классификацию, обобщая прежний опыт и применяя его в новых случаях. В 1990 году американская фирма Апачи Медикл Системз Инк. установила в реанимационном отделении одной из больниц штата Мичиган экспертную систему Апачи - III. Ее цель - прогнозирование исхода заболевания у больных, находящихся в тяжелом состоянии. Для прогноза в компьютер необходимо ввести 27 параметров больного: первичный диагноз, симптомы, степень утраты сознания, наличие или отсутствие СПИД и других заболеваний. После этого система выдает вероятность выживания больного в диапазоне от 0 до 100 процентов. Ценность применения системы заключается в том, что она позволяет очень быстро оценить динамику изменения состояния больного, незаметную на глаз. Например, можно получить ответ у системы до и после введения какого-либо лекарства, и, сравнив ответы, посмотреть, будет ли наблюдаться эффект от терапии. Без программы же изменение состояния иногда не удается обнаружить в течение нескольких дней. Тестирование показало, что 95% прогнозов, которые делает программа, сбываются с точностью до 3%, что значительно точнее, чем у лучших врачей. Нейросетевые методы обработки применяются для лабораторных анализов и тестов. Так существует нейросетевой метод интерпретации лабораторных данных биохимического анализа крови. При этом заметны существенные преимущества нейронных сетей в сравнении с линейным дискриминантным анализом, которым параллельно обрабатывались данные. Одной из самых сложных задач для нейросетей в практической медицине является обработка и распознавание сложных образов, например рентгенограмм. На сегодняшний день существует экспертная система интерпретации рентгенограмм груди у новорожденных с выбором одного и более диагнозов из 12 [5]. Перечень решаемых в работе задач.Программный продукт, реализуемый при создании специализированной компьютерной системы, будет содержать цифровую обработку рентгенограмм и комплексный анализ лабораторный, клинических и анамнестических показателей применяемых в диагностике СЖЭ. Использование технологий обработки знаний позволяет привнести в диагностическую систему ряд принципиальных достоинств, отсутствующих в обычных прототипах. Во-первых, это возможность использования и накопления высококачественных знаний и опыта наиболее квалифицированных специалистов, экспертов конкретной предметной области (ПО). Во-вторых, возможность достаточно оперативно адаптировать систему в соответствии с изменениями знаний о ПО. В-третьих, возможность интеллектуализации взаимодействия с пользователем за счет настраивания на его конкретные особенности. Данные, используемые в диагностике. В научной литературе описано множество различных показателей состояния гомеостаза, которые применялись для диагностики и прогнозирования жировой эмболии, что делает проблему сложной и запутанной. Для объективного анализа выделим следующие анамнестические, клинические и лабораторные показатели: Также при диагностики СЖЭ применяются следующие лабораторные показатели: содержание белка; альбумин; альфа1-глобулин; липопротеиды высокой плотности; аспартатамино-трансфераза; дисновые конъюгаты; моноциты; Т-лимфоциты. Чрезвычайное разнообразие показателей и их оценок побуждает систематизировать найденные изменения и выделить наиболее достоверные признаки, приводя различные композиции диагностических показателей, каждый из которых был представлен выше. Подходы к диагностике ЖЭ можно сгруппировать следующим образом: Перечисление основных признаков, на которые необходимо ориентироваться при постановке диагноза; Помимо использования лабораторных показателей в постановке диагноза в СКС включена обработка цифровых рентгенограмм. Т.о. имея всю необходимую информацию, врач сможет оказать экстренную помощь пациенту. Анализ математических моделей объекта исследования.Моделью в общем смысле называется некоторое подобие объекта оригинала, которое отражает его существенные свойства, подлежащие изучению и позволяющие получить новую информацию об объекте. Адекватность модели - это степень ее соответствия изучаемым свойствам объекта. Математические модели представляют собой формальное описание объекта с помощью абстрактных математических соотношений . Процесс построения неизвестной ранее модели называется идентификацией.
где y - выходные результирующие характеристики работы объекта; В общем случае задачи диагностики используют определенные модели и методы установления возможных отклонений состояния объекта диагноза от нормального его состояния по тем или иным параметрам. В медицинской диагностике экспериментальные параметры устанавливаются в процессе медицинского обследования людей. Основной особенностью подхода к проблеме диагностирования является стремление учесть главные аспекты неопределенности диагностирования и использовать минимальную информацию о функционировании объекта диагноза для решения задач диагностирования. Эксперимент можно описать парой (а, Р), где a – вектор входных параметров, а P – вектор выходных параметров. Задача диагностирования СЖЭ относится к задачам прямого типа. Общая идея задачи диагностики прямого типа заключается в построении диагноза P, удовлетворяющего вектору а. Задачу такого типа можно представить как задачу нахождения зависимости между вектором входных значений (симптомов, лабораторных показателей) и вектором выходных значений (гипотезами) – диагнозами. Обратная задача диагностирования состоит в получении входной последовательности а такой, что если P - соответствующая выходная последовательность эталонной системы, то эксперимент (а, Р) является полным, или такой, что, какова бы ни была последовательность Р, либо эксперимент (а, P) является полным, либо соответствующий диагноз – пустым [3]. Для формализации процедур диагностики чаще всего используются статистическая модель, модель логического вывода, аналитическая модель и другие. Для реализации задач прогнозирования в настоящее время используются следующие методы системного анализа: статистические, дискриминантный анализ, метод наименьших квадратов, вариационные ряды, моделирование [2]. Основным недостатком аналитической модели и модели логического вывода является ограниченность их применения. Аналитическая модель может применяться, только если известна функциональная зависимость между вектором входных и вектором выходных значений. Максимальная точность в модели логического вывода достигается в случае, когда для каждого вектора входного значения известен вектор выходного значения, следовательно, в условиях недостаточной информации метод либо неприменим, либо имеет большую погрешность. Одним из главных недостатков, используемых в автоматизированных системах диагностики, статистических моделей является погрешность, которая складывается из погрешности метода и погрешности, вносимой экспертом при анализе обстоятельств. Таким образом, автоматизированные системы диагностики имеют недостатки, обусловленные типом модели представления знаний и манипулирования этими знаниями. Непростой процесс формального представления информации обусловлен отсутствием необходимого объема статистических данных либо трудностью или невозможностью их получения, что усложняет формализацию декларативных знаний, а слабая изученность механизмов возникновения и протекания рассматриваемой патологии, порождает трудности формализации процедурных знаний. Например, в различных источниках имеется довольно противоречивая информация об этиологии, патогенезе и лечении СЖЭ , что делает практически невозможным применение аналитической модели и модели логического вывода. Анализ ситуации показал, что использование моделей нейроподобных сетей для создания инструментов автоматизации диагностики СЖЭ снимает некоторые описанные проблемы. Искусственные нейронные сети индуцированы биологией. Каждый синапс формального нейрона характеризуется величиной синоптической связи или ее весом, который по физическому смыслу эквивалентен электрической проводимости. Текущее состояние нейрона определяется, как взвешенная сумма его входов. Отклик сети после обучения может быть до некоторой степени нечувствителен к небольшим изменениям входных сигналов. Эта внутренне присущая способность видеть образ сквозь шум и искажения важна для распознавания образов в реальном мире. Она позволяет преодолеть требование строгой точности, предъявляемой различными моделями представления знаний. Нейронные сети дают стандартный способ решения многих нестандартных задач. Формальные модели, в основу которых положены методологии нейронных сетей, особенно эффективны там, где нужен аналог человеческой интуиции и/или опыта. В данную группу входят задачи распознавания образов (узнавания лиц, чтения рукописных текстов), диагностики, прогнозов, перевода с одного естественного языка на другой и тому подобное. Именно для данных задач обычно трудно разрабатывать явный алгоритм. Проектирование такого алгоритма заменяется процессом обучения. Нейронная сеть настраивается, в соответствии с предоставленной ей обучающей выборкой [3]. Нейронные сети - математический аппарат.Большинство имеющихся на рынке аналогов узкоспециализированы и зачастую затрачивают слишком много времени на получение качественной обученной модели прогнозирования. Для получения прогноза можно использовать также различные программные комплексы, предназначенные для моделирования и исследования нейронных сетей, такие как “Neuro Shell”, “STATISTICA”, “Neuro Pro” и т.д. Однако, ориентированность этих программ на широкий круг людей, интересующихся нейронными сетями и их исследовательская направленность, так же оборачиваются для них недостатком. Они не обладают достаточным комплексом функций выборки и предварительной обработки данных, их интерфейс зачастую не удобен рядовому пользователю, решающему задачу прогнозирования в своей предметной области. В качестве математического аппарата для построения нейронных сетей взяты сети обратного распространения. Поскольку обратное распространение – это систематический метод для обучения многослойных искусственных нейронных сетей. Он имеет солидное математическое обоснование. Несмотря на некоторые ограничения, процедура обратного распространения сильно расширила область проблем, в которых могут быть использованы искусственные нейронные сети, и убедительно продемонстрировала свою мощь [4]. Несмотря на большое разнообразие вариантов нейронных сетей, все они имеют общие черты. Так, все они, так же, как и мозг человека, состоят из большого числа связанных между собой однотипных элементов – нейронов, которые имитируют нейроны головного мозга. На рисунке 2 показана схема нейрона.
Из рисунка видно, что искусственный нейрон, так же, как и живой, состоит из синапсов, связывающих входы нейрона с ядром; ядра нейрона, которое осуществляет обработку входных сигналов и аксона, который связывает нейрон с нейронами следующего слоя. Каждый синапс имеет вес, который определяет, насколько соответствующий вход нейрона влияет на его состояние. Состояние нейрона определяется по формуле
где Затем определяется значение аксона нейрона по формуле
Где f – некоторая функция, которая называется активационной . Наиболее часто в качестве активационной функции используется так называемый сигмоид , который имеет следующий вид:
Основное достоинство этой функции в том, что она дифференцируема на всей оси абсцисс и имеет очень простую производную:
При уменьшении параметра a сигмоид становится более пологим, вырождаясь в горизонтальную линию на уровне 0,5 при a=0. При увеличении a сигмоид все больше приближается к функции единичного скачка [6]. Нейронные сети обратного распространения – это мощнейший инструмент поиска закономерностей, прогнозирования, качественного анализа. Такое название – сети обратного распространения (back propagation) они получили из-за используемого алгоритма обучения, в котором ошибка распространяется от выходного слоя к входному, т.е. в направлении, противоположном направлению распространения сигнала при нормальном функционировании сети. Нейронная сеть обратного распространения состоит из нескольких слоев нейронов, причем каждый нейрон слоя i связан с каждым нейроном слоя i+1 , т.е. речь идет о полносвязной НС.
В общем случае задача обучения НС сводится к нахождению некой функциональной зависимости Y=F(X), где X – входной, а Y – выходной векторы. В общем случае такая задача, при ограниченном наборе входных данных, имеет бесконечное множество решений. Для ограничения пространства поиска при обучении ставится задача минимизации целевой функции ошибки НС, которая находится по методу наименьших квадратов:
где Обучение нейросети производится методом градиентного спуска, т.е. на каждой итерации изменение веса производится по формуле:
где h – параметр, определяющий скорость обучения.
где При этом множитель
где Далее рассмотрим определение первого множителя формулы (9)
где Введем вспомогательную переменную
Тогда мы сможем определить рекурсивную формулу для определения n-ного слоя, если нам известно следующего (n+1) -го слоя.
Нахождение же для последнего слоя НС не представляет трудности, так как нам известен целевой вектор, т.е. вектор тех значений, которые должна выдавать НС при данном наборе входных значений.
И наконец запишем формулу (8) в раскрытом виде
Рассмотрим теперь полный алгоритм обучения нейросети: Подать на вход НС один из требуемых образов и определить значения выходов нейронов нейросети ;
Если ошибка существенна, то перейти на шаг 1 На этапе 2 сети поочередно в случайном порядке предъявляются вектора из обучающей последовательности. Повышение эффективности обучения НС обратного распространения Простейший метод градиентного спуска, очень неэффективен в случае, когда производные по различным весам сильно отличаются. Это соответствует ситуации, когда значение функции S для некоторых нейронов близка по модулю к 1 или когда модуль некоторых весов много больше 1. В этом случае для плавного уменьшения ошибки надо выбирать очень маленькую скорость обучения, но при этом обучение может занять непозволительно много времени. Простейшим методом усовершенствования градиентного спуска является введение момента m , когда влияние градиента на изменение весов изменяется со временем. Тогда формула (15) примет вид
Дополнительным преимуществом от введения момента является способность алгоритма преодолевать мелкие локальные минимумы [4]. Методы оптимизации рентген изображений.Под оптимизацией рентген изображений понимается визуальное улучшение качества восприятия информации. Рассмотрим следующие способы оптимизации изображения.
преобразование яркости; Поскольку в работе используются рентген снимки длинных костей, для анализа которых применяются следующие
методы: Некоторые возможности обработки рентгенограмм демонстрирует анимация, запуск/остановка которой осуществляется щелчком мыши по кнопке Animation. Эффективность алгоритмов обнаружения перепадов.В литературе описано сравнительно мало исследований по оценке эффективности детекторов перепада. Эффективность трудно оценить вследствие большого числа методов, из-за трудностей в определении наилучших параметров, связанных с каждым методом, а также из-за отсутствия единого критерия эффективности. Т.о. выбор алгоритмов обнаружения перепадов необходимо выполнять исходя из полученных практических результатов. При разработке критерия эффективности для детекторов перепада целесообразно делать различие между обязательной и вспомогательной информацией, которую необходимо получить с помощью таких детекторов. Очевидно, совершенно необходимо определять положение перепада. Другая представляющая интерес информация включает высоту и крутизну перепада яркости, а также его пространственную ориентацию. Полезной информацией является также достоверность решения о перепаде, например о степени соответствия фрагмента истинного изображения модели идеального перепада. Существует три основных типа ошибок, связанных с определением положения перепадов яркости: 1) пропуск истинных перепадов; 2) ошибка в определении их положения; 3) принятие шумовых выбросов за перепад (ложное обнаружение) [8]. Обзор результатов и выводы.Обобщая многочисленные работы исследователей, специально занимающихся жировой эмболией, можно сказать, что на сегодняшний день нет единого подхода в диагностике этого грозного и тяжелого осложнения раннего периода травматической болезни. Сотрудниками научно-исследовательского института травматологии и ортопедии Донецкого государственного медицинского университета им. М. Горького была разработана методика для диагностики данного заболевания. Применение на практике которой, позволило правильно диагностировать и выявлять данное заболевание. Правильность в постановке диагноза составила 90%, что для медицины является хорошим показателем. На основании научного подхода, описанного выше, разрабатывается компьютерная система, основанная на нейросетевом моделировании. Создана нейронная сеть обратного распространения ошибки, способная адекватно реагировать на входные воздействия и обеспечивать постановку диагноза синдрома жировой эмболии, что доказывает правильность выбранного метода. Реализуемый программный продукт будет содержать в себе опыт и знания ведущих специалистов в этой области. Т.о. использование нейронных сетей при диагностике СЖЭ и обработка цифровых рентгенограмм позволит создать эффективную СКС. Программа, реализуемая в магистерской работе, уникальна в своем роде, поскольку на сегоднешний день не имеет аналогов. Литература.1. Научно-исследовательский сайт посвященный теме "Жировая эмболия" http://fatembolism.perm.ru/index.htm 2. Щетинин В,Г., Соломаха А.А. Применение «компьютерных сетей» в клинической лабораторной диагностики //Клиническая лабораторная диагностика 1998, №10, с21-23 3. Г.Л. Шкурина, Д.П. Панченко «Автоматизированная система диагностики отравлений» 4. Технологии анализа данных. Лаборатория BaseGroup http:// www.basegroup.ru 5. Россиев Д.А. «Медицинская нейроинформатика» Глава 5. http://cache.rcom.ru/~dap/nneng/nnlinks/book2/gl5.htm 6. Уоссерман Ф. Нейрокомпьютерная техника: теория и практика/ Пер с англ. Зуева Ю.А., Точенова В.А. – М.:Мир, 1992-105с 7. Олешко Д.Н. Повышение качества и скорости обучения нейронных сетей в задаче прогнозирования поведения временных рядов 8. Прэтт У. Цифровая обработка изображений, кн.2/ М.: Мир, 1982-784с 9. Сойфер В.А. Компьютерная обработка изображений. Часть 2 Методы и алгоритмы // Соровский образовательный журнал, №3,1996 |