Главная | Библиотека | Ссылки | Отчет о поиске | Индивидуальное задание |
Прогнозирование инфекционной заболеваемости необходимо, прежде всего, для обоснования системы мероприятий по профилактике инфекций. В зависимости от уровня научной разработки проблемы и возможностей реализации рекомендаций в конкретных условиях цели проведения профилактических мероприятий могут изменяться в широких пределах – от стабилизации заболеваемости даже на относительно высоком уровне до неуклонного ее снижения и ликвидации отдельных инфекций на обеспечиваемой территории или среди обслуживаемых контингентов населения.
Особенно важным решение проблемы разработки мероприятий по профилактики инфекционной заболеваемости является в нашем регионе, учитывая его специфику: густо населенность, высокая концентрация промышленных предприятий, сложная экологическая обстановка, негативно сказывающаяся на здоровье населения.
Разработкой плана мероприятий по профилактике инфекционной заболеваемости занимаются государственные санитарно-эпидемиологические станции на всех уровнях. Сюда входит учет и обработка оперативной информации, обработка полученных статистических данных за определенный период, принятий решений о методах профилактики на будущий период.
Решение задачи прогнозирования инфекционной заболеваемости также может быть необходимо для фармацевтических предприятий для оценки уровня спроса на определенные группы медицинских препаратов.
В последнее время сильно возрастает значение информационного обеспечения самых разных медицинских технологий. Оно становится критическим фактором развития практически во всех областях знания, поэтому разработка и внедрение информационных систем является на сегодняшний день одной из самых актуальных задач.
Анализ применения персональных ЭВМ в медицинских учреждениях показывает, что наибольшее использование компьютеров идет для обработки текстовой документации, хранения и обработки баз данных, ведения статистики и финансовых расчетов. Отдельный парк ЭВМ используется совместно с различными диагностическими и лечебными приборами.
В большинстве этих областей использования ЭВМ применяют стандартное программное обеспечение - текстовые редакторы, системы управления базами данных, статистические пакеты и др. Однако некоторые из важнейших участков лечебно-диагностических технологий практически не используют возможности ЭВМ. Причины этого носят сложный характер. Основные из них - недостаточно развитая техническая база, низкая компьютерная грамотность участников технологий, недостаток финансирования.
Несмотря на крайнюю необходимость решения поставленной задачи, так как она, прежде всего, касается здоровья человека, в нашем регионе не внедрены эффективные системы, позволяющие с помощью математических методов решать задачи прогнозирования инфекционной заболеваемости.
О необходимости и актуальности решения данной задачи на всех уровнях в нашей стране могут свидетельствовать данные Всемирной организации здравоохранения, приведенные на рисунке 1.[1]
Рисунок 1 (анимированный). Уровень смертности от паразитарных и инфекционных заболеваний в 2005г.
Целью работы является разработка компьютеризированной системы прогнозирования инфекционной заболеваемости в регионе в условиях Макеевской городской санитарно-эпидемиологической станции (СЭС), с использованием опыта работы данной организации. В последующем предполагается внедрение данной системы. Разрабатываемая система должна позволять производить многофакторный анализ данных, отслеживать взаимное влияние факторов друг на друга, что повышает точность прогнозирования и дает возможность получить большую информацию о структуре заболеваний и факторах, влияющих на эпидемиологическую обстановку. Кроме того, программа должна иметь удобный интерфейс и механизм визуализации, который наглядно будет демонстрировать динамику заболеваний и прогноз.
Одним из главных условий успешной реализации проекта является тщательный анализ входной информации. Этот этап можно выделить как один из самых важных, поскольку только на основе накопленных статистических данных можно построить качественный прогноз, выявить закономерности развития процесса, определить факторы, повлиявшие на тенденцию уровня заболеваемости. В Макеевской городской СЭС накоплен обширный массив данных о заболеваемости. Так, имеются пофамильные данные о заболеваниях за последние 5 лет. В работе планируется использовать также статистические данные об уровни заболеваемости за последние 20 лет – это показатели уровня заболеваемости за месяц, год. На основе анализа этих данных, в процессе разработки системы планируется выявить факторы, наиболее сильно влияющие показатели заболеваемости, определить закономерности данного процесса.
Работа базируется не только на теоретических данных, а, прежде всего основой служит практический опыт. Как уже было сказано, главной целью работы является разработка эффективной системы, позволяющей выдавать качественный прогноз и осуществлять мониторинг за эпидемиологической ситуацией в городе. Поэтому в результате реализации магистерской работы планируется внедрение разработанной системы в структуру Макеевской СЭС, т.е. в районном и общегородском масштабе.
По современным представлениям характер тенденции заболеваемости зависит, прежде всего, от качества и эффективности профилактических мероприятий, направленных на основные причины и условия развития эпидемического процесса. При дизентерии и других кишечных инфекциях - это мероприятия, которые изменяют условия передачи возбудителей через пищу и воду. Их качество и эффективность связаны с результативностью осуществления социально-экономических программ по обеспечению необходимого санитарно-гигиенического и санитарно-технического уровня производства пищевых продуктов, организации питания, водоснабжения, очистки территории и обеззараживания сточных вод, санитарного уровня населения и санитарно-гигиенических условий содержания организованных дошкольников.
В крупных городах, на формирование тенденции заболеваемости может повлиять все нарастающее проэпидемичивание населения в связи с активной циркуляцией возбудителя, которая поддерживается сохранением достаточных санитарно-гигиенических условий для реализации механизма передачи инфекции.
Второй закономерной формой проявления эпидемического процесса являются многолетние периодические колебании уровня заболеваемости. Рациональное объяснение механизмов развития периодических колебаний заболеваемости может быть получено на основе теории саморегуляции. Периодичность - это естественная форма фазового развития эпидемического процесса. На ее конкретные проявления влияет совокупность природных и социальных условий, действие которых опосредуется через механизмы взаимодействия популяций возбудителя и хозяина в паразитарной экосистеме.
Проявления периодичности эпидемий с течением времени существенно меняются. До середины 70-х годов основными были эпидемические циклы длительностью в 4, 6, 9, 13 и 19 лет. Это подтверждается и результатами автокорреляционного анализа (рис. 2). Но в последующий период произошли отчетливые изменения периодичности эпидемий и с 1975 г. установился двухлетний цикл. Двухлетняя периодичность заболеваемости соответствует чередованию «жарких» и «холодных» летних периодов, т. е. в основном отражает ритм природно-климатических условий. [2]
Рисунок 2. Автокорреляционная функция динамики заболеваемости дизентерией Зонне населения Киева за 1953—1987 гг. Лаг (τ) выражен в годах.
Анализ периодических колебаний заболеваемости необходим для решения нескольких задач. Устойчивость периодической компоненты и амплитуда колебаний являются дополнительными критериями управляемости эпидемического процесса, т. е. эффективности принятой системы профилактики. В сочетании с теоретической линией тенденции оценка периодической компоненты может быть использована для ориентировочного прогнозирования заболеваемости на предстоящие годы.
Массив исходной информации для анализа многолетней динамики формируется из данных оперативного учета заболеваемости после их коррекции по окончательным диагнозам.
При подготовке данных к обработке из них исключают заболеваемость за периоды эпизодических вспышек с установленными причинами. При анализе многолетней динамики заболеваемости минимальная протяженность изучаемого периода определена в 10 лет.
В решении задачи прогнозирования можно выделить два пути: прогнозирование, основанное на использование моделей временных рядов и использование нейронных сетей.
Прогнозирование инфекционной заболеваемости, основанное на использование моделей временных рядов
Ряд наблюдений анализируемой случайной величины произведенных в последовательные моменты времени называется временным рядом. Члены временного ряда не являются статистически независимыми и не являются одинаково распределенными. Это значит, что нельзя распространять свойства и правила статистич6еского анализа случайной выборки на временные ряды. С другой стороны, взаимозависимость членов временного ряда создает свою специфическую базу для построения прогнозных значений анализируемого показателя (т.е. для построения оценок для неизвестных значенийпо наблюденным значениям
На временной ряд влияют следующие факторы:
- долговременные, формирующие общую тенденцию в изменении анализируемого признака Обычно эта тенденция описывают с помощью той или иной неслучайной функции Это функцию называют функцией тренда или тренд;
- сезонные, формирующие периодически повторяющуюся в определенное время года колебания анализируемого признака;
- циклические, формирующие изменения анализируемого признака, обусловленные действием долговременных циклов демографической, экономической, астрофизической и другой природы;
- случайные, не поддающиеся учету и регистрации.
При прогнозировании на основе статистического анализа временных рядов следует учитывать следующие условия:
- требуемый горизонт l прогнозирования, т.е. на сколько временных тактов (l) вперед мы собираемся строить наш прогноз; при прогноз обычно называется краткосрочным, при – среднесрочным, а при l>6 – долгосрочным (приведенная здесь классификация условна: она может зависеть от конкретного смысла одного такта времени – подразумевается ли под ним день, неделя, квартал, год и т.д.);
- длина анализируемого временного ряда (условно говоря, при ряд считается коротким, а при N>50 – длинным);
- наличие или присутствие в анализируемом ряду сезонной составляющей или каких-либо «нестандартностей» (скачкообразных изменений в поведении тренда, слишком большой величины дисперсии случайных остатков и т.п.). [3]
Более подробную информацию о методах прогнозирования, на основе моделей временных рядов можно найти в моей статье: "Прогнозирование инфекционной заболеваемости, основанное на использование моделей временных рядов" (pdf - для просмотра необходим Adobe Reader)
Прогнозирование инфекционной заболеваемости с использованием нейронных сетей
Развитие нейросетевых методов дает возможность их использования как инструмента научных исследований, с помощью которого можно изучать объекты и явления.
Анализ публикаций о применении нейросетевых технологий в медицине показывает, что практически отсутствуют какие-либо методологии разработки нейросетевых медицинских систем, о чем свидетельствует как отсутствие работ такого профиля, так и огромное разнообразие подходов к нейросетевым алгоритмам обучения и архитектурам нейронных сетей. Это подтверждает то, что медицинская нейроинформатика как наука находится еще, в основном, на стадии накопления фактического материала. Общая классификация искусственных нейронных сетей (ИНН) приведена на рисунке 3 [4]
Рисунок 3. Общая классификация моделей ИНН
Нужно отметить, что все медицинские приложения нейронных сетей для практического здравоохранения (диагностика, лечение, прогнозирование) созданы зарубежными авторами. Большинство отечественных работ направлено на исследование самих нейронных сетей и моделирование с их помощью некоторых биологических процессов (в основном, функций нервной системы).
Общая черта, объединяющая приведенные примеры - отсутствие единой универсальной технологии создания таких приложений. В публикуемых разработках используются самые разнообразные архитектуры и алгоритмы функционирования нейронных сетей. Это приводит к тому, что для почти для каждой задачи разрабатывается своя собственная архитектура, и часто - уникальный алгоритм или уникальная модификация уже существующего.
Все неалгоритмируемые или трудноалгоритмируемые задачи, решаемые нейронными сетями, можно классифицировать на два принципиально различающихся типа в зависимости от характера ответа - задачи классификации и задачи предикации.
Задачи классификации - основная и очень обширная группа медико-биологических задач. Ответом в них является класс - выбор одного варианта из заранее известного набора вариантов. Классификация может быть бинарной (элементарная классификация) - в этом случае набор возможных ответов состоит из двух вариантов (классов), и n-арной, где число классов более двух.
Другой вид задач для нейросетей - задачи предикации, или предсказания. Они подразделяются на предсказание числа (одномерная предикация) и вектора (векторная предикация, более общий случай). Отличие от классификационных задач заключается в том, что ответ в задачах предикации может быть дробным и принимать любые значения на каком-либо интервале.
Векторная предикация предполагает, что ответ может быть представлен в виде нескольких независимых друг от друга чисел, образующих точку (или вектор) в многомерном пространстве, размерность которого равно количеству предсказываемых чисел. Число координат вектора называется при этом размерностью вектора ответа.
Очевидно, что задача рассматриваемая в данной работе относится к задачи предикации.
Несмотря на большое разнообразие вариантов нейронных сетей, все они имеют общие черты. Так, все они, так же, как и мозг человека, состоят из большого числа связанных между собой однотипных элементов – нейронов, которые имитируют нейроны головного мозга. На рисунке 4 показана схема нейрона.
Рисунок 4. Схема нейрона
Из рисунка видно, что искусственный нейрон, так же, как и живой, состоит из синапсов, связывающих входы нейрона с ядром; ядра нейрона, которое осуществляет обработку входных сигналов и аксона, который связывает нейрон с нейронами следующего слоя. Каждый синапс имеет вес, который определяет, насколько соответствующий вход нейрона влияет на его состояние. Состояние нейрона определяется по формуле
где n – число входов нейрона; xi – значение i-го входа нейрона; wi – вес i-го синапса
Затем определяется значение аксона нейрона по формуле
Y = f(S)
Где f – некоторая функция, которая называется активационной. Наиболее часто в качестве активационной функции используется так называемый сигмоид, который имеет следующий вид:
Основное достоинство этой функции в том, что она дифференцируема на всей оси абсцисс и имеет очень простую производную:
При уменьшении параметра a сигмоид становится более пологим, вырождаясь в горизонтальную линию на уровне 0,5 при a=0. При увеличении a сигмоид все больше приближается к функции единичного скачка. [7]
Рисунок 5 (анимированный). Зависимость крутизны передаточной функции нейрона от параметра а
Нейроны и межнейронные связи задаются программно на обычном компьютере или могут иметь "материальную" основу - особую микросхему (нейрочип), которые применяются в специально созданных нейрокомпьютерах. Структура взаимосвязей между нейронами в нейрокомпьютере или нейропрограмме аналогична таковой в биологических объектах. Искусственный нейрон имеет коммуникации с другими нейронами через синапсы, передающие сигналы от других нейронов к данному (дендриты) или от данного нейрона к другим (аксон). Кроме того, нейрон может быть связан сам с собой. Несколько нейронов, связанных между собой определенным образом, образуют нейронную сеть.
Нейросеть, также как и биологический аналог, должна иметь каналы для связи с внешним миром. Одни каналы обеспечивают поступление информации из внешнего мира на нейросеть, другие выводят информацию из нейросети во внешний мир. Поэтому одни нейроны сети рассматривается как входные, другие же - как выходные. Часть нейронов может не сообщаться с внешним миром, а взаимодействовать с входными, выходными и такими же нейронами ("скрытые" нейроны).
Очевидно, что существует огромное количество способов соединения нейронов, растущее с увеличением числа нейронов в сети. Наиболее употребительной является слоистая архитектура, в которой нейроны располагаются “слоями”. В наиболее общем случае аксоны каждого нейрона одного слоя направлены к нейронам следующего слоя. Таким образом, нейроны первого слоя являются входными (принимающими информацию из внешнего мира), нейроны последнего слоя - выходными (выдающими информацию во внешний мир). Схема трехслойной сети изображена на рисунке 6
Рисунок 6. Трехслойная сеть с 6 нейронами
Другой вид архитектуры - полносвязная, когда каждый нейрон соединен с каждым, в том числе сам с собой. Пример простейшей нейросети из 3 нейронов показан на рисунке 7. Для удобства изображения из каждого нейрона выходит не один, а несколько аксонов, направленных на другие нейроны или во внешний мир, что аналогично присоединенным к одному аксону через синапсы нескольким дендритам.
Слоистые сети являются частными случаями полносвязных.
Для построения экспертных систем предпочтительнее выбирать именно полносвязные нейросети, исходя из следующих соображений. Во-первых, при одинаковом числе нейронов полносвязные сети имеют большее количество межнейронных связей, что увеличивает информационную емкость сети. Во-вторых, полносвязная архитектура является намного более универсальной, что не требует экспериментов с вариациями схемы соединений для каждой задачи. В-третьих, в случае эмуляции сети на обычной ЭВМ полносвязные сети обладают серьезными преимуществами, прежде всего в скорости функционирования и простоте программной реализации без ущерба качеству обучаемости.
Рисунок 7. Схема простейшей нейронной сети из 3 нейронов.
Сеть имеет 13 синапсов, 4 из которых служат для связи с внешним миром, а остальные соединяют нейроны между собой [5]
На сегодняшний день в Донецкой области специалистами Донецкой областной СЭС разработана система, занимающаяся мониторингом инфекционной заболеваемости на основе статистических методов.
В некоторых областях Украины и Российской федерации разработаны системы, решающие те же задачи, что ставятся в данной магистерской работе. Однако, все имеют локальный характер, обусловленный прежде всего спецификой региона в условиях которого они внедрены.
Какой бы совершенной и современной ни была бы система, все-таки точность прогноза, получаемого с помощью ее, остается ограниченной. И здесь особое внимание следует обратить и на качество входной информации, и на степень влияния различных факторов на задачу, в том числе и случайных.
Поэтому, разрабатываемая системой служит основой для принятия решения, но ни в коем случае ее решение не является единственно верным. Главную роль в принятии решений о мерах профилактики инфекционной заболеваемости играет опыт и знание специалистов.
Еще одна из проблем в решении задач искусственного интеллекта нейросетевыми методами - значительное время обучения системы. Эта проблема особенно проявляется, когда необходимо, достигнуть высокого качества в надежности прогноза или распознавании образов. Однако, существуют формализованные пути, предназначенные для увеличения скорости обучения сетей, не проигрывая при этом в точности. Основным среди этих методов является метод, основанный на принципе достаточности.[6]
В данном реферате были рассмотрены различные методы решения рассматриваемой задачи. Характерной чертой статистических методов является их способность непрерывно учитывать эволюцию динамических характеристик изучаемых процессов, «подстраиваться» под эту эволюцию, придавая, в частности тем больший вес и тем более высокую информационную ценность имеющимся наблюдениям, чем ближе они к текущему моменту прогнозирования. Это является важной чертой с учетом рассматриваемой задачи. Однако недостатком всех этих методов является подбор подходящих значений для параметров адаптации.
Также требуется решить задачу определения влияния различных факторов на уровень заболеваемости. Наиболее информативное решение дает использование при статистическом анализе гипотез методов корреляционного и регрессионного анализа.
Современным и эффективным решением задачи прогнозирования является использование нейронных сетей. Можно выделить следующие достоинства использования данного метода.
1. Нейросети принимают решения на основе опыта, приобретаемого ими самостоятельно. "Самостоятельно" в данном случае означает то, что создателю системы не требуется устанавливать взаимосвязи между входными данными и необходимым решением, затрачивая время на разнообразную статобработку, подбор математического аппарата, создание и проверку математических моделей.
2. Решение, принимаемое нейросетью, не является категоричным. Сеть выдает решение вместе со степенью уверенности в нем, что оставляет пользователю возможность критически оценивать ее ответ.
3. Нейросеть позволяет моделировать ситуацию принятия решения.
4. Нейросети дают ответ очень быстро (доли секунды), что позволяет использовать их в различных динамических системах, требующих незамедлительного принятия решения.
5. Возможности нейросетей (коррекция классификационной модели, минимизация обучающих параметров и др.) позволяют упрощать процесс создания экспертных систем, определять направления научного поиска.
Но все-таки, главным критерием работы нейросетевых экспертных систем должна быть практика - многократные испытания и проверки в самых различных условиях.
Определенным препятствием использования нейросетей может, является все же некоторая ограниченность задач, решаемых ими. Нейросеть представляет собой единое целое, и добавление нового нейрона к сети, работающей в рамках имеющейся сейчас концепции, приведет к необходимости полностью переучивать сеть. Это требует обращения к первоначальному задачнику, что во многих случаях неприемлемо.
Поэтому создателю самообучающихся систем приходится идти на компромисс: либо делать сеть с некоторым избытком нейронов, имеющую резерв для накопления опыта, но обладающую относительно низкой способностью к экстраполяции, либо обучить сеть с небольшим числом нейронов, которая вряд ли сможет набрать потом дополнительный опыт. Все это, конечно, зависит еще и от корректности представления начальных данных. Поэтому при построении нейронной сети на этапе постановки задачи требуется тщательная проработка входной информации.
Данная магистерская работа должна быть окончательна готова и защищена в декабре 2006 г.
1. Журнал "Бизнес", стр.84, №13(688),27.03.2006
2. Шапиро М.И., Дегтярев А.А. "Профилактика кишечных инфекций в крупном городе". - Л.: Медицина,1990. - 256 с.
3. Айвазян С.А. Основы эконометрики - М.:Юнити, 2001
4. Nitin Malik,
Artifical Neural Networks And Their Applications,
http://lanl.arxiv.org/find/grp_q-bio,grp_cs,grp_physics,grp_math,grp_nlin/1/all:+Neural/0/1/0/all/0/1
5. Горбань А.Н., Дунин-Барковский В.Л., Кирдин А.Н. и др., Нейроинформатика - Новосибирск: Наука. Сибирское предприятие РАН, 1998. - 296с.
6. Крисилов В.А., Олешко Д.Н. Sufficiency Principle In Acceleration Of Neural Networks Training, http://neuroschool.narod.ru/
7. Стариков Алексей, Нейронные сети - математический аппарат, http://www.basegroup.ru/neural/
Главная | Библиотека | Ссылки | Отчет о поиске | Индивидуальное задание |