Назад в библиотеку

Healthgrid Белая книга

Автор: Винсент Бретон
Источник: http://gridclub.ru...

Аннотация

Винсент Бретон и др. Healthgrid Белая книга. Рассмотрены проблемы хранения и обработки медицинских изображений, а также использование для их решения грид-технологий.

3. МЕДИЦИНСКИЕ ИЗОБРАЖЕНИЯ И ИХ ОБРАБОТКА

3.1. МЕДИЦИНСКИЕ ИЗОБРАЖЕНИЯ

При установлении диагноза и проведении лечения врачи все больше полагаются на медицинские изображения, к которым относятся рентгенограммы (количество цифровых рентгенограмм растет, но в подавляющем большинстве это рентгеновские снимки), УЗИ, магнитно-резонансная томография (MRI - Magnetic Resonance Imaging), компьютерная томография (CT - Computed Tomography), томография на позитивном излучении (PET – Positive Emission Tomography) и т.д. Использование медицинских изображений будет расти по мере того, как во многих больницах (сначала в базовых больницах медицинских институтов) будут установлены системы с высокой пропускной способностью для архивирования изображений. Медицинские изображения дают основной объем информации о пациенте, однако, сами по себе они недостаточны, поскольку требуется их анализ и интерпретация в контексте истории болезни пациента (т.е. нужны метаданные, связанные с изображениями).

Существует ряд факторов, которые чрезвычайно затрудняют лечение пациента, основанное на медицинских изображениях, Естественно, медицинские данные о пациенте собираются в разных лечебных учреждениях. Врачи часто не имеют доступа ко всем историям болезней всех своих пациентов. Медицинские изображения представляются очень большими объемами данных (трехмерные изображения, показания, полученные в последовательные моменты времени, многочисленные протоколы изображений) со сложной структурой (клинически и эпидемиологически значимые показатели, такие как возраст пациента, питание, образ жизни и история болезни, параметры получения изображений и анатомические / физиологические изменения). Часто изображений одной модальности оказывается недостаточно, поскольку на получение изображения влияет много параметров, и дополнительная информация накапливается различными системами сбора физических данных (physical acquisition systems).

Медицинские данные используются при установке диагноза, при последующем лечении и планировании терапии. При установке диагноза медицинские изображения, полученные в медицинском центре, обычно визуализируются и интерпретируются рентгенологом сразу после их получения перед тем, как передать их лечащему врачу (часто в виде рентгеновских снимков) для повторного рассмотрения. Эти два чтения снимка обычно происходят в разных кабинетах и, может быть, даже в разных зданиях. При последующем лечении в работу со снимками могут быть вовлечены и другие врачи, поскольку изображения, полученные в разное время, могли быть сделаны в разных радиологических центрах, и для их чтения может потребоваться несколько врачей. При планировании терапии и в ходе лечения изображения должны быть доступны и в больничной палате, где проводится лечение.

Системы PACS (Picture Archiving and Communication Systems), установленные в настоящее время в больницах, позволяют решить некоторые трудные задачи, связанные с управлением медицинскими данными. Однако у них есть много ограничений:

• часто они не связаны с радиологической информационной системой (RIS – Radiological Information System), которая ведет медицинскую документацию;

• часто они являются собственными разработками компаний по обработке медицинских изображений, и не существует открытых стандартов для взаимодействия с другими PACS;

• обычно они имеют дело с медицинскими данными только внутри одного лечебного учреждения (одна больница или, в лучшем случае, объединение больниц) и не используются в национальном или международном масштабе.

При широкомасштабной работе с медицинскими данными возникают проблемы безопасности и конфиденциальности персональных данных. Предполагается, что грид-технологии облегчат создание распределенных систем медицинской информации в защищенной среде. Хотя сами по себе гриды не могут решить проблему гетерогенности форматов данных и коммуникационных протоколов, ожидается, что они могут способствовать разработке стандартов в этой области.

3.1.1. От сбора медицинских данных к их хранению и архивированию

Хотя современное оборудование позволяет получать медицинские изображения в цифровом виде, для долгосрочного хранения часто используются только рентгеновские снимки. Медицинские изображения представляются огромными объемами данных: одно изображение может занимать от нескольких мегабайт до одного гигабайта и более. Общий объем цифровых изображений, получаемых в Европе, превосходит 1000 петабайт в год. Правовые вопросы, касающиеся архивирования медицинских данных, решаются в разных странах Евросоюза по-разному, но есть общая тенденция – долгосрочное хранение (около 20 лет для всех данных и до 70 лет для некоторых специальных данных) и предоставление права собственности на эти данные пациенту.

Чтобы сделать более удобным хранение и передачу данных, несколькими международными организациями и промышленными компаниями был принят стандарт DICOM (Digital Image and Communication in Medicine).

Стандарт DICOM реализован в современном оборудовании для получения изображений и медицинском оборудовании, что облегчает обмен данными между устройствами для визуализации изображений, пультами постобработки и системами архивирования. Однако этот стандарт не охватывает все свойства RIS (Radiological Information System) , касающиеся управления данными и доступа к данным, и не описывает стратегию архивирования, чем занимается PACS.

Стратегия хранения медицинских данных может быть установлена только по отношению к определенному виду доступа к этим данным. С юридической точки зрения пациенты должны иметь полный доступ к чтению своих медицинских данных. Очевидно, врачи должны иметь доступ к данным их собственных пациентов, однако, любой врач не должен иметь доступа к данным любого пациента. Другие лица могут иметь ограниченные права доступа к данным пациентов. Например, исследователям может понадобиться доступ к основным данным без персональной идентификации пациента.

Гриды обеспечивают средства для хранения распределенных данных и данных большого объема. Промежуточное программное обеспечение грида предлагает распределенные и прозрачные файловые системы, объединяющие многочисленные ресурсы памяти для создания памяти огромной емкости. Некоторые возможности грида, находящиеся сейчас на стадии исследования, касаются управления доступом и безопасностью данных. Пока данные используются только внутри лечебных учреждений, проблемы безопасности данных решаются довольно легко, однако, когда происходит обмен данными между больницами через сети, задача безопасности данных становится гораздо более сложной. Медицинские данные вообще очень деликатная информация, а идентифицирующие пациента данные должны быть строго конфиденциальными. В частности, это означает, что доступ к данным должен быть разрешен только авторизованным пользователям (для деликатных данных) или аккредитованным пользователям (для идентифицирующих данных), часто за исключением поставщиков служб и системных менеджеров. Поэтому шифрование данных (и, таким образом, их анонимизация) на диске и во время их передачи по сети является обязательным, доступ к ключам расшифровки должен строго контролироваться.

3.2. ПОСТРОЕНИЕ ВИРТУАЛЬНЫХ НАБОРОВ ДАННЫХ В ГРИДАХ

Для выполнения анализа медицинских изображений связанная с ними персональная и клиническая информация (например, возраст, пол, картина заболевания) должна быть идентифицирована. Число параметров, которые влияют на представление изображения, так велико, что база данных с изображениями, установленная в любом отдельном медицинском центре – как бы велика она ни была – не может быть статистически достаточной для ответов на запросы, относящиеся к одной из следующих областей:

• программы скрининга: чтобы изучить распространение заболеваний в панъевропейском масштабе и сопоставить эту информацию с общими факторами;

• изучение редких заболеваний, данные о которых в каждом отдельном медицинском центре ограничены;

• сборка индивидуализированных наборов данных: когда изучаются данные одного пациента или одной группы населения, может потребоваться сборка сравнительного эпидемиологического набора данных путем отбора данных, имеющих одинаковые признаки в панъевропейском масштабе (одинаковый пол, возраст, социальное положение и т.д.);

• сети аварийного оповещения: для обнаружения выхода некоторых патологий за национальные границы.

Решение задачи распределения данных подразумевает построение огромной, многоцентровой – интегрированной – базы данных, в то время как для преодоления статистической погрешности при изучении таких показателей как образ жизни или питание, требуется база данных, которая может выходить за национальные границы. Распределенная медицинская база данных могла бы использоваться для сборки виртуальных наборов данных: например, наборы данных могут собираться по запросу для определенной цели из различных источников данных, принадлежащих разным регионам и странам. В любых медицинских ситуациях использование виртуальных наборов данных принесло бы огромный выигрыш при условии, что (интегрированная) база данных (объединенная на федеративных началах) представляется для пользователя так, как если бы она была установлена в одном месте (т.е. как один логический набор данных). Такая географически распределенная база данных (панъевропейская) может быть реализована с использованием грид-технологий, а построение прототипа позволило бы понять, насколько грид-технологии подходят для распределенного анализа медицинских изображений.

Специалистам, занимающимся анализом изображений, требуется прозрачный доступ к данным, представляющим изображения, которые могут находиться в разных местах внутри и вне их больниц и могут быть представлены в разных форматах. Для этих специалистов очень важно, чтобы сложности технологий, поддерживающих виртуальные наборы данных, были спрятаны от пользователей и чтобы их запросы удовлетворялись, прежде всего 'в общем и целом' ('in the large'). Только тогда системные аналитики и разработчики, ответственные за внедрение работающих технологий, получат от сообщества пользователей финансовую поддержку для создания требуемой инфраструктуры, способной удовлетворить запросы пользователей 'в малом' ('in the small'). Решение, предлагаемое для виртуальных наборов данных, должно учитывать первостепенной важности вопросы защиты данных и прав собственности (собственность пациента, врача, больницы), сохранности данных, анонимности и простоты доступа.

Гетерогенность данных, представляющих медицинские изображения, – это головная боль разработчиков виртуальных баз данных, содержащих изображения и базирующихся на гриде. Для реализации любой системы медицинских изображений, использующей грид-технологии, придется интегрировать многочисленные наборы данных, которые могут располагаться и в базах данных, и в файлах. Для этой цели должна быть решена задача поиска и взаимодействия с гетерогенными данными, возможно, через использование метаданных высокого уровня (может быть, через онтологии) для каждого отдельного набора данных. Особое внимание должно быть также уделено семантической гетерогенности: разные системы могут ссылаться на один и тот же элемент данных под разными именами или разные элементы могут иметь одинаковые имена. Очень важной является и проблема идентификации пациентов в широком масштабе, поскольку каждая больница обычно использует свой собственный механизм идентификации, Необходимость гарантировать конфиденциальность данных о пациенте делает эту задачу еще более трудной.

Отдельная задача при построении виртуальных наборов данных – это обработка аннотаций. Аннотации могут добавляться к изображениям в разной форме: рентгенолог может обрисовать на снимке области, представляющие интерес (например, для дальнейшего изучения, для выявления заболевания при помощи компьютера, для биопсии и т.д.), он может написать на снимке свои замечания, лаборант может приложить к изображению запись об условиях, при которых оно было получено, могут быть аннотации к группе изображений, к конкретному исследованию или к актуальной истории болезни пациента. Любой виртуальный набор данных должен будет учитывать различные виды аннотаций и разрешать запросы для поиска полуструктурированных и/или структурированных аннотаций. Очевидно, что для выполнения запросов нужна стандартизация аннотаций в медицинском сообществе (если это возможно).

Любая успешная система медицинских данных должна обеспечивать связи между данными, представляющими изображения, и данными, изображения не представляющими, такими как результаты биопсии, записи о ходе лечения и метаданные пациента. Кроме того, нужны связи между различными формами медицинских изображений (томограммы, рентгенограммы, маммограммы) для решения более общих задач, таких как конфиденциальность и защита медицинских данных и соответствующий ролевой доступ к этим данным.

3.2.1. Индексирование базы данных

Одним из наиболее важных аспектов при построении крупномасштабных виртуальных наборов данных для изображений является возможность выполнять запросы прозрачным и эффективным способом. Наиболее стандартный способ формулирования запросов – это выражение условий поиска через атрибуты изображений. Однако, такой подход требует больших вычислительных мощностей и больших трудозатрат для обработки данных. Промежуточный уровень между прямым доступом к изображениям и запросами, использующими только метаданные, состоит в запросе свойств изображений. Такой тип запросов основан на вычислении индексов, описывающих либо глобальные свойства изображений, либо локальные свойства отдельных областей изображений, характерных объектов или топологические соотношения между этими объектами. Эти индексы могут внести большой вклад в развитие системы CBIR (Content-Based Image Retrieval), поскольку могут быть использованы стандартные операции над базой данных, и можно избежать прямого доступа к необработанным данным, представляющим изoбражения.

Однако индексирование медицинских изображений не привлекло внимание исследователей в такой же степени, как индексирование фотографических изображений, и выбор подходящих методов индексирования, которые можно применять к различным типам изображений, является трудной и очень зависящей от приложений задачей. Поэтому необходимы стандартизация представления индексов, а также описание алгоритмов, используемых для вычисления индексов. Есть ряд важных вопросов, которые должны быть решены для среды с распределенной БД изображений:

• размещение алгоритмов индексирования/библиотек в географически разных узлах и управление новыми алгоритмами (или новыми версиями);

• политика индексирования: какие алгоритмы нужно применить и какие параметры должны быть адаптированы к различным изображениям? Когда необходимо (пере)запускать индексирование? Что случится, когда к распределенной среде добавятся новые изображения/алгоритмы?

• "отслеживаемость" индексов: очень важно иметь такую схему запросов, которая способна определять, какой алгоритм, какая его версия и какие параметры были использованы для вычисления набора индексов;

• в случае сложной обработки процесс может быть представлен цепочкой шагов: данные, полученные в результате выполнения некоторого алгоритма, могут служить входными данными для следующего шага. Распределенная система должна предусматривать стандартные способы описания таких зависимостей и должна быть способна запускать необходимые вычисления, когда добавляются новые данные или подключается новый алгоритм.

Может понадобиться возможность управления безопасностью этих индексов на разных уровнях: подобно тому, как анонимизируются персональные данные для некоторых категорий пользователей, может потребоваться безопасность и самих изображений, особенно, когда они допускают идентификацию пациента (например, отсканированное трехмерное изображение лица). Однако, индексы, вычисленные для этих изображений, могут стать общедоступными, если они не оставляют возможности для идентификации пациента.

3.3. ОБРАБОТКА МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ

3.3.1 Алгоритмы анализа изображений

Алгоритмы анализа медицинских изображений с помощью компьютера были разработаны около 20 лет назад. Их цель – помочь медикам справиться с большим объемом данных, обеспечив им надежную поддержку для диагностирования и лечения. В самом деле, ручная обработка трехмерных изображений требует больших усилий и часто чревата ошибками. Более того, интерпретация трехмерного медицинского изображения требует от врачей перестройки способа мышления и может приводить к большим разночтениям.

Хотя алгоритмы обработки изображений могут обеспечить получение точных количественных показателей (например, измерение фракции выброса левого желудочка сердца по динамической последовательности изображений) или могут решать некоторые задачи, которые невыполнимы при ручной обработке (например, точная регистрация мультимодальных изображений), проблемы надежности и ответственности остаются главными препятствиями на пути широкомасштабного использования этих алгоритмов. Проверка правильности алгоритма часто бывает затруднительна из-за отсутствия теории, позволяющей сравнивать результаты обработки.

Некоторые алгоритмы анализа медицинских изображений требуют больших вычислительных мощностей (например, стохастические алгоритмы типа моделей Маркова, моделирование методом Монте Карло). Поэтому некоторые алгоритмы, про которые известно, что они дают лучшие результаты, не могут использоваться на практике из-за нехватки вычислительной мощности. Если же вычислительных ресурсов хватает, часто можно ускорить эти алгоритмы за счет параллелизма.

Грид-технологии не только обеспечат доступ к большим объемам данных. Они дадут возможность сообществам, занимающимся обработкой изображений, разделять общие наборы данных для сравнения алгоритмов и подтверждения их правильности. Грид-технологии откроют доступ к мощным средствам обработки данных, способным обрабатывать полные наборы данных за разумное время, сравнимое с временем, необходимым для опробования новых алгоритмов. Они облегчат разделение алгоритмов, созданных различными исследовательскими группами, что позволит проводить сравнение алгоритмов. Все эти возможности позволяют надеяться, что грид-технологии будут способствовать созданию алгоритмов для анализа медицинских изображений и повышению их качества.

3.3.2 Регистрация

Методы регистрации имели большой успех у специалистов, занимающихся обработкой медицинских изображений, не только потому, что позволяют создавать усредненные модели (average models), но также и потому, что облегчают сравнение изображений, полученных из множества разных источников. Регистрация может касаться одного пациента (когда регистрируются изображения для одного пациента, но полученные в разное время и / или из разных источников) или многих пациентов (когда сравниваются данные разных пациентов). Она может быть мономодальной (когда регистрируемые изображения получены с использованием одной и той же модальности) или мультимодальной. Критерий сопоставимости, используемый для проведения оптимизации, зависит от типа выполняемой регистрации. Но есть еще и другой способ классификации алгоритмов регистрации, который оказывает наибольшее влияние на процедуру оптимизации и стоимость её выполнения: алгоритмы регистрации часто делят на строгие и нестрогие.

Строгие алгоритмы касаются регистрации изображений для одного пациента: считается, что изображения представляют одно и то же физическое тело (хотя они могут выглядеть совсем по-разному из-за разной модальности их получения), и для сопоставления двух изображений процедура регистрации выполняет строгую трансформацию (сочетание перемещений и поворотов). Строгие трансформации описываются только шестью параметрами (3 степени свободы при перемещении и 3 степени свободы при повороте), и связанный с ними процесс оптимизации обычно легко управляем, если только не обрабатываются очень большие наборы данных. К общим расширениям строгой регистрации относятся регистрация похожести (7 степеней свободы плюс коэффициент масштабирования) или аффинная регистрация (12 степеней свободы плюс анизотропные коэффициенты масштабирования и коэффициенты сдвига).

Нестрогие алгоритмы регистрации применяются к данным, полученным для разных пациентов и представляющим похожие, но разные конфигурации. Нестрогая регистрация является более сложной, чем строгая, поскольку трансформация имеет гораздо больше степеней свободы (часто это параметрическое преобразование с переменной степенью сложности или поле трансформации большой плотности). Нестрогие алгоритмы регистрации требуют гораздо больших затрат (для существующих в настоящее время рабочих станций это часы процессорного времени), поэтому было предложено распараллелить некоторые алгоритмы. Одной из главных задач при разделении нестрогих алгоритмов регистрации в гриде является задача стандартизации формата трансформаций. В настоящее время для кодирования искажений используются такие модели трансформации как В-сплайны, NURBS, радиальные базовые функции или плотные поля перемещений. Понадобится некая общая структура для управления этими моделями, для их сравнения и использования.

Способы коррекции яркости изображения также основаны на процедурах оптимизации и поэтому могут быть отнесены к алгоритмам, требующим больших объемов вычислений, описанным в предыдущем разделе.

3.3.3 Алгоритмы интерактивной обработки изображений

Другая особенность алгоритмов обработки медицинских изображений состоит в том, что некоторые из них должны выполняться в интерактивном режиме:

• для решения проблемы надежности: чтобы гарантировать, что пользователь полностью контролирует результаты выполнения алгоритма путем интерактивного управления;

• для решения вопросов правовой ответственности: автоматическая обработка медицинских данных часто создает проблему правовой ответственности. Если алгоритм выполняется под руководством пользователя, эта проблема снимается.

Чтобы обеспечить работу пользователя в интерактивном режиме, алгоритм должен выполняться за достаточно короткое время, позволяющее пользователю оставаться активным за экраном (обычно при работе с медицинской информацией весь процесс должен занимать не больше нескольких минут). Грид-инфраструктуры способны предоставить вычислительную мощность, необходимую для обеспечения разумного времени выполнения алгоритма, за счет выделения мощных вычислительных ресурсов для интерактивных заданий или путем параллельного запуска приложений. Однако выполнение интерактивных приложений в гриде осложняется из-за необходимости расщепления пользовательского интерфейса (который выдает на экран пользователя информацию о ходе выполнения алгоритма) и самого алгоритма (который выполняется удаленно на ресурсах грида). Поэтому интерактивные приложения, которые предполагается выполнять в гриде, должны быть тщательно спроектированы.