Главная страница ДонНТУ Портал магистров ДонНТУ Поисковая система ДонНТУ
Илюхин
english

Илюхин Евгений Леонидович

Тема: "Разработка специализированной компьютерной системы обработки томограмм новообразований печени"
Научный руководитель: к.т.н., доцент Ярошенко Николай Александрович
Мой e-mail: iluhin@sktel.com.ua


Моя биография
Диссертация
Библиотека
Ссылки
Отчет о поиске
Индивидуальное задание

Автореферат к магистерской работе


Содержание


  1. Актуальность
  2. Цели и задачи работы
  3. Общие сведения об объекте диагностирования
  4. Общая характеристика компьютерной томографии
  5. Обзор существующих методов обработки томограмм
  6. Математические методы, применяемые в магистерской работе
  7. Методы обработки компьютерных томограмм
  8. Фильтрация изображения
  9. Повышение контрастности изображения методом преобразования локальных контрастов
  10. Изменение яркости
  11. Бинаризация
  12. Обнаружение контуров объектов
  13. Нейронные сети Хопфилда и Хэмминга
  14. Обзор результатов и выводы
  15. Список литературы

АКТУАЛЬНОСТЬ


Анимация, демонстрирующая процесс снятия томограммы печени

Каждое новейшее открытие в физике или технике неми­нуемо находит воплощение в медицине; ярким приме­ром тому может служить открытие Рентгена и блиста­тельное его внедрение во врачебную практику. Компьютер­ную томографию (КТ) можно рассматривать как новый виток в развитии рентгенологии, в свою очередь, принципы математи­ческой обработки при построении изображения при КТ легли в основу последних современных разработок.

Данные КТ могут быть использованы для проведения диагно­стической пункции, и, что особенно важно, она может с успехом применяться не только для выявления патологических изменений, но и для оценки эффективности лечения, в частности противоопу­холевой терапии, а также определения рецидивов и сопутствую­щих осложнений. Диагностика с помощью КТ основана на прямых рентгенологических симптомах, т.е. определении точной локализации, формы, размеров отдельных органов и патологиче­ского очага, и, что особенно существенно, на показателях плотно­сти или абсорбции.

Учитывая постановку задачи данной проблемы возникла необходимость разработки системы автоматизации обработки,  полученной при обследовании, осуществляемой на базе ЭВМ. Процесс ручной обработки томограмм в настоящее время является большой проблемой, так как приводит к большим затратам времени и соответственно снижает пропускную способность кабинетов компьютерной томографии.

Реализация данной системы осуществляется с помощью Delphi 7 с целью обработки изображений, а также для реализации удобного для медицинского персонала интерфейса. Данная программа позволяет произвести обработку компьютерных томограмм и поставить диагноз.


ЦЕЛИ И ЗАДАЧИ РАБОТЫ


В магистерской работе я планирую создать СКС, реализующую 2 задачи:

  1. Обработка томограмм новообразований печени.
  2. Постановка диагноза на основании результатов исследований новообразований печени.

Обработка томограмм новообразований печени будет осуществляться с помощью математических методов, описанных в разделе . Программа должна будет осуществлять фильтрацию изображения, регулирование яркости и контрастности, а также оконтуривание и выделение объектов. Далее будет производиться расчет параметров объектов (их размеры, площадь, число объектов, их яркость) и предположить, являются ли эти объекты новообразованиями и если да то какими. Для определения типа новообразований, необходимо исследовать какую яркость имеют те или иные новообразования на томограмме. В этом вопросе требуется помощь врачей и инженеров, работающих с компьютерными томографами.

Постановка диагноза будет осуществляться по результатам исследований и анализов. Для постановки диагноза будут использоваться нейронные сети Хемминга и Хопфилда. В дальнейшем необходимо выяснить, какие исследования использовать при диагностировании. Для решения этого вопроса необходима консультация врачей – онкологов.


ОБЩИЕ СВЕДЕНИЯ ОБ ОБЪЕКТЕ ДИАГНОСТИРОВАНИЯ


В жизнедеятельности человека печень играет важную роль. По анатомическому строению и выполняемым функциям печень от­носится к одному из сложных органов, поэтому правильное и своевременное распознавание различных ее заболеваний являет­ся одним из основных условий для разработки тактики лечебных мероприятий.

Для получения изображения печени и опенки ее функциональ­ной активности используются УЗИ, КТ, сцинтиграфия. ангиогра­фия, при необходимости – лапароскопия и пункционная биопсия под контролем КТ и УЗИ.

УЗИ дает довольно четкие представления об анатомо-топографическом положении, размерах печени, а также о крове­носной системе, желчном пузыре и желчных протоках.

КТ, кроме указанных параметров, позволяет оценить состоя­ние паренхимы, ее плотность и однородность, форму и точные границы целого органа, его долей, портальной системы печени.

Данные сцинтиграфии, особенно эмиссионной однофотонной томографии, кроме анатомо - топографического изображения печени, дают основание судить о ее функциональном состоянии (секреторно – экскреторной функции и печеночного кровотока).

КТ дает достаточно точное представление о патоморфологических и функциональных изменениях этого органа, поэтому зна­ние нормальной анатомии печени и ее функциональных особенно­стей необходимо для правильного анализа томограмм, выпол­ненных на разных уровнях.

Основными показаниями для проведения КТ печени являются первичные и вторичные опухоли, кистозные образования, холелитиаз, опухоли желчного пузыря и протоков, а также цирроз печени, хронические воспалительные процессы, жировая дистрофия, абсцессы, травмы и инородные тела.


Методика исследования


Методика исследования в каждом конкретном случае определяется в зависимости от клинических задач и характера патологического процесса. Режим сканирова­ния и количество срезов, а также необходимость контрастирова­ния определяются в зависимости от объема и протяженности па­тологического процесса в органе, его взаимоотношения с окружающими тканями, а также клинической картиной заболевания и данных УЗИ и радионуклидного исследования.

Методика исследования печени не требует специальной подго­товки больного. Сканирование лучше проводить после легкого завтрака, однако обязательно следует выяснить чувствительность пациентов к йодистым препаратам, используемым для контрасти­рования.

Для оптимизации количества срезов и выбора способа контра­стирования делают томограммы, которые используют для плани­рования толщины и количества срезов. Сканирование печени на­чинается с нижних отделов органа, за нулевой уровень принимают­ся пупочное кольцо либо крыло подвздошной кости по средне-пупочной линии. Для полного исследования печени достаточно сделать 8—12 срезов толщиной 8 мм и шагом томограммы 16 мм, т.е. через 1 срез. Первая серия снимков производится без контра­стирования, чтобы получить общее представление о величине, форме органа, состоянии сосудов и желчных протоков, величине плотности паренхимы. Выполняется сканирование с применени­ем контрастных препаратов, особенно в тех случаях, когда плот­ность патологических образований не отличается от плотности окружающих тканей.

Особое значение при исследовании печени имеет способ кон­трастирования, т.е. количество, концентрация и скорость введе­ния рентгеноконтрастных препаратов. При выяснении природы очаговых образований рекомендуется болюсное введение 50 – 70% контрастного вещества в объеме 100—150 мл.

При диффузных и многоочаговых поражениях проводится инфузионное введение 30% контрастного раствора и количестве 200 – 300 мл. При этом создаются условия длительного контрастирования. В ряде случаев для контрастирования печени используется внутриартериальное введение контраста через чревную или брыжеечную артерии.

Печень в норме на томограммах имеет четкие контуры, гомогенную структуру. Хорошо различаются ее доли. Форма пе­чени меняется в зависимости от уровня томограммы – на срезах, произведенных на уровне ТX, она имеет неопределенную форму, основная масса органа, представленная правой долей, занимает большую часть правой половины брюшной полости, контур ее справа выпуклый, слева и снизу вогнутый и неровный. В передних отделах среза, левее средней линии тела, определяется свод же­лудка, располагающийся под левой половиной купола диафраг­мы. Кзади и левее, чаще по средней фронтальной линии тела, определяется полюс селезенки. На уровне ТХ – XI начинает выяв­ляться левая доля печени, отграниченная от правой по передней поверхности брюшинной серповидной связкой, идущей сагиттально.

Плотность паренхимы печени колеблется у разных лиц в широких пределах от 50 до 70 HU.


Злокачественные опухоли печени


К первичным злокачественным опу­холям печени относятся печеночно-клеточный (гепатоцеллюлярный, гепатома), холангиоцеллюлярный (холангиокарцинома) и смешанный (гепатохолангиома) рак.

Рак печени в начальной фазе развития не имеет выраженных клинических проявлений – отмечаются похудание, чувство тяжести в правом подреберье и гепатомегалия. Поздними симп­томами являются умеренная желтуха, асцит, расширение вен передней брюшной стенки.

При диффузном росте рака печень увеличена незначительно, опухоль не пальпируется, развиваются анемия, асцит, прогресси­рует кахексия. Для лабораторных данных характерны повышение СОЭ, концентрации РЭА, АФП и гипохромная анемия.

Макроскопический гепатоцеллюлярный рак проявляется как солитарная с множеством узлов опухоль. На разрезах опухоли, как правило, отмечается некроз с участками кровоизлияний. На томограммах при гепатоцеллюлярных раках определяются опу­холи узловой или диффузной формы, изменения формы и размеров печени. Если раковая опухоль растет, пронизывая всю пе­чень, то последняя резко изменяет плотность, на томограммах появляются множественные участки разрушения – некроз опухо­ли. Независимо от формы роста наблюдается расширение внутрипеченочных притоков. Большинство опухолей имеют более низкую плотность, чем окружающая паренхима. В ряде случаев при раке печени наступает обызвествление некротических участков. Одним из характерных симптомов рака является быстрое вовлечение в процесс воротной вены, сопровождающееся тромбозом и расширением ее калибра.

Особенно трудно дифференцировать диффузную форму рака, так как опухоль занимает почти всю паренхиму печени, что не по­зволяет в связи с нерезкими перепадами плотности отдельных участков судить о природе объемных образований.

В большинстве случаев плотность опухоли ниже средних показателей плотности печени и колеблется от 40 до 60 HU. Часто на фоне опухолевых образова­ний появляются участки с пониженной плотностью, обусловлен­ной некрозом опухолевой ткани. После внутривенного контрасти­рования изменение плотности опухоли зависит от ее васкуляризации. При хорошо васкуляризованных образованиях плотность может возрастать на 5—10%, а в ряде случаев не отличаться от плотности окружающей ткани или может быть ниже ее.


ОБЩАЯ ХАРАКТЕРИСТИКА КОМПЬЮТЕРНОЙ ТОМОГРАФИИ


Методика проведения компьютерной томографии


Получение компьютерной томограммы (среза) требуемого участка тела на выбранном уровне основывается на выполнении следующих операций:

  1. формирование требуемой ширины рентгеновского луча (коллимирование);
  2. сканирование требуемого участка тела пучком рентгеновского излучения, осуществляемого движением (вращательным и поступательным) вокруг неподвижного тела пациента устройства "излучатель — детекторы"
  3. измерение излучения и определение его ослабления с последующим преобразованием результатов в цифровую форму;
  4. машинный (компьютерный) синтез томограммы по совокупности данных измерения, относящихся к выбранному слою;
  5. построение изображения исследуемого слоя на экране монитора.

В системах спиральных компьютерных томографов сканирование и получение изображения происходят следующим образом. Рентгеновская трубка в режиме излучения обходитнеобходимый участок тела по дуге 360O, останавливаясь через каждые 3O этой дуги и делая продольное перемещение.На одной оси с рентгеновским излучателем закреплены детекторы - кристаллы йодистого натрия, преобразующие ионизирующее излучение в световое. Последнее попадает на фотоэлектронные умножители, превращающие эту видимую часть в электрические сигналы. Электрические сигналы подвергаются усилению, а затем преобразованию в цифры, которые вводят в ЭВМ. Рентгеновский луч, пройдя через среду поглощения, ослабляется пропорционально плотности тканей, встречающихся на его пути, и несет информацию о степени его ослабления в каждом положении сканирования. Интенсивность излучения во всех проекциях сравнивается с величиной сигнала, поступающего с контрольного детектора, регистрирующего исходную энергию излучения сразу же на выходе луча из рентгеновской трубки.

Следовательно, формирование показателей поглощения (ослабления) для каждой точки исследуемого слоя происходит после вычисления отношения величины сигнала на выходе рентгеновского излучателя к значению его после прохождения объекта исследования (коэффициенты поглощения).

В ЭВМ выполняется математическая реконструкция коэффициентов поглощения и пространственное их распределение на квадратной многоклеточной матрице, а полученные изображения передаются для визуальной оценки на экран монитора.

Данные КТ могут быть использованы для проведения диагностической пункции, и, что особенно важно, она может с успехом применяться не только для выявления патологических изменений, но и для оценки эффективности лечения, в частности противоопухолевой терапии, а также определения рецидивов и сопутствующих осложнений. Диагностика с помощью КТ основана на прямых рентгенологических симптомах, т.е. определении точной локализации, формы, размеров отдельных органов и патологического очага, и, что особенно существенно, на показателях плотности или абсорбции. Показатель абсорбции основан на степени поглощения или ослабления пучка рентгеновского излучения при прохождении через тело человека. Каждая ткань в зависимости от плотности, атомной массы по-разному поглощает излучение, поэтому в настоящее время для каждой ткани и органа в норме разработан коэффициент абсорбции (КА) по шкале Хаунсфильда (рис. 1.). Согласно этой шкале, КА воды принят за «0», кости, обладающие наибольшей плотностью,— за + 1000, воздух, имеющий наименьшую плотность,— за - 1000. Исходя из этого, для каждого органа выбран средний показатель КА. Весь диапазон шкалы, в котором представлено изображение томограмм на экране видеомонитора, составляет от – 1024 до + 1024, но может варьировать при помощи так называемой регулировки «окна» вплоть до 0. Разрешающая способность КТ зависит от ряда факторов: локализации, формы, величины и плотности патологического очага; хорошо выявляются опухоли и другие патологические изменения в органах с естественной контрастностью – голова и шея, легкие, кости, а также органы, окруженные жировой клетчаткой. Не представляет трудности диагностика кистозных образований, инородных тел, камней, обызвествленных участков. Минимальная величина опухоли или другого патологического очага, определяемая с помощью КТ, колеблется от 0,5 до 1 см при условии, что КА пораженной ткани отличается от КА здоровой ткани на 10—15 HU.

Шкала Хаунсфильда

Рис.1 Шкала Хаунсфильда.

Для увеличения разрешающей способности КТ была предложена методика «усиления» изображения. Она основана на внутривенном введении рентгеноконтрастных препаратов, в результате которого происходит повышение денситометрической разницы между здоровой тканью и патологическим образованием вследствие их различного кровенаполнения. Увеличение контрастности может быть осуществлено введением в полостные органы газа. Методику «усиления» используют для дифференциальной диагностики злокачественных и доброкачественных образований, когда разница в их плотности отсутствует или незначительна, что не позволяет отграничить патологический очаг от здоровой ткани. Контрастирование также используется при динамических исследованиях для оценки характера и степени функциональных нарушений отдельных органов и систем. Наиболее часто «усиление» используют для выявления опухоли и метастазов в печени, почках и неорганных образованиях, где эффективность методики достигает 25 – 30%. Использование «усиления» необходимо для диагностики гемангиом в связи со специфичностью контрастирования ткани опухоли, что позволяет практически исключить необходимость ангиографического исследования. Методика «усиления» дает хорошие результаты также при диагностике патологических образований в головном мозге, средостении и органах малого таза. Методика «усиления» осуществляется перфузионным или инфузионным введением контрастного вещества, иногда контрастные препараты вводятся в близлежащие органы для создания искусственной контрастности, способствующей дифференциации патологических образований и соседних участков неповрежденной ткани и органов. При использовании методики перфузионного контрастирования препарат с концентрацией йода 60—70% вводится одномоментно из расчета 0,8—1,0 мл/кг массы тела в течение 10—20 с. Сканирование проводится до и после «усиления». Оптимальное время сканирования 10--20 с после введения препарата. При инфузионном «усилении» компьютерная томография проводится в течение капельного введения 100—200 мл 30% раствора верографина. Оптимальное время сканирования – 8 – 10 мин. При диагностических исследованиях отдельных органов, крупных сосудов и сердца используется болюсное внутривенное введение 30 – 40 мл 60% раствора верографина или урографина в локтевую вену в течение 10 – 12с. с помощью автоматического инъектора с одновременным сканированием. Для сканирования сердца применяется приставка «сериокард», специальная программа позволяет проводить динамическое исследование сердца синхронно с ЭКГ. Для динамического исследования сердца и крупных сосудов используется последовательное сканирование на разных уровнях томографирования с получением на каждом из них 2 – 3 срезов со скоростью 7 сканов в 1 мин. После достижения пика контрастирования и компьютерной обработки (сложения сканов) получают информацию о состоянии органов средостения. Для компьютерной ангиографии печени и других органов брюшной полости и малого таза используется болюсное внутривенное введение 20 – 30 мл 50% раствора урографина со скоростью 5 – 8 мл/с.

С помощью КТ не всегда удается установить природу патологического образования, однако совокупность компьютерно-томографических признаков и данных других инструментальных методов диагностики (радионуклидной, ангиографической, ультразвуковой) в сочетании с клинической картиной представляет возможность судить о природе такого образования.


Преимущества использования компьютерной томографии


Компьютерная томография обладает рядом преимуществ перед обычным рентгенологическим исследованием:

  1. Высокой чувствительностью, что позволяет отдифференцировать отдельные органы и ткани друг от друга по плотности в пределах 1 – 2%, а на томографах III и IV поколения – до 0,5%; на обычных рентгенограммах этот показатель составляет 10 – 20%;

  2. В отличие от обычной томографии, где на так называемом трансмиссионном изображении органа (обычный рентгеновский снимок) суммарно переданы все структуры оказавшихся на пути лучей, компьютерная томография позволяет получить изображение органов и патологических очагов только в плоскости исследуемого среза, что дает четкое изображение без наслоения выше и ниже лежащих образований;

  3. КТ дает возможность получить точную количественную информацию о размерах и плотности отдельных органов, тканей и патологических образований, что позволяет делать важные выводы относительно характера поражения;

  4. КТ позволяет судить не только о состоянии изучаемого органа, но и о взаимоотношении патологического процесса с окружающими органами и тканями, например инвазии опухоли в соседние органы, наличие других патологических изменений;

  5. КТ позволяет получить томограммы, т. е. продольное изображение исследуемой области наподобие рентгеновского снимка путем перемещения больного вдоль неподвижной трубки. Томограммы используются для установления протяженности патологического очага и определения количества срезов.


ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ ОБРАБОТКИ ТОМОГРАММ


Данное направление исследований является относительно новым и до конца не разработанным. В программных продуктах, разработанных на данный момент, выполняется только обработка изображения, которая ограничивается фильтрацией, регулированием яркости и контрастности. При этом данные программные продукты не осуществляют оконтуривание и выделение объектов. Все это врач вынужден осуществлять вручную, что влечет за собой увеличение времени обработки томограмм. Эту проблему я попытаюсь решить за счет создания программного продукта, способного с помощью математических методов выделить на имеющейся томограмме объекты, определить их параметры (размеры, площадь, число объектов, их яркость) и предположить, являются ли эти объекты новообразованиями и если да то какими.

Еще одним важным направлением исследований в области обработки томограмм является создание автоматизированных систем получения диагноза на основании данных обследований и анализов. Проблема здесь в том, что алгоритмы диагностирования новообразований еще не автоматизированы.

Рассмотрим основные методы обработки изображний, используемые в существующих системах обработки томограмм.


Фильтрация изображения на основе Вейвелет – преобразования


Селективная вейвелет – реконструкция

Вейвелет - теория была в значительной мере изучена в последние годы как многообещающий инструмент в сжатии изображения и сокращении шума. В их работах, Donoho и Johnstone развивали теоретическую структуру дискретного вейвелет - преобразования для оценки сигналов, искаженных аддитивным белым Гауссовским шумом. Принцип, называемый селективная вейвелет - реконструкция предложен, и показан для приведения к асимптотически оптимальным оценкам для широкого разнообразия сигналов.

Предположим, что мы имеем искаженный сигнал

yi=xi+ni

Гауссовский шум Фото 1/1. Цель состоит в том, чтобы восстановить оптимальный оценщик для желательного сигнала xi, который приводит минимальное значение квадрата ошибки.

Схема селективной вейвелет – реконструкции иллюстрирована на рис. 2.

Селективная вейвелет – реконструкция

Рисунок 2: Блок-схема для схемы подавления шума, основанной на дискретном вейвелет – преобразовании.

Искаженное изображение сначала преобразовано к ряду вейвелет - коэффициентов, то есть, , гдеи z - коэффициенты, соответствующие желаемому сигналу и шуму. Процесс пороговой обработки далее применен к вейвелет - коэффициентам, то есть , где t – пороговое значение. Наконец, инверсное преобразование коэффициентов, подвергшихся пороговой обработке, приводящее оценщик

Есть два пороговых правила:

  1. Твердое пороговое правило: где I(w)- функция индикатора.
  2. Мягкое пороговое правило:

Смысл этого подхода - то, что соседние пиксели показывают высокую корреляцию, которая переводится только в несколько больших вейвелет – коэффициентов. С другой стороны, шум равномерно распределен среди коэффициентов и вообще маленький. С правильно выбранным значением порога шум может быть эффективно подавлен. Оптимальное значение порога

                                     (1)

где N - размер блока в вейвелет - преобразовании.

Избыточное дискретное вейвелет – преобразование

Так как дискретное вейвелет – преобразование не постоянное изменение, работа по устранению шума могла бы значительно измениться, изменяя начальное перемещение, это также приводит к некоторым эффектам блоков в выходном изображении. Постоянство изменения, однако, может быть достигнуто вычислением вейвелет - преобразования всех изменений и выполнением порогового правила на каждом перемещенном блоке. Полученный метод называют избыточное дискретное вейвелет – преобразование. Алгоритм следующий:

  1. Выполните устранение шума на блоке размера N на основе дискретного вейвелет – преобразования.
  2. Добавьте данные без шума к соответствующему положению выходного изображения, и посчитайте число данных для каждого образца.
  3. Переместите окно горизонтально и вертикально, повторите шаг 1 и 2, пока все блоки в изображении не исчерпаны.
  4. Разделите каждый вход в выходное изображение на число повторений.

В нашем алгоритме, мы выбираем N=8, и применяем, или преобразование Хаара (ПХ), или дискретное косинусное преобразование (ДКП) в качестве базы преобразования. Строго говоря, ДКП не вейвелет – преобразование, оно выбрано из-за его хорошего свойства уплотнения энергии так, чтобы желательный сигнал находится только в нескольких положениях в преобразованной области, таким образом, приводя к меньшим артефактам пороговой обработки. Эксперименты показывают, что эти два преобразования проводят сопоставимую работу. Твердое и мягкое пороговое правило оба применены. Отметим, что оптимальная величина порога для мягкого порогового правила получена согласно минимаксному критерию, который подразумевает, что возможность улучшения работы по устранению шума используя различные значения порога для специфических изображений и преобразований.


ПОВЫШЕНИЕ КОНТРАСТА ИЗОБРАЖЕНИЯ


Много изображений, таких как медицинские изображения, изображения дистанционного зондирования, изображения электронной микроскопии и даже наши реальные фотографии, страдают от бедного контраста. Поэтому, очень важно увеличить контраст таких изображений перед дальнейшим проведением обработки или анализа. Уже разработано много методов для того, чтобы увеличить контраст изображения. Наиболее широко используемые методы включают различные контрастные манипуляции и уравнивание гистограммы. Классическая контрастная манипуляция обычно основана на глобально определенной функции растяжения (далее называемая передаточная функция). Обрезание гистограммы может быть необходимо перед попиксельным растяжением. Традиционно уравнивание гистограммы - также глобальный метод том смысле, что повышение основывается на уравнивании гистограммы всего изображения. Однако, признано, что использование только глобальной информации часто недостаточно, чтобы достигнуть хорошего повышения контраста (например, глобальные подходы часто вызывают эффект насыщенности интенсивности).

Чтобы исправлять эту проблему, некоторые авторы предложили ограниченное (или адаптивное) уравнивание гистограммы, которое рассматривает локальное окно для каждого отдельного пикселя и вычисляет новое значение интенсивности, основанное на локальной гистограмме, определенной в локальном окне. Адаптивность может обычно улучшать результаты, но – это большой объем вычислений даже при том, что есть некоторое быстрое выполнение обновлений местных гистограмм. Кроме того, адаптивное уравнивание гистограммы - однородный местный оператор в смысле, что все пиксели в пределах местного окна одинаково вносят свой вклад в определение нового значения центрального пикселя, который рассматривают. Иногда, как например для Гауссовского фильтра, взвешенный вклад всех соседей центрального пикселя более желателен.

Более развитую методику, называют моделью retinex, в ней вклад каждого пикселя в пределах местного окна взвешен путем вычисления локального среднего основанного на Гауссовской функции. Более поздняя версия, названная мультимасштабной моделью retinex, дает лучшие результаты, но требует больший объем вычислений. Другая методика для повышения контрастности основана на Вейвелет(небольшая волна) - разложении и реконструкции и используется для улучшения медицинского изображения.


БЫСТРЫЙ И АДАПТИВНЫЙ МЕТОД ДЛЯ ПОВЫШЕНИЯ КОНТРАСТА ИЗОБРАЖЕНИЯ


Основная идея данного метода - разработать передаточную функцию для каждого пикселя, основанную на локальной статистике. Этот метод является следствием идеи глобальной контрастной манипуляции, но он также наследует преимущества адаптивного уравнивания гистограммы и модели retinex. Кроме того, этот метод демонстрирует свойство мультимасштаба.

В этом разделе мы описываем детали нашего алгоритма. В нашем методе, новая интенсивность определена для каждого пикселя согласно адаптивной передаточной функции, которая разработана на основе местной статистики (локальный минимум/максимум так же как локальная средняя интенсивность).


1. Расчет локального Минимума/Максимума/Среднего


Локальный минимум/максимум/среднее пикселя могут быть просто определены как минимальная, максимальная и средняя интенсивности в пределах локального окна фиксированного размера. Это прямой путь для осуществления, но он имеет две проблемы. Во – первых, требуется много времени, чтобы искать локальный минимум/максимум или вычислять локальное среднее для каждого пикселя. Во-вторых, вычисленные отображения минимума/максимума всегда проявляют некоторые подобные блоку артефакты. Далее мы вычислим локальные карты минимума/максимума/среднего, используя схему распространения.

Один способ устранить подобные блоку артефакты состоит в том, чтобы применить Гауссовский фильтр к полученным картам минимума/максимума, приводя к сглаженным картам минимума/максимума. Однако, это требует дополнительного времени. Показательные и Гауссовские фильтры могут быть осуществлены очень быстро используя схему распространения. Эта идея непосредственно применима к вычислению локальной карты среднего. Правило распространения от соседа, скажем, (m - 1, n) к пикселю (m, n) определено следующим образом:

где C называют фактором проводимости, в пределах от от 0 до 1. Матрица lavg обозначает локальную карту среднего, инициализирующуюся со значениями интенсивности изображения. Вышеупомянутое правило распространения последовательно применено по строкам и по столбцам. Чтобы вычислять локальные карты минимума/максимума, мы должны сделать некоторые модификации на вышеупомянутой схеме распространения, мы вводим далее условную схему распространения. Предположим, что lmin и lmax обозначают локальные карты минимума/максимума, соответственно, и инициализируются со значениями интенсивностей изображения. Условная схема распространения от (m - 1, n) к (m, n) определена следующим образом:


2. Определение функции передачи


Как только мы получим локальную статистику (локальный минимум/максимум/среднее) для каждого пикселя, мы должны разработать передаточную функцию от пикселя к пикселю. Существенная идея для большинства методов повышения контраста должна использовать преимущества растяжения диапазона. Другими словами, узкий диапазон интенсивности оригинального изображения часто расширяется к более широкому диапазону. В нашем методе, оригинальный диапазон пикселя дается абсолютной разницей между полученным локальным минимумом и максимумом интенсивности этого пикселя, то есть, |lmax - lmin |. Это значение изменено согласно кривой, иллюстрированной на рисунке 3(a), где x-координата представляет входной диапазон, в то время как y-координата отображает выходной диапазон. Эта кривая функции составлена из двух круглых дуг:

где w0 – фиксированное значение. Порог w0 используется такой, что, если |lmax - lmin| < w0 , о контрасте думают как шум и следовательно уменьшается. Этим путем мы можем подавить шум изображения, увеличивая детали изображения.

Функция передачи

(a) Растяжение окна (b) функция передачи

Рисунок. 3. Определение функции передачи.

После отображения из узкого исходного диапазона | lmax - lmin |, мы получаем более широкий диапазон (обозначенный w) такой, что lmin и lmax отображены в 0 и w, соответственно. В это время, исходная интенсивность изображения Iold и среднее Aold, которые удовлетворяют lmin <= Iold, Aold <= lmax, должны быть линейно растянуты к их новым значениям Inew, Anew:

Чтобы достигать лучшего повышения контраста, мы принимаем во внимание следующие наблюдения. Если интенсивность изображения около пикселя ниже локального среднего интенсивности, то мы уменьшаем интенсивность изображения, используя вогнутую передаточную функцию. С другой стороны, если интенсивность изображения около пикселя выше чем его локальное среднее интенсивности, мы увеличиваем интенсивность изображения, используя выпуклую передаточную функцию. Эти передаточные функции адаптивно определяются от пикселя к пикселю, основываясь на параметре a, определенном как: a = (Anew- Inew)/128. Конкретно, мы определяем передаточную функцию как сегмент параболической кривой, такой, что передаточная функция является выпуклой, если a<0 и вогнутый, если a> 0 (как видно на рисунке 3 (b)). Отметим, что те кривые конечно могли быть других форм, но использование параболических кривых облегчает получать единой формулы. Чтобы получать явное выражение этих параболических кривых, мы вводим новую систему координат, а именно, X'Y '-систему (см. рисунок 1 (b)). В новой системе, параболические кривые могут быть представлены как::

Чтобы получить выражение в XY-координатах, мы рассмотрим следующее преобразование координат:

Комбинируя (4) и (5), мы имеем явное выражение:

где

После получения передаточной функции для каждого пикселя, мы вычисляем повышенную интенсивность следующим образом:

где f - передаточная функция, определенная в (6).


3. Анизотропное распространение


Фактор проводимости C в (1) и (2) - постоянная величина. В вычислении фильтрования, однако, это является изотропным, что может размывать детали. Общая методика, для исправления этой проблемы известна как анизотропное распространение. С этой идеей в памяти, мы развили анизотропное распространение для повышения контраста. Выражения (1) и (2) становятся:

где R называют фактором сопротивления и вообще выбирается из интервала [0.01 0.1] в наших экспериментах.


ЛОКАЛЬНАЯ АДАПТИВНАЯ МНОГОШКАЛЬНАЯ ОПТИМИЗАЦИЯ КОНТРАСТА


1. Предварительная обработка


Мы начинаем с предварительной обработки значения пикселей изображения, чтобы они представили интенсивность регистрации света. Этот вид обработки примерно подражает преобразованию, достигаемому сетчаткой, и был изучен множеством авторов. Тестовые изображения используемые для демонстрации метода показаны на рисунке 4.

Тестовые изображения

Рисунок 4. Тестовые изображения. Слева: горизонтальная часть тестового изображения, состоящего из вертикальных краев шага. Справа: фотографическое изображение, взятое от 12-битового цифрового фотоаппарата Canon 10D

Многие авторы отстаивают использование многошкального представления контрастного регулирования. Мы анализируем наши изображения, используя управляемую пирамиду, многошкальное представление подполос, основные функции которых - производные радиальной функции размывания. Для этой статьи, мы используем комплексно - оценочную версию этого разложения, с двумя полосами ориентации (вертикальной и горизонтальной).

Метод повышения осуществлен итерационным способом «от грубого – к – точному». Для каждого шага, мы работаем на подполосе, такой же, как остаток нижних частот, который получено восстановлением всех подполос на более низких частотах. Коэффициенты этого остатка нижних частот полосы представляют локальное среднее из изображения, и коэффициенты подполос представляют изменения около этого среднего. Процедура повышения - комбинация трех основных операций, которые описаны в следующих разделах.


2. Уравнивание локального контраста


Возможно самое простое средство усиления контраста состоит в том, чтобы линейно повысить высокие частоты (известный как "неострая маскировка" в фотографической литературе). В пределах многошкальной пирамиды, это может быть достигнуто, умножением коэффициентов в каждой подполосе на скаляр, значение которого больше для полос более высокой частоты. Призывая к его простоте, это решение не удовлетворительно, потому что высоко контрастные и низко контрастные детали повышаются одинаково. Вообще, контраст изменяется широко по типичному изображению, и первичная цель нашего метода состоит в том, чтобы уменьшить это изменение, повышая контраст в тех областях, где он низкий или умеренный, и оставляя его неизменным в областях, где он высокий.

Мы используем нелинейную операцию, чтобы повысить контраст выборочно. Для каждой подполосы, локальная контрастная мера получена на основе средней локальной величины коэффициентов подполосы:

где g - фильтр размывания изображения (Гауссовский, со стандартным отклонением пяти образцов), и b представляет комплекс коэффициентов подполосы. Контраст обычно определяется как отношение изменения сигнала к среднему значению сигнала. Здесь мы используем только силу сигнала, потому что начальное представление области регистрации уже неявно взяло среднее значение во внимание.

Чтобы уменьшать изменение контраста по изображению, каждый коэффициент повышают согласно силе локального контраста сигнала:

b'(x,y) =m(x,y)b(x,y),

где b(x,y) – первоначальный коэффициент, b'(x,y) – обновленный коэффициент, и

Параметр y E [0,1) определяет силу эффекта (маленькая гамма производит большой эффект, и y =1 не производит никакого эффекта), и параметр e (установлено значение 0.01 в наших экспериментах) предотвращает увеличение шума в областях низкого сигнала. Цель контрастирования tc, представляет уровень контраста, к которому c двигается, и под которым описывается.

Этот тип "гамма" регулирования широко используется в области интенсивности, чтобы дать компенсацию нелинейности устройств таких, как электронно-лучевые трубки. Специфическая версия, используемая здесь подтолкнет все контрасты к целевому контрасту, производя пропорционально большее изменение в тех значениях, которые являются далекими от цели чем в тех, которые рядом. Переписанное в области регистрации, это регулирование соответствует взвешенному среднему первоначального контраста и целевого контраста, с весом, определенным y.

Простой выбор целевого контраста tc - глобальный максимум контраста подполосы. В качестве альтернативы, можно одновременно выбирать tc среди всех полос пирамиды, чтобы достигнуть специфической спектральной формы. С тех пор как спектры Фурье естественных изображений показаны многими авторами для отслеживания закона энергии с образцом примерно - 2, мы выбираем ряд целевых контрастов, которые попадают по этой норме с масштабом.

Рисунок 2 показывает результаты этой процедуры повышения, примененной к тестовому изображению, содержащему края шага, так же как 12-битовое линеаризованное цифровое изображение камеры.

Результаты повышения

Рисунок 2. Результаты повышения, вычисленные, применяя "гамма" регулирование (y = 0.5) к контрасту каждой подполосы управляемой пирамиды с двумя ориентациями. Первоначальные тестовые изображения показаны на рисунке 1.


3. Компенсирующее регулирование локального среднего


В областях с очень низкой или высокой интенсивностью, увеличение коэффициентов подполосы может привести к расширению в полном диапазоне интенсивности пикселя. Эти экстремальные значения в таком случае должны быть обрезаны, таким образом частично устраняя эффект контрастного повышения. Обрезки можно избежать, глобально регулируя значение пикселя, но имеется тенденция к понижению глобального контраста.

Наше решение для этой проблемы снова адаптивно. Для тех местоположений, подвергающихся существенному повышению и имеющих очень низкое (или высокое) локальное среднее, мы регулируем сигнал низких частот, перемещая его к глобальному среднему:

где c'(x,y) - контраст измененных коэффициентов. Результат этой операции показан на рисунке 3. Отметьте увеличенный контраст деталей в теневой области на левой стороне фотографического изображения.

Интересно рассмотреть это регулирование в случае, когда c(x,y) постоянна. При этих гомогенных контрастных условиях, m(x, y) постоянна, и регулирование низких частот зависит только непосредственно от величины коэффициентов низких частот. Получающаяся функция - приближенно сигмоидальная нелинейность, которую обычно используют, чтобы сжать весь динамический диапазон фотопленки.


4. Пространственная маскировка особенностей


Два понятия, описанные выше, производят желательное увеличение на видимом локальном контрасте в изображении. Мы находим, однако, что равная модификация энергии на двух коэффициентах с идентичными значениями в различных частях изображения не воспринята как равная, если окружение их коэффициент отлично. Это - "маскирующий" эффект, и это наводит на мысль, чтобы мы должны приспособить модификацию данного коэффициента согласно его пространственному окружению. Кроме того, мы также находим, что метод производит «звон» или артефакты ореола около сильных краев, особенно если они смежны с плоскими областями (см. рисунки 2 и 3). Это из – за размеров пространственных фильтров, используемых в разложении пирамиды, и из – за того, что каждый из коэффициентов, которые вносят свой вклад в представление этих краев, повышается по-разному. Недавняя работа, демонстрирующая высокий динамический диапазон изображений устраняет такие артефакты, используя трудоемкие нелинейные фильтры для генерации полосы низких частот. Здесь, мы предпочитаем развивать решение, которое работает на линейном представлении пирамиды.

И маскировка и проблемы ореола могут быть преодолены, при помощи пространственного маскирования повышений так, чтобы они были применены прежде всего в непосредственной близости деталей изображения. Определенно, мы вычисляем "маску детали", беря средний из контраста регистрации среди всех полос пирамиды в каждом пространственном местоположении.

Эта маска нормализована, чтобы иметь максимальное значение одного. Наконец, изображение результата вычислено, беря среднее первоначального изображения и расширенного изображения пирамиды, взвешенного этой маской детали:

r(x,y) = f(x,y)I'(x,y) + [1 - f(x,y)]I(x,y),

где I'(x, y) - расширенное изображение, которое получено из восстановленной пирамиды, и I(x, y) - первоначального изображения.

В этой статье мы описываем методологию для того, чтобы адаптивно регулировать контраст в пределах цифрового изображения, не вводя видимые артефакты или расширяя полный диапазон интенсивности изображения. Изображение разделено на множество полос частоты, и коэффициенты в каждой полосе изменены, используя нелинейную "гамма" операцию, которая перемещает их локальную среднюю величину к целевому значению. Метод может быть применен к обычному цифровому изображению, чтобы увеличить видимость особенностей, которые могли бы иначе быть потеряны при отображении. Это также уместно для обработки изображений с высоко-динамическим диапазоном, чтобы сделать их более видимыми на дисплее с низко-динамическим диапазоном.


МАТЕМАТИЧЕСКИЕ МЕТОДЫ, ПРИМЕНЯЕМЫЕ В МАГИСТЕРСКОЙ РАБОТЕ


МЕТОДЫ ОБРАБОТКИ КОМПЬЮТЕРНЫХ ТОМОГРАММ


При цифровой обработке изображений обычно используется его представление в памяти в виде матрицы пикселей f(n1,n2), 1<=m1 <= N, 1<= m2 <= N2. Обработка изображения в общем случае заключается в выполнении какого-либо преобразования указанной матрицы, в результате которого формируется набор ее числовых характеристик или новое обработанное изображение. Преобразование может касаться значений элементов или их координат, выполняться над матрицей в целом, группой элементов или как каждым элементом в отдельности.


Фильтрация изображения


Для выбора оптимального вида фильтра сравним линейный фильтр и медиальный фильтр.

Алгоритмы линейной фильтрации изображений

Рассмотрим схему искажения и фильтрации (восстановления) изображений, представленную на рис. 5.

Модель искажения и восстановления 
изображений
Рисунок 5 Модель искажения и восстановления изображений

Целью восстановления искаженного изображения y(n1 ,n2) является получение из него при помощи некоторой обработки изображения, которое близко к идеальному изображению x(n1 ,n2) по заданному критерию. Получающееся в результате обработки изображение будем называть оценкой исходного (идеального) изображения x(n1 ,n2). Определим ошибку оценивания в каждой точке изображения:

(5)

а также среднюю квадратичную ошибку (СКО) через ее квадрат, то есть дисперсию ошибки:

(6)

Критерий минимума квадрата СКО является наиболее универсальным и распространенным критерием качества восстановления при проектировании алгоритмов фильтрации изображений из-за математической простоты. Однако этот критерий имеет недостаток, заключающийся в том, что он не всегда согласуется с субъективным (психовизуальным) критерием качества, основанным в основном на точности передачи контуров.
Указанный критерий является конструктивным и позволяет теоретически рассчитывать оптимальные (дающие минимумы квадрата СКО) алгоритмы фильтрации при рассмотренных моделях наблюдения. Однако оптимальные алгоритмы оказываются весьма сложными для расчета и реализации. В автоматизированных системах обработки изображений предпочтение отдается так называемым квазиоптимальным алгоритмам, которые дают минимум квадрата СКО в некотором классе алгоритмов с заданной структурой и незначительно отличаются от оптимальных по этому критерию. Обычно спектр шума содержит более высокие пространственные частоты, чем спектр идеального изображения. Этот факт наводит на мысль, что простая низкочастотная фильтрация может служить эффективным средством подавления шумов. В принципе любой фильтр с неотрицательными коэффициентами обладает сглаживающими свойствами. Можно предложить следующие сглаживающие маски:

(7)

Коэффициенты масок нормированы с тем чтобы процедура подавления помех не вызывала смещения яркости исходного изображения. Маски отличаются степенью сглаживания шумов (у маски A1 она максимальная, у A3 - минимальная). Выбор коэффициентов маски должен производиться экспериментально. При увеличении степени сглаживания шумов происходит также подавление высокочастотной составляющей полезного изображения, что вызывает исчезновение мелких деталей и размазывание контуров. Если требуемая степень сглаживания с применением маски размера 3х3 не достигается, то следует использовать сглаживающие маски больших размеров (5х5, 7х7).

Медианный фильтр

Медианный фильтр в отличие от сглаживающего фильтра реализует нелинейную процедуру подавления шумов. Медианный фильтр представляет собой скользящее по полю изображения окно W, охватывающее нечетное число отсчетов. Центральный отсчет заменяется медианой всех элементов изображения, попавших в окно. Медианой дискретной последовательности x1 , x2 , ..., xL для нечетного L называют такой ее элемент, для которого существуют (L - 1)/2 элементов, меньших или равных ему по величине, и (L - 1)/2 элементов, больших или равных ему по величине. Другими словами, медианой является средний по порядку член ряда, получающегося при упорядочении исходной последовательности. Например, med(20, 10, 3, 7, 7) = 7. Двумерный медианный фильтр с окном W определим следующим образом:

(8)

Как и сглаживающий фильтр, медианный фильтр используется для подавления аддитивного и импульсного шумов на изображении. Характерной особенностью медианного фильтра, отличающей его от сглаживающего, является сохранение перепадов яркости (контуров). При этом если перепады яркости велики по сравнению с дисперсией аддитивного белого шума, то медианный фильтр дает меньшее значение СКО по сравнению с оптимальным линейным фильтром. Особенно эффективным медианный фильтр является в случае импульсного шума.
Что касается импульсного шума, то, например, медианный фильтр с окном 3х3 полностью подавляет одиночные выбросы на равномерном фоне, а также группы из двух, трех и четырех импульсных выбросов. В общем случае для подавления группы импульсных помех размеры окна должны быть по меньшей мере вдвое больше размеров группы помех. Среди медианных фильтров с окном 3х3 наиболее распространены следующие:

(9)

Координаты представленных масок означают, сколько раз соответствующий пиксел входит в описанную выше упорядоченную последовательность.[4]
Разновидностью медианного фильтра является метод, подавляющий импульсный шум и в то же время минимально изменяющий значения яркости на исходном изображении, состоит в замене яркости пикселов локальных максимумов на локальное максимальное значение яркости между границами и замене пикселов локальных минимумов на локальное минимальное значение между границами:

(10)

здесь P(i) - исходная интенсивность пиксела i; P'(i) - новое значение интенсивности пиксела i. Уравнение (1) представляет минимум из k пикселов, уравнение (2) - максимум из k пикселов.[7]

Проанализировав некоторые методы фильтрации и типы фильтров, для магистерской работы был выбран медиальный фильтр с весовыми коэффициентами равными 1. Этот фильтр наиболее оптимально подходит для фильтрации компьютерных томограмм, так как он сохраняет перепады яркости и убирает шум с изображений.


Повышение контрастности изображения методом преобразования локальных контрастов


Существует технология повышения качества изображений, которая основывается на преобразовании локальных контрастов. Основная ее идея состоит в том, что для каждого элемента изображения сначала определяется локальный контраст, а потом происходит его нелинейное усиление и восстановление яркости данного элемента изображения из уже скорректированного локального контраста. Основные шаги реализации метода представлены на Рис. 6. в виде структурной схемы.

Структурная схема метода усиления локальных контрастов

Рисунок 6. - Структурная схема метода усиления локальных контрастов.

На первом этапе выбирается элемент L(i,j) с координатами (i,j) исходного изображения L, L(i,j) E L.

На втором этапе вычисляется локальный контраст элемента по формуле:

где

а m = Зn, n > 1. Области W1 и W2 представляют собою скользящие окна в виде квадрата с центром в элементе с координатами (i,j). Скользящее окно W1 размещено внутри скользящего окна W2.

Форма и размеры скользящего окна, в общем случае, могут быть произвольными. В большинстве методов размеры апертуры остаются постоянными на протяжении реализации всего метода. Однако существуют методы обработки изображений с адаптивным скользящим окном. Известно, что степень обработки сигналов зависит от размеров апертуры фильтра, а именно при малом размере апертуры фильтра операции усреднения подвергается меньшее число значений, что обеспечивает лучшее сохранение контрастных деталей сигнала. Но при этом шум будет сглажен хуже. И наоборот, при большом размере апертуры фильтра сглаживание шума будет происходить лучше, но при этом возможна "потеря" некоторых контрастных деталей, присутствующих в исходном сигнале. Таким образом, качество обработки изображения можно улучшить путем выбора наиболее подходящих размеров апертуры. Реальные изображения не являются стационарными: они содержат как монотонные области, так и изображения перепада, поэтому на практике трудно подобрать оптимальные размеры апертуры фильтра. В подобных ситуациях качество обработки можно улучшить, если использовать апертуру с большими размерами в монотонных областях обрабатываемого изображения и апертуру с малыми размерами вблизи областей перепада.

Третий этап рассматриваемого метода состоит в нелинейном усилении локального контраста

C’(i,j)=φ[C(i,j)],
где φ[C(i,j)] -нелинейная монотонная функция, которая удовлетворяет условиям
C(i,j)E[0,1], φ[C(i,j)] >= C(i,j), φ[C(i,j)] E [0,1].

Функция φ[C(i,j)] является монотонно возрастающей и определенной на промежутке [0,1]. За функции φ[C(i,j)] принимаются степенные, экспоненциальные, логарифмические и гиперболические функции. Реальные изображения имеют различную природу происхождения и разнообразное семантическое наполнение. Исходные локальные контрасты в тех или иных областях изображения также разные. В некоторых областях они достаточны, а в некоторых потенциально информативных областях их нужно усиливать. Исходя из этого, функции преобразования локальных контрастов бывают двух видов - условно "постоянные" и адаптивные. "Постоянные" обеспечивают одинаковое усиление локальных контрастов в каждой точке изображения. Адаптивные функции преобразования локальных контрастов проводят преобразование (усиление) локальных контрастов в зависимости от характеристик локальных областей. Такой подход обеспечивает более эффективное улучшение изображений с точки зрения их визуального восприятия.

На четвертом этапе происходит восстановление элемента изображения с координатами C(i,j) и скорректированного контрастом C'(i,j). Для этого используют выражение, которое определяется из выражения определения локальных контрастов

При использовании этого метода результирующее изображение получается размытым. Для устранения этого недостатка используется вместо усредненного значения значение центрального элемента L1(i,j). To есть область W1 вырождается в центральный элемент L1(i,j) и принимает размеры п=1. Учитывая это, в дальнейшем будем считать, что

Рассмотренный метод является классическим примером методов класса преобразования локальных контрастов. Он позволяет решить одну из задач улучшения визуального качества изображений.


Изменение яркости


Повышение/снижение яркости – это, соответственно, сложение/вычитание значения яркости с некоторым фиксированным значением, также в пределах от 0 до 255; при этом обязательно необходимо контролировать выход нового значения канала за пределы диапазона 0..255.


Бинаризация


Для определения геометрических характеристик элементов полутоновое изображение необходимо перевести в бинарное. Бинарное изображение – это изображение, пиксели которого могут принимать только два значения: 0 и 1, которые обозначают соответственно черный и белый цвет. В программе бинаризация задана вводом границ области яркости, при этом пиксели имеющие яркость внутри заданной области яркостей примут значение 1 (белый цвет), а остальные пиксели – 0 (черный цвет).


Обнаружение контуров объектов


Для определения характеристик объектов изображения предварительно необходимо отделить их от фона, т.е. найти их границы. Эти границы представляют собой кривые на изображении, вдоль которых происходит резкое изменение яркости или ее производных по пространственным переменным. Нужно локализовать места разрывов яркости или ее производных, чтобы узнать нечто о вызвавших их свойствах изображаемого объекта.

Краем называется граница между двумя областями, каждая из которых имеет равномерную яркость.

Точка считается принадлежащей контуру, если одновременно выполняются два условия:

  1. эта точка принадлежит объекту;
  2. эта точка имеет хотя бы одну соседнюю точку, которая не принадлежит объекту.

Нейронные сети Хопфилда и Хэмминга


Среди различных конфигураций искуственных нейронных сетей (НС) встречаются такие, при классификации которых по принципу обучения, строго говоря, не подходят ни обучение с учителем, ни обучение без учителя. В таких сетях весовые коэффициенты синапсов рассчитываются только однажды перед началом функционирования сети на основе информации об обрабатываемых данных, и все обучение сети сводится именно к этому расчету. С одной стороны, предъявление априорной информации можно расценивать, как помощь учителя, но с другой – сеть фактически просто запоминает образцы до того, как на ее вход поступают реальные данные, и не может изменять свое поведение, поэтому говорить о звене обратной связи с "миром" (учителем) не приходится. Из сетей с подобной логикой работы наиболее известны сеть Хопфилда и сеть Хэмминга, которые обычно используются для организации ассоциативной памяти. Далее речь пойдет именно о них.

Структурная схема сети Хопфилда приведена на рисунке 7. Она состоит из единственного слоя нейронов, число которых является одновременно числом входов и выходов сети. Каждый нейрон связан синапсами со всеми остальными нейронами, а также имеет один входной синапс, через который осуществляется ввод сигнала. Выходные сигналы, как обычно, образуются на аксонах.

Структурная схема сети Хопфилда

Рисунок 7. Структурная схема сети Хопфилда

Задача, решаемая данной сетью в качестве ассоциативной памяти, как правило, формулируется следующим образом. Известен некоторый набор двоичных сигналов (изображений, звуковых оцифровок, прочих данных, описывающих некие объекты или характеристики процессов), которые считаются образцовыми. Сеть должна уметь из произвольного неидеального сигнала, поданного на ее вход, выделить ("вспомнить" по частичной информации) соответствующий образец (если такой есть) или "дать заключение" о том, что входные данные не соответствуют ни одному из образцов. В общем случае, любой сигнал может быть описан вектором X = ( xi: i=0...n-1), n – число нейронов в сети и размерность входных и выходных векторов. Каждый элемент xi равен либо +1, либо -1. Обозначим вектор, описывающий k-ый образец, через Xk, а его компоненты, соответственно, - xik, k=0...m-1, m - число образцов. Когда сеть распознaет (или "вспомнит") какой-либо образец на основе предъявленных ей данных, ее выходы будут содержать именно его, то есть Y = Xk, где Y - вектор выходных значений сети: Y = ( yi: i=0,...n-1). В противном случае, выходной вектор не совпадет ни с одним образцовым.

На стадии инициализации сети весовые коэффициенты синапсов устанавливаются следующим образом:

Здесь i и j - индексы, соответственно, предсинаптического и постсинаптического нейронов; xik, xjk – i-ый и j-ый элементы вектора k-ого образца.

Алгоритм функционирования сети следующий (p – номер итерации):

  1. На входы сети подается неизвестный сигнал. Фактически его ввод осуществляется непосредственной установкой значений аксонов:
    yi(0) = xi , i = 0...n-1,
    поэтому обозначение на схеме сети входных синапсов в явном виде носит чисто условный характер. Ноль в скобке справа от yi означает нулевую итерацию в цикле работы сети.
  2. Рассчитывается новое состояние нейронов
    и новые значения аксонов
    где f – активационная функция в виде скачка, приведенная на рисунке 8а.
    Активационные функции
    Рисунок 8. Активационные функции
  3. Проверка, изменились ли выходные значения аксонов за последнюю итерацию. Если да – переход к пункту 2, иначе (если выходы застабилизировались) – конец. При этом выходной вектор представляет собой образец, наилучшим образом сочетающийся с входными данными.

Как говорилось выше, иногда сеть не может провести распознавание и выдает на выходе несуществующий образ. Это связано с проблемой ограниченности возможностей сети. Для сети Хопфилда число запоминаемых образов m не должно превышать величины, примерно равной 0.15*n. Кроме того, если два образа А и Б сильно похожи, они, возможно, будут вызывать у сети перекрестные ассоциации, то есть предъявление на входы сети вектора А приведет к появлению на ее выходах вектора Б и наоборот.

Когда нет необходимости, чтобы сеть в явном виде выдавала образец, то есть достаточно, скажем, получать номер образца, ассоциативную память успешно реализует сеть Хэмминга. Данная сеть характеризуется, по сравнению с сетью Хопфилда, меньшими затратами на память и объемом вычислений, что становится очевидным из ее структуры (рисунок 9).

Структурная схема сети Хэмминга
Рис. 9. Структурная схема сети Хэмминга

Сеть состоит из двух слоев. Первый и второй слои имеют по m нейронов, где m – число образцов. Нейроны первого слоя имеют по n синапсов, соединенных со входами сети (образующими фиктивный нулевой слой). Нейроны второго слоя связаны между собой ингибиторными (отрицательными обратными) синаптическими связями. Единственный синапс с положительной обратной связью для каждого нейрона соединен с его же аксоном.

Идея работы сети состоит в нахождении расстояния Хэмминга от тестируемого образа до всех образцов. Расстоянием Хэмминга называется число отличающихся битов в двух бинарных векторах. Сеть должна выбрать образец с минимальным расстоянием Хэмминга до неизвестного входного сигнала, в результате чего будет активизирован только один выход сети, соответствующий этому образцу.

На стадии инициализации весовым коэффициентам первого слоя и порогу активационной функции присваиваются следующие значения:

Tk = n / 2

Весовые коэффициенты тормозящих синапсов во втором слое берут равными некоторой величине 0 < e < 1/m. Синапс нейрона, связанный с его же аксоном имеет вес +1.

Алгоритм функционирования сети Хэмминга следующий:

  1. На входы сети подается неизвестный вектор X = {xi:i=0...n-1}, исходя из которого рассчитываются состояния нейронов первого слоя (верхний индекс в скобках указывает номер слоя):
    После этого полученными значениями инициализируются значения аксонов второго слоя:
  2. Вычислить новые состояния нейронов второго слоя:
    и значения их аксонов:
    Активационная функция f имеет вид порога (рис. 8б), причем величина F должна быть достаточно большой, чтобы любые возможные значения аргумента не приводили к насыщению.
  3. Проверить, изменились ли выходы нейронов второго слоя за последнюю итерацию. Если да - перейди к шагу 2. Иначе - конец.

Из оценки алгоритма видно, что роль первого слоя весьма условна: воспользовавшись один раз на шаге 1 значениями его весовых коэффициентов, сеть больше не обращается к нему, поэтому первый слой может быть вообще исключен из сети (заменен на матрицу весовых коэффициентов).

Обсуждение сетей, реализующих ассоциативную память, было бы неполным без хотя бы краткого упоминания о двунаправленной ассоциативной памяти (ДАП). Она является логичным развитием парадигмы сети Хопфилда, к которой для этого достаточно добавить второй слой. Структура ДАП представлена на рисунке 10.

Структурная схема ДАП
Рисунок 10. Структурная схема ДАП

Сеть способна запоминать пары ассоциированных друг с другом образов. Пусть пары образов записываются в виде векторов Xk = {xik:i=0...n-1} и Yk = {yjk: j=0...m-1}, k=0...r-1, где r – число пар. Подача на вход первого слоя некоторого вектора P = {pi:i=0...n-1} вызывает образование на входе второго слоя некоего другого вектора Q = {qj:j=0...m 1}, который затем снова поступает на вход первого слоя. При каждом таком цикле вектора на выходах обоих слоев приближаются к паре образцовых векторов, первый из которых – X – наиболее походит на P, который был подан на вход сети в самом начале, а второй – Y – ассоциирован с ним. Ассоциации между векторами кодируются в весовой матрице W(1) первого слоя. Весовая матрица второго слоя W(2) равна транспонированной первой (W(1))T.

Процесс обучения, также как и в случае сети Хопфилда, заключается в предварительном расчете элементов матрицы W (и соответственно WT) по формуле:

Эта формула является развернутой записью матричного уравнения

В заключении можно сделать следующее обобщение. Сети Хопфилда, Хэмминга и ДАП позволяют просто и эффективно разрешить задачу воссоздания образов по неполной и искаженной информации. Невысокая емкость сетей (число запоминаемых образов) объясняется тем, что, сети не просто запоминают образы, а позволяют проводить их обощение, например, с помощью сети Хэмминга возможна классификация по критерию максимального правдоподобия. Вместе с тем, легкость построения программных и аппаратных моделей делают эти сети привлекательными для многих применений.

  1. Размеры опухоли
  2. Локализация опухоли
  3. Плотность опухоли на томограмме
  4. Наличие на томограмме участков некроза, обезыствления, тромбов
  5. Наличие/отсутствие гепатомегалии
  6. Наличие/отсутствие желтухи
  7. Наличие/отсутствие асцита
  8. Наличие/отсутствие анемии
  9. Значение СОЭ
  10. Концентрация РЭА
  11. Концентрация АФП

ОБЗОР РЕЗУЛЬТАТОВ И ВЫВОДЫ


Обобщая работы исследователей, занимающихся обработкой томограмм, можно сказать, что на сегодняшний день основной упор делается на повышение качества изображения, а именно, фильтрации, контрастированию томограмм. Но при этом не уделяется внимание поиску объектов на изображении. Процесс ручной обработки томограмм в настоящее время является большой проблемой, так как приводит к большим затратам времени и соответственно снижает пропускную способность кабинетов компьютерной томографии.

В своей работе я постарался выбрать наиболее оптимальные методы контрастирования и фильтрации из тех, которые используются в уже существующих системах обработки томограмм. Используя методы бинаризации и оконтуривания, я выделяю на томограмме объекты, определяю их размеры и площадь. На основании данного подхода, разрабатывается компьютерная система, основанная на нейросетевом моделировании. Создана нейронная сеть, способная адекватно реагировать на входные воздействия и обеспечивать постановку диагноза новообразований печени, что доказывает правильность выбранного метода. Реализуемый программный продукт будет содержать в себе опыт и знания ведущих специалистов в этой области. Таким образом, использование нейронных сетей при обработке компьютерных томограмм новообразований печени позволит создать эффективную СКС. Программа, реализуемая в магистерской работе, уникальна в своем роде, поскольку на сегодняшний день не имеет аналогов.


СПИСОК ЛИТЕРАТУРЫ


  1. Габуния Р.И. «Компьютерная томография в клинической диагностике», М: 1995., с.134 - 153
  2. Ермолов А.С., Ходарева Н.Н. «Компьютерно - томографическая семиотика острого панкреатита»//Журнал «Российский журнал гастроэнтерологии, гепатологии, колопроктологии», №4, 1996., с.48 - 52.
  3. Бобровнік Ю. «Комп'ютерна томографія: сучасні програми постпроцесінгу та їх можливості»//Журнал «Променева діагностика, променева терапія», №3, 2002., с.74 - 78.
  4. Зонневельд, Ф.В. «ОБЩАЯ ХАРАКТЕРИСТИКА КОМПЬЮТЕРНОЙ ТОМОГРАФИИ» //Журнал «Медицинская визуализация», январь – март 1999, с.44 - 52
  5. Zeyun Yu, Chandrajit Bajaj A FAST AND ADAPTIVE METHOD FOR IMAGE CONTRAST ENHANCEMENT
    Исходный URL: http://ccvweb.csres.utexas.edu/cvc/papers/ICIP04.pdf
  6. Nicolas Bonnier, Eero P. Simoncelli LOCALLY ADAPTIVE MULTISCALE CONTRAST OPTIMIZATION
    Исходный URL: http://www.cns.nyu.edu/pub/eero/bonnier05a.pdf
Главная страница ДонНТУ Портал магистров ДонНТУ Поисковая система ДонНТУ