Abstract
Kapustina E.A. Allocation and analysis of numeric characteristics of morphological signs for liver state estimation. As a result of research of existing methods of a liver state estimation on the basis of morphological researches’ results numeric characteristics of morphological signs are allocated. The given characteristics are analysed, unredundancy and sufficiency of signs’ set for a liver state estimation are defined.
Морфологическое исследование гистологического среза печени имеет большое значение, поскольку его результаты позволяют не только поставить или уточнить окончательный диагноз, распознать и исключить другие виды повреждений, определить степень выраженности процесса и стадию заболевания, но и активно используются для оптимизации дальнейшей лечебной тактики и определения эффективности терапии [1,2,3].
Традиционные подходы к анализу результатов морфологического исследования не всегда могут обеспечить своевременность и объективную достоверность поставленного диагноза [4]. В связи с этим актуальной является задача автоматизации и объективизации обработки и анализа данных морфологического исследования с использованием современных компьютерных технологий. Решение этой задачи позволит:
Существующие способы обработки и анализа гистологических срезов тканей печени (табличный подход с использованием диагностических таблиц — шкал гистологических индексов Серова, Кноделль (Knodell), Исхак (Ishak), Дермет (Dermet), Шейер (Scheuer) [4]; модификация этого подхода — классификационная система METAVIR [3]; компьютерные системы микроскопии, работающие с биоптатами печени [5]) обладают несколькими существенными недостатками:
Было выполнено изучение медицинской и технической литературы по данной предметной области; проанализированы существующие системы диагностики, их достоинства и недостатки; изучена существующая и принятая к практике методика оценивания состояния печени. Текущим этапом работы является решение задачи формализации и стандартизации медицинских знаний. Для этого необходимо провести следующие теоретические исследования значимости, информативности диагностических признаков и связей между ними:
В результате анализа существующих методов были выделены следующие морфологические признаки, имеющие соответствующие числовые характеристики:
Было отобрано 71 изображение гистологических препаратов от 23 пациентов отделения гастроэнтерологии Донецкого областного клинического территориального медицинского объединения с заведомо известными диагнозами (11 случаев гепатита B, 12 случаев гепатита C), по которым были рассчитаны приведенные выше показатели. Результаты этой обработки приведены в таблице 1:
N п/п | π1 | π2 | π3 | π4 | π5 | π6 | π7 | |
---|---|---|---|---|---|---|---|---|
1 | 3,0100% | 2,1800% | 0,6800% | 0,1100% | 0 | 5 | 17 | гепатит B |
2 | 14,2100% | 7,7500% | 2,9900% | 2,7600% | 1 | 11 | 19 | |
3 | 4,8200% | 1,8900% | 1,2100% | 0,5000% | 0 | 5 | 16 | |
4 | 31,1500% | 10,7200% | 7,5400% | 9,1600% | 2 | 7 | 17 | |
5 | 12,1900% | 5,2800% | 3,1100% | 2,2400% | 1 | 11 | 17 | |
6 | 1,2000% | 0,9300% | 0,5000% | 0,9100% | 1 | 7 | 14 | |
7 | 0,3000% | 0,5400% | 0,2710% | 1,9170% | 0 | 5 | 15 | |
8 | 11,2800% | 8,2900% | 1,5800% | 2,0900% | 1 | 12 | 15 | |
9 | 7,7100% | 4,8300% | 1,6800% | 2,1600% | 1 | 11 | 19 | |
10 | 5,8300% | 4,6400% | 1,8800% | 2,0700% | 0 | 9 | 16 | |
11 | 14,5000% | 8,8100% | 3,5200% | 5,1461% | 1 | 12 | 14 | |
12 | 26,3400% | 9,1700% | 3,4500% | 2,1300% | 2 | 14 | 22 | |
13 | 10,5200% | 4,9900% | 2,8700% | 2,1880% | 1 | 9 | 16 | |
14 | 7,5700% | 3,7700% | 2,5680% | 3,0500% | 0 | 10 | 8 | |
15 | 15,5900% | 8,5400% | 3,4200% | 2,9970% | 1 | 10 | 10 | |
16 | 13,6500% | 5,5000% | 4,1607% | 3,4620% | 1 | 14 | 12 | |
17 | 21,0000% | 5,5400% | 4,2600% | 2,2900% | 1 | 17 | 13 | |
18 | 12,8900% | 6,2700% | 3,5800% | 5,0400% | 1 | 8 | 15 | |
19 | 20,2900% | 6,5200% | 4,8100% | 4,9500% | 1 | 15 | 25 | |
20 | 4,9200% | 6,9400% | 2,1504% | 4,6700% | 0 | 4 | 16 | |
21 | 15,7300% | 7,4400% | 3,7200% | 3,8200% | 1 | 13 | 19 | |
22 | 17,7200% | 5,3700% | 4,3100% | 3,5710% | 1 | 16 | 29 | |
23 | 21,7000% | 8,0400% | 4,5900% | 4,0120% | 1 | 16 | 11 | |
24 | 29,5600% | 10,5600% | 5,5700% | 2,1598% | 2 | 17 | 33 | |
25 | 14,5800% | 8,1200% | 4,1200% | 3,0701% | 1 | 10 | 37 | |
26 | 25,4600% | 8,1900% | 5,1600% | 4,9100% | 1 | 14 | 29 | |
27 | 1,0500% | 4,6800% | 2,0700% | 3,5300% | 0 | 5 | 7 | |
28 | 15,6400% | 8,8400% | 4,4700% | 4,4900% | 1 | 12 | 19 | |
29 | 29,0570% | 9,9800% | 5,3800% | 3,8600% | 1 | 16 | 33 | |
30 | 17,2900% | 8,7400% | 4,9300% | 4,9500% | 1 | 16 | 22 | |
31 | 25,4300% | 10,7000% | 5,7300% | 3,1592% | 2 | 19 | 26 | |
32 | 15,4300% | 3,3600% | 2,2657% | 3,8100% | 1 | 12 | 34 | |
33 | 19,7000% | 8,7600% | 5,0500% | 4,0900% | 2 | 17 | 41 | |
34 | 14,0900% | 9,5700% | 4,7300% | 4,8500% | 1 | 9 | 17 | |
35 | 20,9300% | 11,2700% | 5,7900% | 5,1020% | 1 | 16 | 27 | |
36 | 54,7800% | 17,7300% | 8,9700% | 6,5640% | 3 | 27 | 41 | гепатит C |
37 | 29,1700% | 9,7600% | 5,0940% | 7,1890% | 2 | 18 | 30 | |
38 | 39,0400% | 10,0900% | 6,4500% | 6,0500% | 3 | 23 | 34 | |
39 | 41,3300% | 11,0500% | 6,6500% | 6,6640% | 3 | 26 | 42 | |
40 | 25,6100% | 10,1500% | 6,2130% | 10,4114% | 2 | 20 | 32 | |
41 | 32,1800% | 10,2700% | 6,3780% | 6,9451% | 2 | 28 | 45 | |
42 | 34,8200% | 11,5000% | 7,0300% | 6,4175% | 2 | 28 | 49 | |
43 | 29,3500% | 10,8800% | 6,5850% | 5,5141% | 1 | 20 | 37 | |
44 | 35,2600% | 11,8700% | 7,2400% | 5,9900% | 1 | 24 | 36 | |
45 | 47,8400% | 15,6800% | 9,4630% | 6,6290% | 2 | 26 | 45 | |
46 | 42,1517% | 11,2300% | 7,4880% | 9,4400% | 2 | 26 | 39 | |
47 | 34,2500% | 11,2400% | 7,4500% | 7,1300% | 2 | 22 | 36 | |
48 | 56,2400% | 18,5600% | 12,7100% | 8,6700% | 3 | 32 | 47 | |
49 | 35,3300% | 12,4500% | 8,6100% | 6,8590% | 3 | 21 | 38 | |
50 | 33,0500% | 11,5200% | 7,8950% | 8,9950% | 2 | 21 | 32 | |
51 | 37,1400% | 12,4400% | 8,5100% | 7,2200% | 1 | 22 | 34 | |
52 | 38,7200% | 9,0000% | 9,3000% | 6,2232% | 2 | 21 | 29 | |
53 | 41,9300% | 12,8100% | 9,3200% | 9,0020% | 2 | 23 | 39 | |
54 | 39,6000% | 11,4270% | 9,3400% | 7,5163% | 2 | 27 | 38 | |
55 | 41,2500% | 12,7360% | 9,3600% | 8,0534% | 1 | 30 | 37 | |
56 | 40,2700% | 14,7000% | 9,3800% | 6,7100% | 1 | 22 | 32 | |
57 | 35,8400% | 11,6860% | 9,4400% | 6,1015% | 2 | 19 | 33 | |
58 | 43,1900% | 13,3000% | 9,5900% | 7,6379% | 3 | 21 | 39 | |
59 | 44,8700% | 11,1200% | 9,7100% | 5,5490% | 2 | 22 | 40 | |
60 | 37,1100% | 14,6800% | 10,7300% | 6,1245% | 2 | 27 | 38 | |
61 | 32,7400% | 14,1300% | 9,8100% | 9,5100% | 1 | 29 | 31 | |
62 | 42,5400% | 12,9000% | 11,5700% | 8,3370% | 3 | 30 | 39 | |
63 | 50,0200% | 13,7900% | 9,6400% | 6,9734% | 3 | 32 | 41 | |
64 | 32,6700% | 14,8300% | 11,9300% | 9,2127% | 2 | 25 | 53 | |
65 | 30,4500% | 11,7130% | 10,6400% | 10,3625% | 2 | 21 | 34 | |
66 | 28,4100% | 11,6541% | 10,6900% | 10,4052% | 1 | 27 | 28 | |
67 | 40,7111% | 13,6600% | 11,8300% | 5,1599% | 2 | 28 | 59 | |
68 | 37,4100% | 11,1150% | 9,8900% | 7,1200% | 1 | 19 | 50 | |
69 | 35,0118% | 10,2300% | 8,6300% | 9,5400% | 2 | 21 | 58 | |
70 | 49,0630% | 11,6200% | 10,6800% | 5,4800% | 3 | 24 | 49 | |
71 | 17,8200% | 10,0800% | 5,6400% | 6,0653% | 1 | 10 | 60 |
Поскольку различные значения признаков π1 — π7 и соответствующие им значения остальных признаков наблюдались по одному разу, то группирование данных по частотам и отыскание условных средних не выполнялись.
По данным таблицы 1 для оценки тесноты линейной связи между выделенными признаками была построена нормированная корреляционная матрица (таблица 2):
N п/п | π1 | π2 | π3 | π4 | π5 | π6 | π7 |
---|---|---|---|---|---|---|---|
1 | 1,00000 | 0,88548 | 0,90030 | 0,70761 | 0,81385 | 0,89340 | 0,74734 |
2 | 0,88548 | 1,00000 | 0,88652 | 0,73968 | 0,69912 | 0,82213 | 0,68888 |
3 | 0,90030 | 0,88652 | 1,00000 | 0,80628 | 0,69128 | 0,86195 | 0,74555 |
4 | 0,70761 | 0,73968 | 0,80628 | 1,00000 | 0,55153 | 0,70166 | 0,59411 |
5 | 0,81385 | 0,69912 | 0,69128 | 0,55153 | 1,00000 | 0,71486 | 0,62799 |
6 | 0,89340 | 0,82213 | 0,86195 | 0,70166 | 0,71486 | 1,00000 | 0,72091 |
7 | 0,74734 | 0,68888 | 0,74555 | 0,59411 | 0,62799 | 0,72091 | 1,00000 |
Данные, приведенные в таблице, хотя и свидетельствуют о том, что между некоторыми признаками имеется линейная корреляционная связь (пары признаков π1 и π2, π2 и π3, π1 и π6), однако не позволяют говорить о достаточно тесной линейной корреляции измеряемых признаков (при выбранном уровне значимости α=0,05). Поэтому можно сделать вывод, что ни один из признаков не может быть предсказан по значению, соответствующему другому признаку, а, следовательно, ни один из признаков не может быть исключен из рассмотрения [6].
Далее требуется определить, насколько хорошо эти признаки помогают провести дискриминацию и позволяют отличить одну группу (гепатит B) от другой (гепатит C). Мы располагаем информацией о некотором числе пациентов, болезнь каждого из которых относится к одному из двух диагнозов. Эта информация представляет собой обучающую выборку для проведения классификации. На основании этой информации нужно найти функции, позволяющие поставить пациентам характерные для них диагнозы. Поскольку перечень возможных классов заранее известен, и каждое наблюдение в имеющейся совокупности мы можем отнести к одному из классов (либо гепатит B, либо гепатит C), то для построения таких различающих функций предлагается использовать методы дискриминантного анализа [7].
Для получения коэффициентов βi дискриминантной функции нужен статистический критерий различения групп. Очевидно, что классификация переменных будет осуществляться тем лучше, чем меньше рассеяние точек относительно центроида внутри группы и чем больше расстояния между центроидами групп. Расстояние между центрами групп оценивается с помощью обобщенного расстояния D2 Махалонобиса, которое характеризует усредненное расстояние групповых средних от общего среднего.
В результате дискриминантного анализа получены:
Таким образом, были получены следующие результаты.
При выделении морфологических признаков и измерении их численных характеристик было получено 7 численных показателей.
Корреляционная связь между выделенными признаками не достаточно тесна при уровне значимости α=0.05, поэтому ни один из признаков не может быть исключен из рассмотрения. Это позволяет говорить о безизбыточности набора выделенных признаков.
Методами дискриминантного анализа была проанализирована способность выделенных количественных признаков разделять совокупность объектов, характеризуемых ими, на классы. Опираясь на рассчитанный критерий D2 Махалонобиса, было установлено, что дискриминация возможна. Это позволяет говорить о достаточности данного набора морфометрических признаков.
Решение задачи формализации и стандартизации знаний позволяет приступить к решению следующих из поставленных ранее задач:
©Капустина Е.А. Выделение и анализ числовых характеристик морфологических признаков для оценки состояния печени // Сборник трудов магистрантов 2005 Донецкого национального технического университета. Выпуск 4. — Донецк, ДонНТУ Министерства образования и науки Украины, 2005