«ДІАГНОСТИКА ЗАХВОРЮВАНЬ СЕЧОВИДІЛЬНОЇ СИСТЕМИ З ВИКОРИСТАННЯМ ЕКСПЕРТНОЇ СИСТЕМИ»
Вступ. Розвиток нових методів діагностики, а також розширення можливостей вже існуючих методів було і залишається актуальним завданням в медицині. Поява новітніх діагностичних і лікувальних технологій вимагають використання методів штучного інтелекту для обробки та інтерпретації даних з можливістю накопичення, зберігання і багаторазового використання медичних даних [1]. Одним з найбільш ефективних засобів у даній області є експертні системи. Вони дозволяють автоматизувати процес прийняття рішення під час огляду пацієнтів, підвищуючи рівень кваліфікації користувача до рівня досвідчених експертів [3]. Тому необхідно, щоб експертні системи володіли можливістю гнучкої постановки завдань, були застосовні до всіх областей біології та медицини, володіли великої інформаційної ємністю і перешкодостійкістю, не потребували тривалому часу для розробки [1]. Безперервне розвиток засобів обчислювальної техніки розширює потенційні можливості подібних систем, у зв'язку, з чим необхідно постійно поповнювати знання в даній області.
Експертні системи протягом тривалого часу застосовуються в медицині для діагностики захворювань. Кожна система при цьому володіє обмеженою сферою застосування, у зв'язку з початковою спрямованістю розробки. Застосування цих експертних систем в областях, для яких вони споконвічно не були призначені, утруднене і часто просто неможливо, в тому числі тому, що вони обмежені вбудованими способами виведення [3]. Внаслідок цього виникають потреби в розробці експертних систем, які є вузькоспрямовані і дозволяють проводити діагностику захворювань окремих систем організму людини. Зокрема захворювання сечовидільної системи.
Побудова дерева рішень. При використанні цього підходу в програмі протоколюється послідовність питань, що задаються лікарем при вирішенні діагностичної проблеми. Такий протокол структурується у вигляді дерева. Кожна вершина такого дерева являє собою певне питання, що задається хворому, а розгалуження, що виходять з вершини, відповідають альтернативним відповідей на питання і ведуть, у свою чергу, до нових питань. Програма здійснює перехід від питання до питання до тих пір, поки не буде знайдено рішення або вичерпані можливі переходи. Недоліком такого підходу можна вважати наступне:
• при спробі побудувати подібні дерева для вирішення складних діагностичних завдань кількість вершин і розгалужень стає настільки великим, що аналіз логічного дерева виявляється вкрай складним;
• найменші зміни, що вносяться до логіку програми, призводять до необхідності будувати дерево заново і перепрограмувати всю задачу.
У той же час такий підхід вкрай зручний, тому що дозволяє представити в програмі логіку складання послідовності питань лікарем при вирішенні діагностичної задачі в клінічних умовах. Цей підхід дозволяє імітувати процес прийняття рішення лікарем при постановці діагнозу. Статистична обробка даних. Цей підхід полягає у застосуванні методів математичної статистики. Він грунтується на обробці великих масивів інформації, зібраних по захворюваннях, що підлягають машинної діагностиці. Оброблена інформація може використовуватися різним чином. Частина медичних експертних систем базується на використанні теорії розпізнавання образів. При цьому необхідно мати деяке безліч конкретних історій хвороб з відомими діагнозами. Такі безлічі аналізуються з метою визначення статистично «типовою» для кожного захворювання картини - образу. Визначаються ті ознаки захворювання, які найбільш характерні для нього, виходячи із зібраної інформації, підданої статистичної обробки. «Типові» картини захворювань використовуються при аналізі історії кожного конкретного пацієнта, для визначення того, наскільки «схожий» розглянутий випадок на «типовий». Оцінюючи «відстань» між порівнюваних картинами, програма формує рішення про діагноз.
Серед найбільш відомих способів представлення знань згадаємо продукційний. При даному підході реалізується чіткий поділ між даними, операціями і управлінням. Можна виділити якусь глобальну базу даних (не слід плутати її з базою даних у традиційному розумінні), над якою виконуються деякі дії, описувані сукупністю правил продукції. Управління цим процесом відбувається відповідно до деякої глобальної стратегією управління. Глобальна база даних - це структура даних, аналізована і перетворюються системою ШІ. Вид бази залежить від розв'язуваної задачі і може бути простим (як, наприклад, облікова структура) або складним. Правила продукції складаються з двох частин: умова (ліва частина) і дія (права частина). Умова встановлює застосовність правила до бази даних. Дія полягає у зміні інформації в глобальній базі даних. Система управління вибирає, яке з кількох застосовних правил повинно бути використано, а також визначає момент припинення подальших дій шляхом перевірки термінальних умов на базі даних. Пошук рішення здійснюється на основі двох основних підходів. Метод «від даних до мети» полягає в послідовному зміну бази даних усіма правилами, які можуть бути застосовані, і в пошуку після зміни нових застосовних правил. Пошук закінчується за наявності твердження, що є рішенням, або при виконанні умови припинення пошуку. Метод «від мети до даних» зводиться до перевірки деяких тверджень, які можуть виступати в якості найбільш ймовірних рішень. При цьому проводиться пошук правих частин правил з метою виявлення шуканого затвердіння і перевірка лівих частин відповідних правил на базі даних - при підтвердженні або гіпотеза вважається дійсною, або ліва частина розглядається в якості нової гіпотези.
Цілі і завдання. Захворювання сечовидільної системи надзвичайно широко поширені і представляють серйозну проблему для охорони здоров'я в усьому світі. Причин, що викликають захворювання сечовидільної системи, дуже багато. Найпоширеніші причини: інфекційні захворювання, алкоголь і куріння, неочищена вода, недоброякісні продукти і гостра їжа, переохолодження організму.
Завдання розробляється експертної системи медичної діагностики полягає у визначенні можливих діагнозів хворого на основі знань про захворювання сечовидільної системи та даних його обстеження, до яких відносять результати аналізу сечі, крові, УЗД нирок і сечового міхура.
Дана експертна система заснована на концептуалізації предметної області, явне подання якої називають онтологією. Наведемо загальне формальний опис моделі онтології медичної діагностики [5].
Рисунок 1 - Структура експертної системи (Анімація: обсяг = 16Кб; розмір - 585x371 px; нескінченне число циклів повторення)
Процеси, що протікають в організмі пацієнта, можна умовно поділити на зовнішні (що спостерігаються) і внутрішні, які є предметом діагностики. Спостережувані процеси будуть називатися ознаками, а внутрішні - захворюваннями. Ознаки мають значення, що утворюються в результаті спостереження цих ознак, причому значення ознак можуть змінюватися з плином часу. Значення ознак є якісними (скалярними). Ознаки є підкласом класу спостережень. Іншим підкласом класу спостережень є анатомо-фізіологічні особливості організму пацієнта. Останні також мають скалярні значення; в даній роботі вважається, що ці значення не можуть змінюватися в часі. Останнім підкласом спостережень є події, які сталися з пацієнтом, які також мають скалярні значення.
Загальна модель онтології є основою експертної системи, яка і буде обробляти вхідні дані.
Метод рішення задачі. Етап обробки вхідної інформації здійснюється безпосередньо лікарем. Результатом його роботи стають дані пацієнта, внесені в базу даних, яка розроблена в середовищі Microsoft Access. Лікар вносить дані за допомогою екранної форми.
Система організації роботи знаходиться на клієнтському рівні, тому вимагає постійної участі лікаря у введенні і коригування внесених і редагувати даних, у свою чергу дозволяє не допускати помилок у вхідних даних.
У результаті роботи ЕС отримаємо діагноз, тобто конкретний вид захворювання, якщо воно, звичайно, було виявлено, в іншому випадку лікарю пропонується призначити пацієнту додаткові обстеження.
Вихідним діагнозом може бути:
а) Пієлонефрит;
б) Сечокам'яна хвороба;
в) Гідронефроз;
г) Ниркова недостатність і ін.
Процес створення ЕС є ітераційним, тому на перших порах необхідно максимально обмежувати число вхідних величин, використовуючи лише найбільш значущі. Якщо гіпотеза про достовірність експертної оцінки не підтверджена, тоді необхідно використовувати додаткові вхідні величини. Такий підхід гарантує відсутність надмірної інформації в базі даних, що підвищує надійність функціонування ЕС. Кількість рівнів по кожній вхідний величиною залежить від коефіцієнта значущості цієї величини і від величини похибки лабораторного обладнання. Слід пам'ятати, що кількість вхідних величин і їх рівнів постійно збільшуються, у зв'язку з вдосконаленням лабораторного обладнання і збільшення бази даних, що сприяє підвищенню достовірності експертної оцінки.
Природним методом вирішення такого завдання є перебір всіх можливих значень вихідних даних (окремих захворювань). Для кожного захворювання виконується рішення прямої задачі - побудова всіх можливих варіантів розвитку причинно-наслідкових зв'язків (на основі інформації з бази знань, сформованої експертами, значень анатомо-фізіологічних особливостей пацієнта і значень, що відбулися з ним подій) і пошук серед них такого, якому відповідають це стрімке значення ознак пацієнта.
Результатом розв'язання задачі буде одне з двох:
• або повідомлення про те, що пацієнт здоровий, із зазначенням причин спостережуваних значень ознаки;
• або кілька взаємовиключних діагнозів, кожен з яких представляє собою одне захворювання, яким хворий пацієнт, разом із зазначенням причин значень ознак.
Проведений аналіз літературних джерел показав, що найбільш ефективним алгоритмом рішення задачі діагностики захворювань є алгоритм, що використовує нечіткі терми [5].
Алгоритм розв'язання цієї задачі є вельми нетривіальним. Основна робота полягає в правильній організації бази знань.
База знань представляється у вигляді:
(1)
де - Нечіткий терм, якими оцінюється значення входу ; Вихід у оцінюється нечітких термів , M - кількість термів, використовуваних для лінгвістичної оцінки вихідних даних.
Логічний висновок грунтується на відомому алгоритмі виведення в експертних системах, формалізоване узагальнення якого розподілена так.
Нехай - Функція належності входу ( ) Нечітких термів , Тобто , Де - Сукупність пар елементів підмножини;
-Функція належності виходу у нечітких термів ;
(2)
ступінь приналежності входу ( ) Нечітких термів з бази знань визначається наступного системою нечітких логічних рівнянь:
; (3)
нечітке підмножина , Відповідне входу ( ), Визначається як
(4)
де - Операція об'єднання нечітких підмножин;
чітке значення виходу - y, відповідне входу ( ) Визначається методом медіани:
(5)
де G - потужність нечіткого підмножини.
Сам алгоритм розбитий на кілька підзадач, одна з яких є головною (керуючої):
1. Перевірити для кожного спостерігався ознаки виконання необхідної умови.
2. Якщо для якогось із спостерігалися ознак не виконано необхідна умова, то дані про пацієнта вважати некоректними і завершити роботу.
3. Перевірити гіпотезу про те, що пацієнт здоровий.
4. Якщо гіпотеза про те, що пацієнт здоровий, підтвердилася,
4.1. то вважати результатом діагноз, в якому відсутні захворювання, а також його пояснення (отримані причини спостережуваних значень ознак);
4.2. інакше перебрати всі захворювання з бази знань і для кожного:
4.2.1. перевірити виконання необхідної умови для цього захворювання;
4.2.2. якщо необхідна умова виконана, то перевірити гіпотезу про те, що пацієнт хворий цим захворюванням, що почалася в момент початку спостережень, і у разі її підтвердження додати це захворювання разом з його поясненням (отриманими причинами спостережуваних значень ознак) до безлічі рішень;
5. Завершити роботу, видавши отримані результати (діагноз та причини значень ознаки).
Розглянемо на прикладі:
У пацієнта наступний аналіз крові:
Общевоспалітельние зміни: лейкоцитоз, прискорення ШОЕ, зсув лейкоцитарної формули вліво, при вираженому запаленні - анемія.
1. Перевіряємо для ознаки загальний аналіз крові, виконання необхідної умови: кількість формених елементів.
2. Якщо для даної ознаки не виконано необхідна умова (вводяться дані повинні бути не менше мінімального порогу і не більше максимального порогу), то дані про пацієнта вважати некоректними і завершити роботу.
3. Перевірити гіпотезу про те, що пацієнт здоровий.
4. Якщо гіпотеза про те, що пацієнт здоровий, підтвердилася,
4.1. то виводимо результат, що пацієнт здоровий;
4.2. інакше перебираємо всі захворювання з бази знань і для кожного:
4.2.1. перевіряємо виконання необхідної умови (зсув лейкоцитарної формули ліворуч) для цього захворювання;
4.2.2. дана умова виконується для захворювання пієлонефрит. Перевіряємо гіпотезу про те, що пацієнт хворий даним захворюванням і у разі її підтвердження додаємо це захворювання разом з його поясненням (отриманими причинами спостережуваних значень ознак) до безлічі рішень;
5. Завершити роботу, видавши результат:
Захворювання: пієлонефрит.
Ознаки: лейкоцитоз, прискорення ШОЕ, зсув лейкоцитарної формули вліво, при вираженому запаленні - анемія.
Даний приклад з використанням загальної схеми алгоритму з однією ознакою є дуже узагальненим. Однак він наочно показує роботу експертної системи.
Висновки.
У даній статті вибраний і описаний оптимальний алгоритм для експертної системи діагностики захворювань сечовидільної системи, який задовольняє наступним вимогам [5]:
1) Забезпечує необхідну точність постановки діагнозу.
2) Дозволяє аналізувати симптоми і взаємозв'язок між ними протягом тривалого періоду.
Виконано опис бази даних і наведена екранна форма роботи з БД. Описано база знань і формалізований узагальнення логічного виведення інформації.
Основна підпрограма алгоритму наочно показано в роботі з зразковим діагнозом за даними аналізу крові.
Список літератури
1. Статические и динамические экспертные системы: Учебное пособие / Э.В. Попов, И.Б. Фоминых, Е.Б.Кисель, М.Д. Шапот. — М. :Финансы и статистика, 1996. — 320 с.
2. Автоматизированное проектирование информационно-управляющих систем. Проектирование экспертных систем на основе системного моделирования / Г. Г. Куликов, А.Н. Набатов, А.В. Речкалов и др. ;Уфимск. гос. авиац. техн. ун-т. — Уфа, 1999. — 223 с.
3. Куликов Г. Г., Брейкин Т.В., Арьков В.Ю. Интеллектуальные информационные системы : Учебное пособие. — Уфа: УГАТУ, 1999. — 129 с.
4. Тельнов Ю.Ф. Интеллектуальные информационные системы в экономике. — М., 1998. — 174 с.
5. Клещёв А.С., Москаленко Ф.М., Черняховская М.Ю. Модель онтологии предметной области «медицинская диагностика». Часть 2. Формальное описание причинно-следственных связей, причин значений признаков и причин заболеваний // НТИ. Сер. 2. – 2006. – № 2. – С. 19-30.
6. Черняховская М.Ю., Негода В.И., Москаленко Ф.М. Формальное представление знаний о конъюнктивитах. – Владивосток: ИАПУ ДВО РАН, 2008. – 55 с.
7. Клещев А.С., Шалфеева Е.А. Определение структурных свойств онтологий // Изв. РАН. Теория и системы управления. – 2008. – № 2. – С. 69-78.
8. Клещев А.С., Орлов В.А. Компьютерные банки знаний. Многоцелевой банк знаний // Информационные технологии. – 2006. – № 2. – С. 2-8.
9. Список банков знаний Многоцелевого банка знаний. – [Электронний ресурс]: http://mpkbank2.dvo.ru/mpkbank/index.php?page=banks.
10. Москаленко Ф.М. "Экспертная система медицинской диагностики, основанная на реальной онтологии медицины, для многопроцессорной ЭВМ" // Труды II между- народной конференции «Параллельные вычисления и задачи управления» PACO’2004 памяти Е.Г.Сухова. М.: Институт проблем управления им. В.А. Трапез- никова РАН, 2004. С.999–1084.