МУЛЬТИДИСЦИПЛИНАРНАЯ СИСТЕМА УПРАВЛЕНИЯ

ИНФОРМАЦИОННЫМИ РЕСУРСАМИ РАЗЛИЧНЫХ

УРОВНЕЙ ОБЩНОСТИ

Авторы: И. Л. Артемьева, Т. Л. Гаврилова, В. В. Грибова, А. С. Клещев, М. А. Князева, Н. Ю. Никифорова, В. А. Орлов, М. Ю. Черняховская, Е. А. Шалфеева

Источник: http://www.iacp.dvo.ru/is/publications/4Text_all.doc


ВВЕДЕНИЕ

В последние десятилетия было выдвинуто не­сколько перспективных проектов, развитие кото­рых, после демонстрации потенциальных пре­имуществ, затормозилось. Самым старым из них является проект массового создания экспертных систем, более новыми — проекты семантического Интернета и агент-ориентированного программи­рования. Практическое использование научных результатов, полученных при выполнении этих проектов, пока проблематично.

Система, основанная на знаниях, состоит из двух частей — оболочки и базы знаний, а эксперт­ная система — основанная на знаниях система, база знаний которой имеет высокий уровень ком­петентности. В начале 1980-х гг. казалось, что мас­совой разработке практически полезных эксперт­ных систем препятствует недостаточная произво­дительность компьютеров. Однако настоящим камнем преткновения для этой технологии оказа­лась высокая трудоемкость создания и сопровож­дения компетентных баз знаний. Система, осно­ванная на знаниях, без гарантий компетентности ее базы знаний и сопровождения разработчиков (поддержания на современном уровне) в течение достаточно длительного времени, не имеет шан­сов быть коммерческим продуктом. Главная про­блема — кто и как будет создавать и сопровождать компетентные базы знаний для экспертных систем.

Интернет уже давно стал огромным хранили­щем полезной информации, ориентированным на людей. Однако чем больше такой информации в Интернете, тем труднее найти в этом хранилище релевантную информацию. Проект семантическо­го Интернета направлен на решение этой пробле­мы путем хранения в Интернете онтологии, в тер­минах которых представлена информация, и бла­годаря унификации ее представления. Однако и здесь возникла похожая проблема — кто и как бу­дет создавать и сопровождать онтологии и обеспе­чивать унифицированное представление инфор­мации в Интернете.

Проект агент-ориентированного программиро­вания направлен на массовую разработку агентов — программ, функционирующих в сети Интернет, способных взаимодействовать друг с другом и вы­полняющих полезную работу по заданиям других агентов. Взаимодействие агентов также должно осуществляться в терминах онтологии, хранящих­ся в Интернет. И здесь возникает та же проблема, что и для семантического Интернета.

Решение этих проблем можно найти, если вос­пользоваться двумя основополагающими принци­пами [1, 2]:

В настоящей работе рассматривается подход к проблеме управления информационными ресурса­ми, основанный на этих принципах.

1. ИНФОРМАЦИОННЫЕ РЕСУРСЫ РАЗЛИЧНЫХ УРОВНЕЙ ОБЩНОСТИ

Под информационными ресурсами различных уровней общности будем понимать языки специ­фикации онтологии (вообще говоря, любые искус­ственные языки), онтологии различных уровней общности (онтологии верхнего уровня; метаонто-логии; онтологии предметных областей; онтоло­гии знаний и данных и т. п.), знания и данные [3].

Традиционным средством представления ин­формации являются искусственные языки, обла­дающие конкретным синтаксисом, задаваемым грамматикой, и точной семантикой, задаваемой, как правило, неформально. Простейшим из них является вербальное представление. Будем назы­вать информацию (некоторую идею) вербализуе­мой, если она может быть представлена в виде отображения некоторого конечного множества терминов в множество значений. Само такое пред­ставление (отображение) будем называть вербаль­ным представлением информации. Неявное опре­деление смысла терминов, использованных в вер­бальном представлении информации, может быть дано с помощью концептуализации — множества всех имеющих смысл (несущих информацию) вер­бальных представлений с этим множеством тер­минов. Явное представление концептуализации называется онтологией [4]. Явное представление некоторого собственного бесконечного подмно­жества концептуализации называется знаниями о совокупности информации, представляемой этим подмножеством.

Для любого искусственного языка может быть определен абстрактный синтаксис, в терминах ко­торого может быть представлен любой текст на этом языке. Такое представление есть вербальное представление этого текста. Таким образом, любая информация, представимая на некотором искусст­венном языке, является вербализуемой.

Информационные ресурсы различных уровней общности образуют некоторую иерархию [3]. На ее верхнем уровне находится описание вербального представления в терминах самого этого представ­ления. В терминах этого же представления может быть описан абстрактный синтаксис любого ис­кусственного языка. В терминах абстрактного син­таксиса достаточно мощного языка спецификации онтологии может быть описана любая онтология. В терминах онтологии более высокого уровня об­щности могут быть описаны онтологии менее вы­сокого уровня общности. В терминах онтологии знаний могут быть описаны базы знаний, а в тер­минах онтологии данных (схем баз данных) — ба­зы данных. Кроме того, базы знаний могут рас­сматриваться как описания некоторых совокуп­ностей информации в вербальном представлении.

2. УПРАВЛЕНИЕ ИНФОРМАЦИОННЫМИ РЕСУРСАМИ

Под управлением информационными ресурса­ми различных уровней общности в настоящей ра­боте понимается деятельность по созданию и хра­нению информационных ресурсов, поддержанию их на современном уровне, а также организации к ним доступа всех заинтересованных лиц. Главная проблема — найти разумный компромисс между централизацией и децентрализацией этой деятель­ности. Централизация управления информацион­ными ресурсами делает эту деятельность неудоб­ной для ее участников, а децентрализация ведет к снижению качества информационных ресурсов.

В качестве метафоры для управления информа­ционными ресурсами можно рассматривать науч­ную деятельность. Наука имеет дело с информа­ционными ресурсами различных уровней общнос­ти — научными диалектами языка деловой прозы, системами понятий различных уровней общности, системами знаний и данных. Научное сообщество децентрализованно — оно разбросано по разным странам, институтам и лабораториям. Децентрали­зованно создаваемые информационные ресурсы (например, научные статьи) становятся доступны­ми научному сообществу через научные журналы, редакционные коллегии которых централизован­но обеспечивают необходимый научный уровень и новизну этих ресурсов. Монографии и учебники представляют собой согласованное объединение этих информационных ресурсов в единых систе­мах понятий и на принятых научных диалектах. Журналы и научные издательства являются цент­рами распространения научной информации, а библиотеки — ее централизованными хранилища­ми. Эта метафора была положена в основу прото­типа Интернет-системы управления информаци­онными ресурсами различных уровней общности (Многоцелевого банка знаний), которая в настоя­щее время проходит испытания и вводится в экс­плуатацию в Институте автоматики и процессов управления ДВО РАН [3].

Все информационные ресурсы, которые управ­ляются средствами системы, физически находятся на выделенном сервере. На верхнем уровне иерар­хии эти ресурсы объединены в крупные единицы — специализированные банки знаний. Администра­тор системы принимает решение о создании но­вых специализированных банков знаний при на­личии заинтересованных и компетентных пользо­вателей.

Каждый специализированный банк знаний со­стоит из основной и экспериментальной областей (студенческий банк — только из эксперименталь­ной области). В основной области находятся прове­ренные информационные ресурсы, доступные для обработки компьютерными программами. В экс­периментальной области ресурсы создаются и

модифицируются. Решение о переводе ресурсов из экспериментальной в основную область (их пуб­ликации) принимает администратор специализи­рованного банка знаний по результатам их провер­ки и оценки качества. Кроме того, каждый специ­ализированный банк знаний состоит из разделов, число и названия которых определяет админист­ратор этого банка.

Связь пользователей с администраторами осу­ществляется через сайт Многоцелевого банка зна­ний. Пользователи запрашивают необходимые им полномочия на создание, редактирование или ис­пользование информационных ресурсов банка, а соответствующий администратор наделяет их эти­ми полномочиями через административную систе­му, проверяя необходимый для этого уровень ком­петенции пользователей.

Создание, редактирование и просмотр инфор­мационных ресурсов осуществляются через специ­ализированные редакторы [5]. Использование та­ких редакторов возможно только в соответствии с полномочиями, которыми наделил пользователя администратор. Каждый такой редактор связан с парой информационных ресурсов, находящихся на соседних уровнях иерархии. В терминах инфор­мации верхнего уровня (управляющей информа­ции) редактируется информация нижнего уровня (целевая информация). Универсальный редактор Многоцелевого банка знаний связывается с неко­торой управляющей информацией и, в результате, становится специализированным редактором свя­занной с ним целевой информации. Чтобы создать новый информационный ресурс, пользователь дол­жен запросить на это полномочие и указать управ­ляющую информацию, в терминах которой он бу­дет формировать этот ресурс. Чтобы редактировать и просматривать информацию, достаточно указать только целевую информацию — управляющая ин­формация определяется единственным образом.

Создание и редактирование информации воз­можно в двух режимах — в режиме инженера зна­ний, когда пользователю доступны все возможнос­ти универсального редактора, и в режиме эксперта, когда пользователь обеспечивается интеллектуаль­ной поддержкой, связанной с управляющей ин­формацией. В режиме инженера знаний пользова­тель создает и редактирует целевую информацию, которая в дальнейшем будет использоваться как управляющая. При этом он связывает с этой ин­формацией спецификацию определенной интел­лектуальной поддержки — тексты помощи, огра­ничения целостности (контекстные условия), процедуры выбора элементов и подмножеств из множеств. В режиме эксперта пользователь получа­ет контекстную помощь, возможность выбора эле­ментов и подмножеств из соответствующих мно­жеств. Целевая информация контролируется на соответствие ограничениям целостности. В обоих режимах возможны ссылки на другие элементы ре-

дактируемой информации, а также элементы других информационных ресурсов. Кроме того, целевая информация, созданная в режиме эксперта, может редактироваться в режиме инженера знаний, чтобы затем использоваться в качестве управляющей.

3. ОБРАБОТКА ИНФОРМАЦИОННЫХ РЕСУРСОВ

Каждый специализированный редактор пред­ставляет собой универсальный редактор Много­целевого банка знаний, интерпретирующий соот­ветствующую управляющую информацию. Все информационные ресурсы, создаваемые такими редакторами, представлены в одном и том же уни­версальном представлении. Универсальная обо­лочка информационных ресурсов Многоцелевого банка знаний есть набор операций над информа­цией в этом представлении в терминах этого пред­ставления. Интернет-программа получает доступ к информационному ресурсу Многоцелевого банка знаний через оболочку, если она наделена необхо­димыми полномочиями.

Если информационный ресурс создан в терми­нах одной онтологии (управляющей информа­ции), а должен обрабатываться в терминах другой, то программа обработки должна предварительно решить задачу интерпретации — перевода инфор­мации из одной терминологии в другую.

4. ИСПОЛЬЗОВАНИЕ ИНФОРМАЦИОННЫХ РЕСУРСОВ ПРИ РЕШЕНИИ ПРИКЛАДНЫХ ЗАДАЧ
Информационные ресурсы специализирован­ных банков знаний используются при решении прикладных задач. Решатели прикладных задач яв­ляются программными компонентами специали­зированных банков знаний. Они имеют доступ к информации специализированного банка через набор операций универсальной оболочки. При ре­шении прикладной задачи могут использоваться информационные ресурсы других специализиро­ванных банков знаний, если решатель прикладной задачи наделен такими полномочиями. Различ­ным группам пользователей специализированного банка знаний может требоваться свой набор ин­формации из этого банка, который определяется областью профессиональной деятельности поль­зователей данной группы. Например, информаци­онные ресурсы специализированного банка зна­ний по химии могут включать в себя знания фи­зической, органической, аналитической и других разделов химии. При решении прикладных задач одного раздела химии используются только знания этого раздела, но могут потребоваться и все ин­формационные ресурсы специализированного бан­ка. В этом случае пользователь специализирован­ного банка знаний может получить доступ к тре­буемому ему набору информационных ресурсов

посредством своего автоматизированного рабоче­го места, входящего в набор программных средств специализированного банка знаний.

5. СПЕЦИАЛИЗИРОВАННЫЕ БАНКИ ЗНАНИЙ

В настоящее время в рамках Многоцелевого банка знаний начата разработка специализирован­ных банков знаний, предназначенных для реше­ния прикладных задач в предметных областях, — «математика», «химия», «медицина», «преобразо­вание программ», а также для реализации пользо­вательских интерфейсов программных средств с локальной и распределенной архитектурой, с ис­пользованием программных средств Многоцеле­вого компьютерного банка знаний.

Специализированный банк математических знаний [6—8] предназначен для накопления мате­матических знаний, а также для обучения студен­тов их формализации и доказательству теорем с помощью компьютеров. Информационное напол­нение банка содержит системы аксиом, определе­ния, теоремы и их доказательства, отнесенные к различным разделам математики. Программное наполнение банка состоит из автоматизированно­го рабочего места студента, включающего в себя редактор математических знаний, подсистемы ав­томатического и автоматизированного констру­ирования доказательств и их визуализации.

Специализированный банк знаний в области медицинской диагностики [9] предназначен для поддержки медицинского образования, медицин­ских научных исследований, медицинских кон­сультаций и дистанционной диагностики заболе­ваний. Информационное наполнение банка зна­ний в области медицинской диагностики включает в себя модель онтологии медицинской диагности­ки, базы наблюдений и базы заболеваний различ­ных разделов медицины, а также архивы историй болезни. Программное наполнение банка знаний включает в себя редакторы баз наблюдений, зна­ний о заболеваниях и историй болезни, а также программы оптимизации этих баз и программы медицинской диагностики, предполагающие при­менение высокопроизводительных вычислитель­ных систем для повышения эффективности логи­ческих рассуждений [10].

Специализированный банк знаний по химии [11—13] предназначен для решения прикладных задач с использованием ее онтологии и знаний. Информационные ресурсы банка содержат модель онтологии химии и согласованную с онтологией базу знаний. Программные компоненты — это ре­дакторы информационного наполнения и про­граммы для решения прикладных задач. Классы прикладных задач, которые пользователь может решать с помощью специализированного банка, определяются содержанием модели онтологии и

базы знаний. Примеры: нахождение пути синтеза химических соединений; предсказание физи­ко-химических свойств соединений; определение класса химического элемента, соединения или ре­акции по описанию свойств объекта классифика­ции; вычисление значений различных характерис­тик химического процесса в любой момент про­цесса; проверка непротиворечивости знаний и онтологии относительно результатов химических экспериментов. Первая версия специализирован­ного банка знаний по химии содержит модель он­тологии физической и органической химии в объ­еме университетского курса, а также модели онто­логии некоторых разделов аналитической химии.

Общая задача специализированного банка зна­ний по преобразованиям компьютерных программ [14] заключается в накоплении знаний о преобра­зованиях программ, а также в обеспечении воз­можностей проведения компьютерных экспери­ментов в науке, поддержке активных форм обуче­ния студентов в образовании и макетировании оптимизирующих и распараллеливающих компи­ляторов в профессиональной деятельности. Ин­формационное наполнение банка состоит из он­тологии: знаний о преобразованиях программ; языков программирования; онтологии модели структурных программ; а также баз знаний о пре­образованиях программ, архива программ и исто­рий их преобразований. Программное наполнение банка включает в себя средства редактирования информационного наполнения; управляемые ба­зами знаний преобразователи программ, средства визуализации историй преобразований программ и генераторы объектного кода на различные плат­формы. Также в программное наполнение входит инструментальное средство построения макетов оптимизирующих компиляторов.

Специализированный банк знаний о пользова­тельском интерфейсе [15] предназначен для про­ектирования и реализации пользовательских ин­терфейсов прикладных программ в Многоцелевом банке знаний на основе его информационных ре­сурсов. Проектирование интерфейса представляет собой разработку его модели средствами редакто­ров банка. Далее по этой модели автоматически ге­нерируется пользовательский интерфейс, который связывается с соответствующей прикладной про­граммой. Компоненты модели интерфейса — мо­дель системы понятий предметной области, модель прикладной программы, модель выразительных средств интерфейса, модель сценария диалога, а также модели взаимосвязей между ними. Каждый компонент, за исключением модели предметной области, формируется на основе соответствующей универсальной онтологии, хранящейся в банке. Модель системы понятий предметной области яв­ляется информационным ресурсом того специали­зированного банка, для которого разрабатывается прикладная программа.

6. ОБЕСПЕЧЕНИЕ КАЧЕСТВА ИНФОРМАЦИОННОГО
И ПРОГРАММНОГО НАПОЛНЕНИЯ СПЕЦИАЛИЗИРОВАННЫХ БАНКОВ ЗНАНИЙ

Как уже отмечено, каждый специализирован­ный банк знаний (за исключением студенческого) состоит из основной и экспериментальной облас­тей. Перевод информационных и программных ресурсов из экспериментальной в основную об­ласть возможен только в том случае, если их каче­ство удовлетворяет предъявляемым требованиям. Поэтому в рамках работ по созданию и исследова­нию методов и средств управления информацион­ными ресурсами разрабатываются модели, методы и средства контроля качества информационных и программных ресурсов.

Поскольку специализированные банки пред­назначены для накопления таких информацион­ных ресурсов (данных, знаний, онтологии и спе­цификаций языков), которыми можно многократ­но пользоваться, то необходимо своевременное их оценивание. Важно предоставить создателям ин­формационных ресурсов возможность обнаружить в них дефекты и проконтролировать некоторые свойства моделей данных, знаний, онтологии и языков, тем самым, предоставляя пользователям ресурсов некоторые гарантии проверенности хра­нимой информации. Особенно важна проверка онтологии и языков, поскольку в их терминах формируется большая часть ресурсов банка. В ос­нове оценивания онтологии положена универ­сальная классификация их свойств, обеспечиваю­щая систематический подход к оцениванию ресур­сов различных уровней общности.

Для оценивания качества программных ресур­сов разработана процедура испытаний програм­много наполнения специализированных банков знаний, определяющая порядок проверки про­граммного обеспечения на соответствие его спе­цификациям. Перевод программных ресурсов в основные области банков знаний должен осу­ществляться только в случае успешного их оцени­вания в соответствии с данной процедурой. В на­стоящее время проводятся испытания прототипа системы управления информационными ресурса­ми. Результатами этих испытаний, помимо выяв­ленных дефектов, станут методика испытаний, формы документов по представлению результатов таких испытаний и сами эти документы. Методика испытаний, формы документов и результаты испы­таний могут быть полезны при испытаниях следую­щих версий системы и других подобных систем.

ЗАКЛЮЧЕНИЕ

Рассмотренная система управления информа­ционными ресурсами различных уровней общнос­ти состоит из набора средств для создания, сопровождения и использования информационных ресурсов в Интернете. В системе предусмотрено совмещение централизованного управления ин­формационными ресурсами через администрато­ров (создание специализированных банков знаний и их разделов, перенос информации из экспери­ментальной в основную область, наделение поль­зователей и программ необходимыми полномо­чиями) и децентрализованного управления этими ресурсами со стороны остальных пользователей системы (создание и редактирование ресурсов, программ их обработки). Разработка системы — первый этап программы работ, направленной на создание и коллективное использование в Интер­нете информационных ресурсов различных уров­ней общности, а также программ для их обработки.

ЛИТЕРАТУРА
  1. Клещев А. С., Черняховская М. Ю. Современное состояние компьютерной обработки знаний // Сб. науч. тр. — Владивосток, 2001. — С. 273—284.
  2. Kleshchev A. S., Artemjeva I. L. Domain ontologies and knowledge processing. Techical Report 7—99, Vladivostok: IACPFEBRAS, - 1999. - P. 25.
  3. Орлов В. А., Клещев А. С. Многоцелевой банк знаний. Ч. 1.Концепция и политика. — Владивосток: ИАПУ ДВО РАН,2003. - 40 с.
  4. Uschold М. Knowledge Level Modeling: Concepts and Terminology // The Knowledge Engineering Review. — 1998. —Vol. 13:1. - P. 5-29.
  5. Орлов В. А., Клещев А. С. Многоцелевой банк знаний. Ч. 3.Концепция универсального редактора ИРУО. — Владивосток: ИАПУ ДВО РАН, 2003. - 28 с.
  6. Гаврилова Т. Л., Клещев А. С. Анализ подходов к решению проблемы правильности математических знаний // Проблемы управления. — 2005. — № 3. — С. 13—19.
  7. Гаврилова Т. Л., Клещев А. С. Проблема конструирования
    правильных интуитивных доказательств в классических аксиоматических системах. Конструирование полных доказательств. — Владивосток: ИАПУ ДВО РАН, 2003. — 24 с.
  8. Гаврилова Т. Л., Клещев А. С. Проблема конструирования правильных интуитивных доказательств в классических аксиоматических системах. Модель интуитивного доказательства. — Там же. — 18 с.
  9. Черняховская М. Ю. Представление знаний в экспертных системах медицинской диагностики. — Владивосток: ДВНЦ АН СССР, 1983. - 212 с.
  10. Москаленко Ф.М. Экспертная система медицинской диагностики, основанная на реальной онтологии медицины, для многопроцессорной ЭВМ // Тр. II Междунар. конф.«Параллельные вычисления и задачи управления» / Ин-т
    пробл. упр. - М., 2004. - С. 999-1084.
  11. Артемьева И.Л., Цветников В.А. Фрагмент онтологии физической химии и его модель // Электронный журн. «Исследовано в России». — 2002. — № 3. — С. 454—474. <http://zhurnal.ape.relarn.ru/articles/2002/042.pdf>.
  12. Артемьева И. Л., Рештаненко Н. В. Модульная модель онтологии органической химии // Информатика и системы управления. — 2004. — № 2.
  13. Артемьева И. Л., Рештаненко Н. В. Специализированный компьютерный банк знаний предметной области «Химия» //Искусственный интеллект. — 2004. — Т. 1. — С. 235—244.
  14. Князева М. А. Банк знаний о преобразованиях компьютерных программ // Там же. — Т. 3. — С. 179—186.
  15. Gribova V. V., Kleshchev A. S. From an ontology-oriented approach conception to user interface development // International Journal Information theories & applications. — 2003. —Vol. 10, N 1. - P. 87-94.