Аннотация
Мартыненко А.А., Шкаберин В.А. Применение онтологического подхода для реализации
системы интеллектуального поиска в области
cals–, cad–, cam–, cae–технологий.
Рассмотрен вопрос реализации системы интеллектуального поиска в области CALS–, CAD–,CAM–,CAE–технологий на основе применения онтологического подхода.
Общая постановка проблемы
Направление информационной интеграции и системной поддержки жизненного цикла продукции (CALS–, CAD–, CAM–, CAE–технологии) входит в перечень критических технологий РФ. В настоящее время для обеспечения конкурентоспособности российских машиностроительных предприятий, повышения качества продукции и производительности труда, а также для реструктуризации производств необходимо внедрение современных технологий информационной поддержки жизненного цикла продукции (CALS–технологий) и интегрированных систем автоматизированного проектирования (CAD–CAM–CAE–систем).
Основным источником информации в последнее время стала глобальная компьютерная сеть Интернет. В Интернет имеется множество разрозненных информационных ресурсов в области CALS–,CAD–, CAM–, CAE–технологий. Информация достаточно динамично изменяется, требует систематизации и структурирования для эффективного использования при решении ряда практических задач, возникающих на промышленных предприятиях (анализ рынка программных продуктов, выбор автоматизированной системы, изучение передового опыта использования CALS–технологий и др.), в учебном процессе и при выполнении научных исследований.Основным источником информации в последнее время стала глобальная компьютерная сеть Интернет. В Интернет имеется множество разрозненных информационных ресурсов в области CALS–,CAD–, CAM–, CAE–технологий. Информация достаточно динамично изменяется, требует систематизации и структурирования для эффективного использования при решении ряда практических задач, возникающих на промышленных предприятиях (анализ рынка программных продуктов, выбор автоматизированной системы, изучение передового опыта использования CALS–технологий и др.), в учебном процессе и при выполнении научных исследований.
В связи с этим одной из наиболее сложных и актуальных проблем является обеспечение эффективного сетевого доступа к структурированным предметно–ориентированным информационным ресурсам для специалистов в предметной области.
В настоящее время мониторинг и некоторые аспекты системного анализа информации в сети Интернет выполняются с использованием систем информационного поиска, разделяемых на каталоги, информационно–поисковые и метапоисковые системы. Однако существующие технологии и средства информационного поиска в сети Интернет не позволяют решать целый ряд задач по предметно–ориентированному поиску.
Это связано со следующими причинами:
- Объём данных, размещённых в сети Интернет, очень велик, а сама информация недостаточно структурирована;
- Интернет очень изменчив, ежедневно в нём появляются новые данные – страницы или целые сайты, – что–то исчезает, а часть ресурсов меняет адрес;
- Сетевые публикации в целом отличаются меньшей достоверностью, чем публикации бумажные, так что информацию, размещённую в сети, нужно ещё каким–то образом оценить или проверить;
- Поиск научной информации затруднен из–за увеличения числа информационных ресурсов коммерческого назначения, а также вследствие некачественного ее представления в сети.
Указанные факты явились предпосылкой для разработки автоматизированного интеллектуального модуля мониторинга и анализа web–ресурсов, способного перенастраиваться на требуемую предметную область. Работы по созданию этого модуля в настоящее время проводятся на кафедре «Компьютерные технологии и системы» Брянского государственного технического университета в рамках выполнения научно–исследовательского проекта «Разработка отраслевой системы доступа к информационным ресурсам научного и образовательного назначения по приоритетным направлениям развития науки и техники в области искусственного интеллекта и CALS–, CAD–, CAM–, CAE–технологий».
Формализация предметной области
Наиболее трудоемкой и сложной задачей является описание в формализованном виде самой предметной области. На сегодняшний день существует ряд средств и методов представления знаний о предметной области, и к наиболее эффективным из них относится онтологический подход.
В инженерии знаний под онтологией понимается детальное описание некоторой предметной области, которое используется для формального и декларативного определения ее концептуализации. Зачастую онтологией называют базу знаний специального вида, которую можно разделять, отчуждать и самостоятельно использовать в рамках рассматриваемой предметной области.
Онтологические системы могут применяться для решения различных задач в сфере искусственного интеллекта, но наиболее характерной сферой их применения является представление знаний в Интернете. Круг связанных с этим вопросов весьма широк и включает в себя мультиагентные системы, автоматическое извлечение знаний из текстов на естественном языке, поиск информации, интеллектуальное аннотирование, автоматическое составление авторефератов и пр.
Общим для всех систем онтологического аннотирования является то, что в качестве аннотации веб–ресурса выступает специальным образом организованная предметная онтология, которая содержит структурированные знания об аннотированном ресурсе относительно некоторой метаонтологии предметной области. Можно предложить следующие способы размещения онтологической информации о ресурсе: включить онтологическое описание в HTML–код через введение новых HTML–тегов либо хранить онтологическое описание ресурса в отдельном файле в каком–либо специальном представлении.
Основная задача онтологического подхода состоит в том, чтобы облегчить пользователю поиск информации в большом наборе ресурсов путем систематизации знаний, создания единой иерархии понятий, унификации терминов и правил интерпретации. Для описания онтологий можно использовать различные языки представления знаний, например применяемые в экспертных системах.
Принципы проектирования и реализации онтологий
Следует отметить, что подходы и методологии, ориентированные на построение онтологий, базируются на следующих принципах проектирования и реализации онтологий, предложенных Т. Груббером:
- Ясность (Clarity) — онтология должна эффективно передавать смысл введенных терминов. Определения должны быть объективными, хотя мотивация введения терминов может определяться ситуацией или требованиями вычислительной эффективности. Для объективизации определений должен использоваться четко фиксированный формализм, при этом целесообразно задавать определения в виде логических аксиом.
- Согласованность (Coherence) — все определения должны быть логически непротиворечивы, а все утверждения, выводимые в онтологии, не должны противоречить аксиомам.
- Расширяемость (Extendibility) — онтология должна быть спроектирована так, чтобы обеспечивать использование разделяемых словарей терминов, допускающих возможность монотонного расширения и/или специализации без необходимости ревизии уже существующих понятий.
- Минимум влияния кодирования (Minimal encoding bias) — концептуализация, лежащая в основе создаваемой онтологии, должна быть специфицирована на уровне представления, а не символьного кодирования. Этот принцип связан с тем, что агенты, разделяющие онтологию, могут быть реализованы в различных системах представления знаний.
- Минимум онтологических обязательств (Minimal ontological commitment) — онтология должна содержать только наиболее существенные предположения о моделируемом мире, чтобы оставлять свободу расширения и специализации. Отсюда следует, что онтологии базируются на «слабых» теориях, так как цель их создания и использования состоит, прежде всего, в том, чтобы «говорить» о предметной области, в отличие от баз знаний, которые могут содержать знания, необходимые для решения задач и/или ответов на вопросы.
Онтологический анализ обычно начинается с составления словаря терминов, который используется при обсуждении и исследовании характеристик объектов и процессов, составляющих рассматриваемую систему, а также создания системы точных определений этих терминов. Кроме того, документируются основные логические взаимосвязи между соответствующими введенным терминам понятиями. Результатом этого анализа является онтология системы, или совокупность словаря терминов, точных их определений, взаимосвязей между ними.
В настоящее время не существует единственного правильного способа или методологии разработки онтологий. Но существуют некоторые фундаментальные правила разработки онтологии:
- Не существует единственного правильного способа моделирования предметной области – всегда существуют жизнеспособные альтернативы. Лучшее решение почти всегда зависит от предполагаемого приложения и ожидаемых расширений.
- Разработка онтологии – это обязательно итеративный процесс.
- Понятия в онтологии должны быть близки к объектам (физическим или логическим) и отношениям в интересующей предметной области. Наиболее часто это существительные (объекты) или глаголы (отношения) в предложениях, которые описывают предметную область.
Таким образом, знание того, для каких целей будет создана онтология, степень ее детализации повлияют на многие решения, касающиеся моделирования. Среди нескольких жизнеспособных альтернатив нужно определить, какая поможет лучше решить поставленную задачу и будет более наглядной, более расширяемой и более простой в обслуживании. Также нужно помнить, что онтология – это модель реального мира, и понятия в онтологии должны отражать эту реальность. После того как будет определена начальная версия онтологии, можно оценить и отладить ее, используя ее в приложениях или методах решения задач и/или обсудив ее с экспертами предметной области. В результате почти наверняка нужно будет пересмотреть начальную онтологию. Этот процесс итеративного проектирования, вероятно, будет продолжаться в течение всего жизненного цикла онтологии.
Сегодня для создания и поддержки онтологий существует целый ряд инструментов, которые помимо общих функций редактирования и просмотра выполняют поддержку документирования онтологий, импорт и экспорт онтологий разных форматов и языков, поддержку графического редактирования, управление библиотеками онтологий и т.д [1].
Наиболее известными системами являются следующие:
- Система Ontolingua — была разработана в Knowledge Systems Laboratory Стенфордского университета и стала первым инструментом инженерии онтологий. Она состоит из сервера и языка представления знаний[2].
- Protege – локальная, свободно распространяемая Java–программа, разработанная группой медицинской информатики Стенфордского университета[3].
- Система OntoEdit — первоначально была разработана в институте AIFB (Institute of Applied Informatics and Formal Description Methods) университета Karlsruhe (сейчас коммерциализован Ontoprise GmbH). Она выполняет проверку, просмотр, кодирование и модификацию онтологий.
- OilEd – автономный графический редактор онтологий, разработанный в Манчестерском университете в рамках европейского IST–проекта OnTo–Knowledge.
- Система Web–Deso — предназначена для создания онтологий некоторой предметной области.
После сравнения указанных инструментов по ряду критериев выбор был остановлен на Protege–2000[4]. Эта система предназначена для построения (создания, редактирования и просмотра) онтологий прикладной области. Её первоначальная цель – помощь разработчикам программного обеспечения в создании и поддержке явных моделей предметной области и включение этих моделей непосредственно в программный код. Protege включает редактор онтологий, позволяющий проектировать онтологии, разворачивая иерархическую структуру абстрактных или конкретных классов и слотов. Структура онтологии аналогична иерархической структуре каталога. На основе сформированной онтологии Protege может генерировать формы получения знаний для введения экземпляров классов и подклассов. Инструмент имеет графический интерфейс, удобный для использования неопытными пользователями, снабжен справками и примерами.
Protege основан на фреймовой модели представления знания OKBC (Open Knowledge Base Connectivity) и снабжен рядом плагинов, что позволяет его адаптировать для редактирования моделей, хранимых в разных форматах (стандартный текстовый, в базе данных JDBC, UML, языков XML, XOL, SHOE, RDF и RDFS, DAML+OIL, OWL).
Для построения онтологии, описывающей предметную область CALS–,CAD–,CAM–,CAE–технологий, были выполнены следующие работы:
- На основе анализа предметной области (CALS–,CAD–,CAM–,CAE–технологии) выявлен основной набор терминов и понятий, описывающих предметную область, и представлен в виде глоссария.
- Создана общая структура онтологии предметной области, которая представлена в графическом виде (рис. 1) [5]. C учетом предложенной онтологии фрагмент описания САПР Pro/Engineer будет выглядеть следующим образом. Одним из этапов жизненного цикла является проектирование; в САПР Pro/Engineer оно может быть эскизным, техни–ческим и рабочим. Следующей единицей онтологии является блок, описывающий типовые задачи, решаемые на этапе жизненного цикла. Любое проектирование базируется на математическом обеспечении геометрического моделирования, которое включает в себя: геометрические модели, подходы к представлению геометрических моделей, методы и алгоритмы машинной графики. Pro/Engineer является системой «тяжелого» класса. Весь состав модулей хранится в блоке «Полный состав модулей конкретной промышленной САПР». Информация о ядре продукта хранится в блоке «Геометрические ядра». Геометрическим ядром Pro/Engineer является частное ядро GRANITE ONE собственной разработки. Вся информация о разработчике и представительстве в России содержится в блоке «Разработчики». Ключевые термины и понятия находятся в глоссарии.
- В среде Protege–2000 сформирован фрагмент онтологии предметной области, который содержит сведения по известным машиностроительным САПР (основные модули, разработчики, связь модулей систем с основными этапами проектирования и основными математическими методами и др.). Разработанный фрагмент онтологии в настоящий момент адаптируется для использования в автоматизированном интеллектуальном модуле мониторинга и анализа web–ресурсов в качестве средства настройки на предметную область.
В настоящее время работы по детализации онтологии по предметной области «CALS–,CAD–,CAM–,CAE–технологии» продолжаются. Параллельно начаты работы по созданию онтологии, описывающей предметную область «Искусственный интеллект».
построения онтологии по предметной области CALS–,CAD–, CAM–,CAE–технологии
Основой построения онтологии по предметной области «CALS–,CAD–, CAM–,CAE–технологии» является привязка модулей реальных промышленных САПР к этапам жизненного цикла изделия (в рамках концепции CALS) через типовые решаемые задачи с использованием современных интегрированных САПР (создание 3D–модели, проектирование технологического процесса и др.). Данный подход делает возможным решение такой практической задачи, как выбор промышленной САПР для решения стоящих перед предприятием конкретных производственных задач на конкретных этапах жизненного цикла изделий. Информационная магистраль «этап жизненного цикла — решаемые задачи — модули промышленной САПР» насыщается дополнительными аспектами, такими как виды обеспечения САПР, характеристика производителя САПР, взаимосвязь САПР с другими информационными системами, применяемыми на стадиях жизненного цикла изделий, и др. Рис. 2 отражает построение фрагмента онтологии по производителям CAD–CAM–CAE–систем, имеющим дилерскую сеть на территории РФ. На рис. 3 представлено построение фрагмента онтологии по описанной схеме.
Рисунок 1 – Структура онтологии по предметной области «CALS–,CAD–, CAM–,CAE–технологии»
Рисунок 2 – Построение фрагмента онтологии по производителям САПР
Рисунок 3 – Построение фрагмента онтологии на примере CAD–CAM–CAE–системы «тяжелого» класса Pro/Engineer
В качестве промышленной САПР выступает один из лидеров рынка – CAD–CAM–CAE–система «тяжелого» класса Pro/Engineer.
Список использованной литературы
1. Овдей, О.М. Обзор инструментов инженерии онтологий / О.М.Овдей, Г.Ю.Проскудина // Российский научный электронный журнал. — 2004. — Т.7 – Вып.4.
2. Noy, N. Ontology Development 101: A Guide to Creating Your First Ontology/ N. Noy, D. McGuinness // Stanford Knowledge Systems Laboratory Technical Report KSL–01–05 and Stanford Medical Informatics Technical Report SMI–2001–0880. — 2001, March.
3. Н.Н. Мухачева, Д.В. Попов Системно–когнитивный подход к построению онтологических баз знаний информационно–интеллектуальных ресурсов // Вестник РГРГТУ. № 4 (выпуск 30). Рязань, 2009. С. 123–135.
4. Аверченков, В.И. Применение онтологий при создании предметно–ориентированных электронных ресурсов / В.И. Аверченков, П.В. Казаков // Информационные технологии в науке, образовании и производстве: материалы междунар. науч.–техн. конф. – Орел: ОрелГТУ, 2006. — С. 6-11.
5. Голиков, Н.В. Применение онтологий/ Н.В.Голиков [Электронный ресурс]. — Режим доступа: http://www.ict.nsc.ru