Введение в Resource Description Framework(RDF)

 

Source: http://www.dlib.org/dlib/may98/miller/05miller.html

Автор: Eric Miller

Перевод: Артем Шелюк


Описание

Resource Description Framework (RDF) - инфраструктура, которая позволяет выполнять кодирование, обмен и повторное использование структурированных метаданных. RDF является приложением XML, что накладывает необходимые структурные ограничения, чтобы предоставить однозначность способов выражения семантики. RDF дополнительно предоставляет средства для публикации и человеческого понимания, и машинно-обрабатываемых словарей, направленных на поощрение и расширение повторного использования метаданных среди разрозненных семантических общин информации.Структурное ограничение RDF предусматривает поддержку последовательного кодирования и обмен стандартизованных метаданных, что обеспечивает взаимозаменяемость отдельных пакетов метаданных и определяется различными сообществами описания ресурсов.

Введение

Всемирная паутина предоставляет беспрецедентный доступ к глобально распределенной информации. Метаданные, или структурированные данные о данных, улучшают обнаружение и доступ к такой информации.Эффективного использования метаданных между приложениями, требует общей конвенции о семантике, синтаксису и структуре. Индивидуальное описание ресурса должно определить семантику, смысл, метаданные, отвечающие их конкретным потребностям. Синтаксис, систематическое расположение элементов данных для машинной обработки, упрощает обмен и использование метаданных между несколькими приложениями. Структура может рассматриваться как формальные ограничения на синтаксис для согласованного представления семантики.

Resource Description Framework (RDF), разработанный под эгидой World Wide Web Consortium (W3C) [W3C], представляет собой инфраструктуру, которая обеспечивает кодирование, обмен и повторное использование структурированных метаданных. Эта инфраструктура позволяет метаданных взаимодействия путем разработки механизмов, которые поддерживают общий конвенций семантики, синтаксиса и структуры. RDF не определяет семантику для каждой группы описание ресурса, а дает возможность для определения метаданных элементов по мере необходимости. RDF использует XML (Extensible Markup Language) в качестве общего синтаксиса для передачи и обработки метаданных.Синтаксис XML является подмножеством международной стандартной обработки текста SGML (Standard Generalized Markup Language [SGML]), специально предназначенные для использования в Интернете.Синтаксис XML предоставляет поставщику независимости, пользовательскую расширяемость, проверку читаемости человеком, а также возможность представления сложных структур. Эксплуатируя особенности XML, RDF предусматривает структуру, которая обеспечивает однозначное выражение семантики и, таким образом, обеспечивает последовательное кодирование, обмен, и машинную обработку стандартизированных метаданных.

История создания

История метаданных в W3C началась в 1995 году с PICS (Platform for Internet Content Selection), платформа для выбора содержания в Интернете. PICS представляет собой взаимодействующий механизм рейтинга веб-страниц с сервера клиенту. Эти оценки, или оценка этикетки, содержащие информацию о содержании веб-страницы: например, содержит та или иная страница рецензируемые научные статьи, или был автором аккредитованным исследователем, или содержит секс, наготу, насилие, сквернословие, и т.д. Вместо того, фиксированный набор критериев, PICS представил общий механизм для создания систем оценки. Различные организации могут голосовать, исходя из собственных целей и ценностей, а пользователи - например, родители беспокоятся об использовании веб - их детьми - могли настроить свои браузеры, чтобы отфильтровать любые веб-страницы не соответствующие их собственным критериям. Развитие PICS было вызвано ожиданием ограничений на интернет-контента в США и других странах.

В ходе ряда встреч с цифровым библиотечным сообществом, ограничения в PICS характеристики были определены, и функциональные требования были определены для решения более общей проблемы связывания описательной информации с Интернет-ресурсами на базе архитектуры PICS. В результате этих обсуждений, W3C создали новую рабочую группу, PICS-NG Next Generation [PICSNG] для решения более общих вопросов описание ресурсов.

Вскоре после того, PICS-NG рабочей группы был зафрахтован, стало ясно, что инфраструктура разработана в начале спецификации документ [PICSMOD] применима в несколько дополнительных приложений. В результате, W3C консолидировать эти приложения Description W3C Resource Framework рабочей группы.

RDF является результатом целого ряда метаданных сообщества, объединение их потребностей для обеспечения надежной и гибкой архитектуры для поддержки метаданных в Интернете. В то время как развитие RDF в качестве общей основы метаданных, и простой механизм представления знаний для Интернета, был сильно вдохновлен спецификация PICS [PICSSPEC], ни один человек или организация, изобрел RDF. RDF является результатом совместных усилий. Несколько компаний, являющихся членами W3C способствуют интеллектуальным ресурсам. Она использует XML [XML], а также предложения, представленные [XMLDATA] Microsoft и Netscape [MCFXML]. Другие метаданных, такие как Dublin Core [DC] и Warwick Framework [WF], также повлияли на дизайн RDF.

Модель данных RDF

RDF предоставляет модель для описания ресурсов. Ресурсы имеют свойства (атрибуты или характеристики). RDF определяет ресурс как любой объект, который однозначно идентифицируется по унифицированному идентификатору ресурса (URI) [uri1] [uri2].Свойства, связанные с ресурсами, определенные типы собственности, и типы собственности имеют соответствующие значения. Недвижимость типов выражает отношения значений, связанных с ресурсами. В RDF, значения могут быть атомныго характера (текстовые строки, числа и т.д.) или других ресурсов, которые в свою очередь могут иметь свои собственные свойства.Совокупность этих свойств, которые относятся к тому же ресурсу, называются описанием. В основе RDF находится независимая от синтаксиса модель для представления ресурсов и соответствующих им описаний [SPEC]. На следующем рисунке (рис. 1) иллюстрирует общее описание RDF.

Рисунок 1

Применение и использование модели RDF данные можно проиллюстрировать на конкретных примерах. Рассмотрим следующие утверждения:

					«Автор Документа 1 Джон Смит»
					«Джон Смит является автором документа 1»
				

Для людей, эти заявления передают тот же смысл (то есть, Джон Смит является автором конкретного документа). Для машины, однако, это совершенно разные строки. В то время как люди очень умело извлекают смысла из различных синтаксических конструкций, машины остается чрезвычайно неумелыми. Использование триадной модели ресурсов, собственности, типов и соответствующие им значения, RDF пытается дать однозначный способ выражения семантики в машиночитаемой кодировки.

RDF обеспечивает механизм для связывания свойств ресурсов. Поэтому, прежде всего, модель данных требует декларации ресурсов, представляющих документ 1. Таким образом, модель данных, соответствующая утверждению «автор Документа 1 Джон Смит» имеет один документ ресурсов 1, тип собственности, авторских и соответствующее значение Джона Смита. Чтобы отличить характеристики модели данных, модель RDF и синтаксиса [SPEC] представляет отношения между ресурсами, собственностью, типы и значения в ориентированный помеченный граф. В этом случае ресурсы определяются как узлы, типы собственности определяются в соответствии с указаниями дуги этикетке, и строковые значения в кавычки. Исходя из этого представления, модели данных, соответствующая утверждению, графически выражается как (рис. 2):

Рисунок 2

Если дополнительнаяя описательная информация в отношении автора была востребована, например, адрес электронной почты автора, адрес и место работы, разработка на предыдущем примере не потребуется. В этом случае, описательную информацию о John Smith желательно представить. Как уже говорилось в первом примере, прежде чем описательные свойства могут быть выражены о человеке, Джон Смит, там должна быть уникальная идентификация ресурсов, представляющих его. Принимая во внимание направления записей этикеток графика в предыдущем примере, модель данных, соответствующая этому описанию наглядно представлены в виде (рис. 3):

Рисунок 3

В предыдущем примере для автора был создан уникальныая идентификация ресурсов, но не для имени автора, адреса электронной почты или принадлежности. Модель RDF позволяет создавать ресурсы на разных уровнях. Что касается представления личных имен, например, создание ресурса представляющие имя автора могли бы дополнительно быть описаны с помощью «Имя», «Отчество» и «Фамилия» типов собственности. Ясно, что это итеративный описательный процесс может продолжаться до нескольких уровней.

Не существует одного правильный ответ на этот вопрос. Ответ на этот вопрос зависит от требований домена. Короче говоря, опыт и знания предметной области определяют, какие различия должны быть учтены и отражены в модели данных.

Модель RDF данные дополнительно предоставляет возможности для описания других описаний. Например, часто важно оценить достоверность конкретного описания (например, «Библиотека Конгресса США сказала нам, что Джон Смит является автором документа 1»). В этом случае описание говорит нам кое-что об утверждении «Джон Смит является автором документа 1», в частности, что Библиотека Конгресса США утверждает, что это правда. Подобные конструкции дополнительно полезны для описания коллекции ресурсов. Например, «Джон Смит является автором 1 Документы, 2 и 3». Хотя эти заявления являются значительно более сложными, и применяется в той же модели данных.

Синтаксис RDF

RDF определяет простую, но мощную модель для описания ресурсов.Синтаксис представляющий эту модель, необходимого для хранения экземпляров этой модели в машиночитаемые файлы и общаться этих случаях между приложениями. RDF предусматривает формальную структуру XML для поддержки согласованного представления семантики.

RDF предоставляет возможность для описания ресурсов для определения семантики. Свойство типа «автор», например, может иметь более широкое или узкое значение в зависимости от различных потребностей общества. Как таковая, она является проблематичной, если несколько сообществ использовуют те же типы свойств, но означать совершенно разные вещи. Чтобы предотвратить это, RDF уникальным образом идентифицирует собственности типов с помощью XML механизм пространства имен [NS]. Пространства имен XML обеспечивают метод для безошибочной идентификации семантики и конвенций, регулирующих особенности использования имущества типов по уникальной идентификации руководящим органом лексики. Например, свойство типа «автор» определяется инициативы Dublin Core, как «человек или организация, ответственная за создание интеллектуального содержимого ресурса» и задается элементом CREATOR Dublin Core [DCES].Пространство имен XML используется для однозначной идентификации схемы для словаря Dublin Core, указывая на окончательное Dublin Core, ресурс, который определяет соответствующую семантику.

Это более четкое заявление идентифицирует ресурс Документ 1 с семантикой собственности типа Creator однозначно определяется в контексте постоянного тока (словаря Dublin Core).Значение этого свойства типа Джон Смит.

Соответствующее синтаксических способ выражения этого заявления с использованием XML для определения пространства имен, использование схемы Dublin Core, является:

<?xml:namespace ns = "http://www.w3.org/RDF/RDF/" prefix ="RDF" ?>
<?xml:namespace ns = "http://purl.oclc.org/DC/" prefix = "DC" ?> 

<RDF:RDF>
  <RDF:Description RDF:HREF = "http://uri-of-Document-1"> 
    <DC:Creator>John Smith</DC:Creator> 
  </RDF:Description> 
</RDF:RDF>
				

я это дело, как RDF и Dublin Core схемы объявлены и сокращенно «RDF» и «DC», соответственно. Схема RDF объявлен загрузки обвязки механизм для объявления необходимый словарный запас необходимых для выражения модели данных. Схема Dublin Core объявлен для того, чтобы использовать лексику, установленных настоящим сообществом. URI связанного с имен ссылки декларацию соответствующие схемы. Элемент <RDF:RDF> (которая может быть интерпретирована как элемент RDF в контексте пространства имен RDF) является простой оболочкой, которая отмечает границы в XML-документ, в котором содержание явно претендует на отображаемые в модель данных RDF например. Элемент <RDF:Description> (элемент описание в контексте пространства имен RDF), соответственно, используется для обозначения или экземпляр ресурса с соответствующим http://uri-of-Document-1 URI. И элемент <DC:Creator> в контексте <RDF:Description> представляет свойство типа DC: Создатель и значение «John Smith». Синтаксического представления предназначена для отражения соответствующей модели данных. В более сложный пример, где дополнительные описательной информации в отношении автора требуется, подобные синтаксические конструкции используются. В этом случае, а он все еще может быть желательно использовать CREATOR Dublin Core собственности типа представляют лица, ответственного за создание интеллектуального содержания, дополнительное свойство, типа «имя», «электронная почта» и «принадлежности» не требуется. В этом случае, так как семантика этих элементов не определены в Дублинского ядра, дополнительные стандартное описание ресурса могут быть использованы. Вполне возможно, взять на себя создание схемы RDF с семантикой похоже на визитную карточку [VC] спецификация предназначена для автоматизации обмена личной информацией обычно встречаются на традиционной визитной карточки, могут быть введены для описания автор документа.

Схемы RDF

RDF схемы используются для объявления словарей, наборы семантической собственности, типов, определенных конкретного сообщества. RDF схемы определяют допустимые свойства в данном RDF описание, а также любые характеристики или ограничения собственности, тип значения сами по себе. XML механизм пространства имен служит для идентификации RDF-схем. Человека и машины, обрабатываемых описание схемы RDF может быть доступна де-ссылки на схемы URI. Если схема является машинно-обрабатываемой, это может быть возможным для приложения, чтобы узнать некоторые семантики собственности, типов, указанных в схеме. Чтобы понять особенности схемы RDF, чтобы понять семантику каждого из свойств в этом описании. RDF схемы строятся на основе модели RDF-данных. Таким образом, приложение, которое не имеет понимания конкретной схемы по-прежнему смогут разобрать описание в собственности, типов и соответствующие им значения и сможет перевозить описание без изменений (например, в кэш или другое приложение). Точные детали схемы RDF в настоящее время обсуждается в W3C RDF Schema рабочая группа. Предполагается, однако, что возможность оформить человеческого понимания и машинно-обрабатываемой словари будут поощрять обмен, использование и распространение метаданных среди разрозненных словарей общин информации. RDF схемы в настоящее время разработаны для обеспечения этого вида оформления.

Заключение

Всемирная паутина предоставляет беспрецедентный доступ к распределенной информации. Метаданные улучшает доступ к этой информации и RDF является W3C предложила стандарт для определения архитектуры необходимо для поддержки веб-метаданных. RDF является применение XML, что накладывает необходимых структурных ограничений, чтобы предоставить однозначную способов выражения семантики последовательного кодирования, обмена и машинной обработки метаданных. RDF, кроме того, предоставляет средства для публикации и человеческого понимания и машинно-обрабатываемой словарей, направленных на поощрение обмена, использования и расширения семантики метаданных среди разрозненных общин информации.

Литература

  1. [DC] The Dublin Core Home Page, URL:http://purl.oclc.org/metadata/dublin_core
  2. [DCES] Description of the Dublic Core Elements, URL:http://purl.oclc.org/metadata/dublin_core_elements
  3. [DCRDF] OCLC News Release, "Dublin Core and Web MetaData Standards Converge in Helsinki", Nov. 7, 1997, URL:http://www.oclc.org/oclc/press/971107a.htm
  4. [DSIG] W3C Digital Signature Working Group URL:http://www.w3.org/DSig/
  5. [IMS] Educom's IMS Instructional Metadata System Home Page, URL:http://www.imsproject.org
  6. [IRDF] Introduction to RDF Metadata, W3C NOTE 1997-11-13, Ora Lassila, URL:http://www.w3.org/TR/NOTE-rdf-simple-intro
  7. [MCFXML] R.V. Guha and Tim Bray, "Meta Content Framework using XML", June 6, 1997, http://www.w3.org/TR/NOTE-MCF-XML/
  8. [NS] Name Spaces in XML, Tim Bray, Dave Hollander, and Andrew Layman, W3C Note, 19-January-1998, URL:http://www.w3.org/TR/1998/NOTE-xml-names-0119
  9. [PICS] W3C PICS The Platform for Content Selection Home Page, URL:http://www.w3.org/PICS
  10. [PICSMOD] PICS-NG Metadata Model and Label Syntax, Ora Lassila, Version 3.5, 5/14/97, URL:http://www.w3.org/TR/NOTE--pics-ng-metada
  11. [PICSNG] W3C PICS-NG The Platform for Content Selection - Next Generation Home Page, URL:http://www.w3.org/PICS/NG
  12. [PICSSPEC] PICS Label Distribution Label Syntax and Communication Protocols, Version 1.1, W3C Recommendation 31-October-96 URL:http://www.w3.org/TR/REC-PICS-labels-961031
  13. [SCHEMA] The W3C RDF Schema Working Group, URL:http://www.w3.org/TR/WE-RDF-Schema/
  14. [SGML] Information Processing -- Text and Office Systems -- Standard Generalized Markup Language (SGML), International Organization for Standardization, Rdf No. ISO 8879:1986, 1986.
  15. [SPEC] Resource Description Framework (RDF) Model and Syntax, URL:http://www.w3.org/RDF/Group/WD-rdf-syntax/
  16. [URI1] IETF RFC1738 IETF (Internet Engineering Task Force). RFC 1738: Uniform Resource Locators (URL), ed. T. Berners-Lee, L. Masinter, and M. McCahill. 1994.
  17. [URI2] IETF RFC1808 IETF (Internet Engineering Task Force). RFC 1808: Relative Uniform Resource Locators, ed. R. Fielding, 1995.
  18. [VC] vCard Home Page, URL:http://www.imc.org/pdi
  19. [W3C] The World Wide Web Consortium Home Page, URL:http://www.w3.org/
  20. [WCOL] Web Collections using XML, Alex Hopmann, Editor, March 9, 1997. URL:http://www.w3.org/Member/9703/XMLsubmit.html
  21. [WF] "The Warwick Framework:", A Container Architecture for Aggregating Sets of Metadata, C. Lagoze, C. A. Lynch, and R. Daniel, Jr., (June 21, 1996) URL:http://cs-tr.cs.cornell.edu:80/Dienst/UI/2.0/Describe/ncstrl.cornell/TR96-1593
  22. [XML] The W3C XML Extensible Markup Language Working Group Home Page, URL:http://www.w3.org/XML/
  23. [XMLDATA] XML-Data, Andrew Layman, Jean Paoli, Steve De Rose, and Henry S. Thompson, June 20, 1997, URL: http://www.microsoft.com/standards/xml/xmldata.htm