машиночитаемых таблицах ББК. При обработке
изданий и рукописей, поступающих в фонд
Библиотеки, в библиографических записях строятся
более сложные индексы с использованием
разнообразных структурных элементов ББК,
причем взятых из разных иерархических деревьев.
Естественно, словесные формулировки этих
индексов строятся из элементов таких деревьев.
Кроме того, эти же средства ИПЯ используются в
электронной библиотеке диссертаций (ЭБД) РГБ.
Они включены в библиографические записи ЭК, а
также в структуру метаданных открытой ЭБД на
основе ИСИР [1, 18], где представляются в XML-
разметке (технология реализуется в РГБ при
поддержке РФФИ - проекты №01-07-90310 и 04-
07-90154).
Классификационные таблицы формируются
из различного рода структурных элементов. Надо
отметить, что обычно в классификациях не
придается существенного значения семантическим
категориям их элементов, как принято в
информационно-поисковых тезаурусах. Интересно,
что, строя структуру области знаний и оперируя
словосочетаниями,
обозначающими
области
деятельности,
создатели
библиотечных
классификаций на некотором уровне начинают
оперировать словами и словосочетаниями, которые
по своей семантике, строго говоря, представляют
собой элементы совершенно других семантических
категорий, которые не назовешь наименованиями
отраслей знания. Развитие делений может
происходить
по
процессам,
свойственным
соответствующей области деятельности, по
предметам, для обеспечения существования
которых процессы предназначены, по предметам,
которые являются средствами реализации этих
процессов, по характеристикам или явлениям.
Понятно,
что
любое
деление
можно
структурировать и анализировать в соответствии с
описанной выше моделью.
Для иллюстрации ниже приведен ряд
примеров словесных формулировок индексов
ББК из ЭК диссертаций РГБ (они же
используются в метаданных для диссертаций в
ЭБД). Каждая цепочка представляет собой в
основном ветвь иерархического дерева ББК,
начиная с самого верхнего уровня таблиц и кончая
наиболее узким делением. Нередко нижнее деление
может быть или не быть последним уровнем
иерархии, отображая некоторый аспект темы. Для
некоторых
элементов
цепочки
строятся
собственные дополнительные ветви отдельного
иерархического дерева, представленного в ББК
таблицами
типовых
делений
(например,
территориальных, специальных и т.д.).
По сути, классификационные таблицы
представляют собой также некую модель системы
знаний, предназначенную для поиска документов в
каталогах библиотек. Для поисковых задач в АИС
предназначены и тезаурусы, от которых не
отличишь многие фрагменты классификационных
таблиц, и языки предметных рубрик, которые при
хорошем
развитии
смысловых
отношений
приближаются к тем же тезаурусам, а без них не
могут обеспечить полноту информационного
поиска. На самом деле, самое важное значение
имеет
различие
между
отношениями
синтагматическими (текстовыми, создаваемыми
при построении текстов) и парадигматическими
(зафиксированными в модели знаний заранее и
постоянно). Семантическое представление текста
строится в координатной системе модели знаний, и
для относительно полного представления смысла
текста
необходимо
восстановление
его
пресуппозиций, релевантных для соответствующих
поисковых задач. При этом модель знаний должна
иметь средства определения структурных
элементов, которых не хватает для задуманного
семантического представления текста, как в плане
парадигматики, так и в плане синтагматики.
Для краткости рассмотрим отдельные
примеры, что должно оказаться достаточным для
того, чтобы читатель сам смог оценить структурные
особенности цепочек в других примерах.
В примере (1) непосредственное содержание
текста упрощенно выражено ключевыми словами
из заглавия (см. поле 653). Для увеличения полноты
поиска эти слова размещаются систематизаторами в
семантической модели ББК. Проверим, все ли связи
учтены с точки зрения нашей модели знаний:
- свойства – «отношение подчинения» - дорожные
покрытия –«отношения подчинения» - автозимник
(«синоним для» снежные и ледовые дороги);
- срок службы - «отношение подчинения» -
эксплуатационные параметры - «отношение
подчинения» - надежность и долговечность -
«отношение подчинения» - свойства;
- фрикционный слой «отношение подчинения» –
дорожные покрытия –«отношение подчинения» -
автомобильные дороги;
-
автомобильные
дороги
– «отношение
предназначения» - эксплуатация -
«отношение предназначения» - автодорожный
транспорт – «отношение подчинения» -
транспорт.
Получается, что использование КС и ББК
позволило построить аккуратное семантическое
представление текста, правда, с пропуском
элементов «эксплуатационные параметры» и
«эксплуатация». В примере (2), кстати, эти
элементы присутствуют, но зато нет некоторых КС
из заглавия. Кроме того, во второй цепочке
пропущен процесс «строительство».
В примере (3) пропущен процесс «лечение»
и не использованы элементы из заглавия для
развития более низких уровней иерархии понятий,
чем предусмотрено в классификации.
Примеры показывают, каким причудливым
образом могут формироваться области знания в
делениях классификаций. Так, в примере (4)
«работают»
3
иерархических
дерева
парадигматических
отношений:
области
деятельности, языки, процессы в данной области
деятельности. Строго говоря, языкознание здесь
подразделяется на основе дерева языков таким
образом:
«Изучение
и
преподавание