Семантические сети

Авторы: Семенов Ю.А.

Источник: http://book.itep.ru/10/sem_net.htm




Семенов Ю.А. (ГНЦ ИТЭФ)

Технология семантических сетей может вывести человечество на новый уровень цивилизации. Именно по этой причине правительства США, Франции, Германии и других стран вкладывают в эти разработки огромные бюджетные ресурсы. От этих технологий ожидают решения проблем контекста и как следствие - создание информационных систем искусственного интеллекта. Станет возможным программирование на естественных языках, создание интеллектуального оружия поля боя, совершенные поисковые и экспертные системы, и многое другое. На неделе "Российского Интернет" в конце 2008 года во время дисскуссии возник вопрос, если эти технологии столь многообещающи, почему в них не вкладываются частные компании? Ответ прост - успех этих разработок, как всяких фундаментальных исследований, не предопределен. Вполне возможна неудача, во всяком случае на стартовом этапе, а необходимые стартовые капиталовложения достаточно велики. Следует также учитывать крайне широкий разброс мнений о том, что же такое семантические сети. В экспертных системах базовые идеи семантических сетей используются уже сегодня. В сущности из подобных систем в 90-х годах прошлого века зародилась WEB-техника Интернет.

Будет ли создан искусственный интелект на основе семантических сетей, не ясно. В этом плане поучительной является книга американского математика Роджера Пенроуза" Новый ум короля", автор которой осторожно подводит читателя к мысли, что на современных технологиях и принципах решить эту проблему невозможно.

Семантическиая сеть представляет собой ориентированный граф, вершины которого представляют собой понятия, а ребра (дуги) - определяют семантические отношения между этими понятиями. Примером такой сети можно считать гипертекст с его якорями и гиперсвязями (но это лишь частный простой случай). Граф может быть древо-подобным (см. рис.1), но может содержать и циклические структуры.

Семантическая сеть дает возможность охарактеризовать отношения между понятиями. Часто понятия представляются словом или набором слов. Простым примером является иерархическая сеть, где понятия являются таксономическими терминами и единственным отношением явлется type-of (относится к типу) (гипонимные отношения - hyponymous relationship, когда одно понятие включает в себя другие понятия). Более сложные симантические сети включают в себя отношения различных типов такие как твердость, температура, сделано из, текстура и цвет. Одной из самых больших семантических сетей является WordNet, лексическая база данных английского языка.

В узком смысле семантические отношения между понятиями или значениями. Понятие [школа] следует отличать от слова ‘школа’. [Школа] является [образовательным учреждением]. Это указывает иерархическое отношение между двумя понятиями или значениями, которое является разновидностью из длинного ряда семантических отношений.

Понятие [Школа] может, например, быть выражено в терминах или выражениях ‘школа’, ‘школьное здание (schoolhouse)’ и ‘место обучения’. Отношение между ‘школа’ и ‘школьное здание’ является синонимическим между этими двумя выражениями, в то время как отношение между ‘школа’ и ‘место обучения’ является отношением между словом и выражением или фразой. Отношения между словами являются лексическими отношениями. 'Школа' имеет значение [группа людей, кто прошел обучение в определенном коллективе или в учреждении или придерживаются некоторых взглядов]. This is a homonym relation: Two senses share the same word or expression: ‘school’. Синонимы и омонимы не являются отношениями между понятиями, а понятиями, выраженными идентичными или разными символами.

Отношение между понятиями, смыслами или значениями не следует смешивать с отношениями между терминами, словами и выражениями или символами, которые используются для выражения понятия. Однако, довольно часто эти два вида отношений смешиваются.

Некоторые важные виды семантических отношений перечислены ниже:

Сколько существует семантических отношений?

Является ли число семантических отношений конечным или бесконечным? Что определяет их число? Существуют противоположные мнения в теоретической лингвистике в отношении семантических свойств составных существительных NC (noun compounds). Одни доказывают, что существует ограниченный набор семантических отношений, которые могут применяться в отношении NC. другие утверждают, что семантика NC не может быть исчерпана никаким ограниченным списком отношений. Существует также мнение, что имеется фиксированный семантический набор отношений (включая иерархические отношения и отношения эквивалентности), а также открытый список отношений.

Ответ, вероятно, заключается в том, что отношения между объектами (или процессами) могут быть отражены в языках с помощью соответствующих отношений. "Любовь" является отношением между людьми, напр. Ваней и Маней. 'Ваня' и 'Маня' являются, таким образом, индивидуальными понятиями, между которыми имеет место семантическое отношение 'любовь'.

Семантические отношения могут отражать отношения в языке, включая отношения между объектами и их символами. Ограничение числа семантических отношений представляется не важным. В отдельных областях постоянно выявляются новые виды семантических отношений. Только в медицине идентифицировано 38 семантических отношений.

Наиболее широко используемые семантические отношения имеют сходство со списком категорий, например, с 10-ю знаменитыми аристотелевыми категориями:

  1. Содержание
  2. количество
  3. качество
  4. отношение
  5. где (место)
  6. когда (время)
  7. находящийся в положении (позиция)
  8. имеющий (состояние)
  9. делающий, (действие)
  10. подвергнутый

Имеется сходство и с широко используемыми грамматическими категориями. Такие категории и грамматические отношения представляют собой обобщения или генерализации.

Рис. 1.  Дерево понятий, нарисованное логиком Питером Испанским (1329 год)


Данный граф является одним из великого множества. Его отличает только древний возраст.

Строя такие графы и присваивая ребрам графа определенные веса (метрики) в соответствии со степенью сродства понятий, можно подойти к решению проблемы контекста. При этом предполагается, что существует множество семантических деревьев, характеризующих общие языковые связи. Тогда при выявлении контекстного значения определенного слова или группы слов в пределах конкретного текстового фрагмента, строятся семантические деревья для этого фрагмента. В этих деревьях веса берутся из общеязыковых деревьев. Если слово или группа слов имеет более одного значения, ребра графа с наибольшим весом могут указать на предпочтительное контекстное значение.