УДК 004.81:159.9

А.С. Звенигородский
Государственный университет информатики и искусственного интеллекта
г. Донецк, Украина
zas@iai.donetsk.ua

Концепция и задачи понимания смысла текста в системах искусственного интеллекта

Информатика и компьютерные технологии — 2009 / VI Международная научно-техническая конференция студентов, аспирантов и молодых учёных. — Донецк, ДонНТУ — 2009

В статье рассматривается проблема построения концепции искусственного интеллекта для понимания
смысла текстов на естественном языке. Предлагается смысл текста рассматривать не с точки зрения
семантики языка, а с точки зрения смысла для субъекта. Формулируется новая постановка задачи
понимания смысла текстов в системах искусственного интеллекта.

Введение

Задача понимания смысла текста и его составляющих разрабатывается в искуссвенном интеллекте не один десяток лет. Предложено множество теорий, моделей,но удовлетворительных результатов пока нет [1]. Очевидно, назрела необходимостьпересмотра традиционных подходов к этой проблеме, которые в основном исходят из лингвистических теорий. В статье предлагается авторское концептуальное видение решения данной проблемы. Исследование проблемы смысла в смежных дисциплинах показало [2], что смысл текста является экстралингвистическим явлением, следовательно, модели смысла, полностью основанные на моделях языка, по своей природе не могут решить эту проблему в полной мере.

Целью данной работы является формирование концепции автоматического понимания смысла, не зависимой от языка (от текста), т.е. рассматривать смысл как< некоторое объективное явление или процесс, присущие группе субъектов, что даст
предпосылки для его реализации на новом уровне в системе искусственного интел- лекта (СИИ). Назначение и виды смыслов субъекта. Не вдаваясь в детальное обсуждение использования смысла, которое исследу-
ется в смежных дисциплинах, выделим наиболее значимые назначения смысла для
субъекта:
 осуществление коммуникации между субъектами в повседневной жизни и ее основ-
ные виды – диалог и монолог; устную речь; речевые акты;
 передачу информации о внешнем мире и объектах профессиональной деятельности;
 передачу информации о внутреннем мире (эмоции, переживания, мотивации, цели);
 передачу и приобретение знаний о мире – природе и предметных профессиональ-
ных областях деятельности при обучении.
Таким же способом приведем далеко не полный перечень видов смыслов, речь
о которых идет в таких дисциплинах, как философия, психология, лингвистика: смысл-Концепция и задачи понимания смысла текста в системах…
«Штучний інтелект» 3’2009 7
1-З
значение [3]; cмысл-переживание [4]; личностный смысл; социальный смысл; предмет-
ный смысл; переносный смысл; смысл-вопрос, смысл-действие [2].
Все эти смыслы присущи человеку или субъекту и находят выражение в
текстах и поведении. Необходимо отметить, что они зависят от текущего внутреннего
состояния субъекта, его мотиваций, намерений, целей. Говорить о том, что все эти
смыслы можно представить одной общей теорией, нет оснований хотя бы потому,
что, например, предметные смыслы связаны с органами чувств субъекта и имеют сен-
сорную природу, а смыслы-переживания возникают внутри мозга (сознания) субъекта и
их природа до сих пор не известна.
Если теперь обратиться к смыслу текста, то там можно найти сложнейшее пере-
плетение всех указанных смыслов. Кроме этого, понимание смысла текста связано с
процессами мышления. Если смысл-значение можно рассматривать как задачу ото-
бражения множества знаков на множество известных смыслов, то переносный смысл
требует вывода смысла на основе опыта (знаний) субъекта. Смысл субъект выражает
с помощью средств языка, который из-за своей избыточности, изменчивости, многозна-
чности может приводить субъекта-читателя к выявлению смысла, которого субъект-
автор не имел намерений выражать в тексте. Подобным образом на смысл влияют
культурные традиции и социальное окружение.
Из изложенного следует, что трудности решения задачи понимания смысла в
полном объеме необычайно велики. Поэтому на первом этапе мы считаем, что зада-
чу надо ограничить и определить концепцию смысла для СИИ и прикладные задачи
для нее, а не для модели смысла на уровне субъекта. СИИ, понимающую смысл, мы
рассматриваем как дополнительный инструмент для субъекта в его предметной про-
фессиональной деятельности.
Под предметной профессиональной деятельностью мы понимаем природные и
социальные процессы, в которые вовлекается субъект на определенное время. К ним
относятся действия субъекта в природных и бытовых условиях, производстве, науке,
спорте. Предметная профессиональная деятельность связана с физическими объектами
(одеждой, домами, компьютерами и т.д.) и объектами в сознании (инфляция, число,
индекс цен и т.д.), которые для субъекта существуют объективно. Стоит отметить,
что язык и его использование тоже являются профессиональной деятельностью. Про-
цессы профессиональной деятельности подчиняются объективным законам физики,
химии и в какой-то мере психологии, поэтому субъекты в этих сферах при некото-
ром необходимом для профессии уровне опыта и знаний выражают смысл практи-
чески однозначно. Этот опыт и знания субъект приобретает в результате обучения,
начиная с момента рождения. В СИИ этот опыт и знания задаются априорно. Смысл
объектов профессиональной деятельности и отношения между ними мы называем
предметным смыслом.
Проблема первого лица
Некоторые философы считают, что слова в тексте и сам текст никакого смысла
не имеют [4]. Если говорить о смысле, то надо говорить о смысле для субъекта. Так,
Мерло-Понти пишет: «Слова “смысл течения воды” ничего не выражают, если я не
предполагаю субъекта, который смотрит с какого-то места в определенном направ-
лении... Подобно этому, и “смысл ткани” воспринимается только субъектом, который
может подойти к предмету с одной или с другой стороны, и ткань обладает каким-то
смыслом лишь благодаря моему появлению в мире...» [5]. Звенигородский А.С.
«Искусственный интеллект» 3’2009 8
1-З
При моделировании процессов наука исследует природу от третьего лица, т.е. с
точки зрения независимого наблюдателя, который не оказывает влияния на процесс.
В случае со смыслом ситуация иная: воспринятый смысл зависит от того, кто его
воспринимает. В этом случае возникает проблема первого лица. Например, то, что Я
как субъект понимаю смысл текста, для меня не вызывает сомнений. То, что другой
субъект воспринимает точно такие смыслы, Я могу только предполагать или
принимать на веру. Опыт показывает, что с одинаковыми объектами и событиями,
отраженными в тексте, разные субъекты соотносят разные смыслы.
Таким образом, если ставится задача проектирования СИИ, понимающей смысл
на уровне субъекта, то она должна рассматривать смысл с позиций первого лица. Но
это означает, что мы должны знать все механизмы мышления человека и процессы в
мозге на протяжении всей его жизни, что в настоящее время невозможно. Поэтому
будем подходить к решению задачи понимания смысла с позиции третьего лица. Это
означает, что необходимо выделить глубинные свойства упоминавшихся выше видов
смыслов, которые не зависят от субъекта. Проще всего это сделать для предметного
смысла профессиональной деятельности. Профессиональная деятельность отли-
чается целостностью, повторяемостью и прогнозируемостью результатов, что может
быть при условии одинакового понимания смысла субъектами социальной группы.
В этом случае будем считать, что смысл не зависит от субъекта и его можно модели-
ровать. В повседневной жизни субъект участвует во множестве областей профес-
сиональной деятельности. В каждом виде этой деятельности он играет роль: в семье –
родитель, на улице – пешеход, на производстве – служащий, на пикнике – отдыхаю-
щий и т.д. Таким образом, имея смысловые модели всех сфер предметной профес-
сиональной деятельности для разных социальных групп, можно путем их комбинаций
строить сложные модели предметного смысла, приближающиеся по своему объему к
субъекту.
На практике СИИ, понимающие предметный смысл, будут использоваться в
качестве инструмента для субъектов в их областях профессиональной деятельности
и решать следующие задачи:
 обучение субъектов в диалоге на естественном языке (будет иметь отдельные пре-
имущества по сравнению с учителем-субъектом, например, не зависеть от времени
суток);
 создание авторефератов в заданных предметных областях; извлечения данных и
знаний из текстов, созданных субъектами;
 автоматизированное проектирование новых изделий и систем; частичная замена
субъектов в сфере обслуживания; диалог в системах-советчиках и др.
Концепция смысла текста для СИИ
Смысл для субъекта связан с внешним миром. Внешний мир, в свою очередь,
связан с пространством и временем, объектами и их свойствами, взаимодействием
объектов, последовательностью взаимодействий или событий и точкой отсчета (субъек-
том). Это нашло отражение в теориях о «падежах» или семантических ролях, таких,
как: агент, объект, кого – что, содержание, инструмент, результат, источник,
направление, место [6-8]. В этих теориях для нас важно то, что между «ролями» –
элементами глубинной структуры и аргументами – элементами текста и элементами
поверхностной структуры, нет взаимно-однозначного соответствия. Это подтверж-Концепция и задачи понимания смысла текста в системах…
«Штучний інтелект» 3’2009 9
1-З
дает мысль о том, что семантические роли не зависят от языка, а являются составля-
ющими сценария действия, описываемого в тексте. Семантические роли [6] позво-
ляют учитывать при анализе текста глубинную структуру предложения благодаря
соответствующему предварительному описанию модели мира в терминах «ролей».
Учитывая вышеизложенное, в основу нашей концепции моделирования предмет-
ного смысла профессиональной деятельности положены следующие постулаты:
 смысл существует независимо от текста; знаки текста при его анализе активируют
смысл;
 модель смысла ограничивается одной предметной областью;
 выражение смысла в тексте производится с помощью ограниченного подмножества
естественного языка, в котором отсутствует омонимия – несколько разных смысло-
вых значений для одного элемента языка;
 текст – это последовательность знаков (слов) различной физической природы, при-
надлежащих естественному языку;
 в предметной профессиональной деятельности есть набор объектов, поведение
которых определяется семантической ролью в соответствии с [6-8].
 содержание семантической роли определяется законами, правилами или согла-
шениями (убеждениями), добровольно принятыми субъектами; это могут быть мате-
матические модели, правила игры, уставы, здравый смысл жизненного опыта и др.;
 убеждения не меняются на протяжении некоторого времени, что гарантирует неиз-
менность смысла;
 изменение убеждений приводит к появлению новых смыслов; прошлые смыслы не
исчезают, к ним можно вернуться, если восстановить убеждения;
 результатом понимания текста является установление факта непротиворечивости
свойств и поведения объектов предметной области с убеждениями и выделение этих
свойств и поведения в виде данных, сценария и автореферата, которые запоминаются
в базе данных.
Постановка задачи
Задача понимания предметного смысла текста формулируется следующим
образом: построить модель отображения последовательности знаков на множество
объектов и сценариев предметной профессиональной деятельности, заданной набо-
ром убеждений. При этом алгоритм понимания будет состоять из следующих шагов:
1. Определить, принадлежат ли знаки на входе системы естественному языку с
учетом правил языка (морфологии и синтаксиса), в противном случае делается пред-
положение о грамматических и синтаксических ошибках в тексте, которые не иска-
жают смысла.
2. Исходя из текста и априорных начальных условий, определить объекты про-
фессиональной деятельности.
3. Построить сценарий событий для объектов из п. 2 на основе семантических
ролей.
4. Определить непротиворечивость событий и объектов семантических ролей
убеждениям профессиональной деятельности, в противном случае текст не имеет
смысла.
5. Извлечь данные и составить автореферат. Звенигородский А.С.
«Искусственный интеллект» 3’2009 10
1-З
Выводы
В основу предлагаемой концепции заложена идея о том, что смысл текста не
содержится в самом тексте, а является внутренним свойством субъекта, которое
активируется последовательностью знаков языка, называемых текстом. По своей при-
роде субъект воспринимает текст от первого лица, что требует задачу автоматичес-
кого понимания смысла существенно ограничивать, так как в науке принято иссле-
дуемые процессы рассматривать с позиции третьего лица. Поэтому предлагается идея
введения узких профессиональных областей деятельности, в которых смысл не зави-
сит от субъекта. Предложенная концепция направлена не на моделирование субъекта,
как носителя смысла, а на моделирование одного из видов смысла – предметного,
как общего свойства субъектов, который проявляется в практических задачах про-
фессиональной деятельности групп субъектов.


Литература
1. Люгер Д.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем / Люгер Д.Ф. ;
[пер. с англ.] – М. : Издательский дом «Вильямс», 2003. – 864 с.
2. Леонтьев Д.А. Психология смысла: природа, строение и динамика смысловой реальности /
Леонтьев Д.А. – М. : Смысл, 2003. – 487 с.
3. Фреге Г. Смысл и денотат / Г. Фреге // Семиотика и информатика. – 1977. – Вып. 8. – С. 181-200.
4. Выготский Л.С. Мышление и речь / Выготский Л.С. – М. ; Л. : Соцэкгиз, 1934. – 324 с.
5. Мерло-Понти М. Временность / М. Мерло-Понти // Историко-философский ежегодник. – 1990. –
М. : Наука, 1991. – С. 271-293.
6. Фундаментальные направления современной американской лингвистики / под ред. А.А. Кибрика
и др. – М. : Изд-во МГУ, 1997. – 455 с.
7. Шенк Р. Обработка концептуальной информации / Шенк Р. – М. : Энергия, 1980. – 361 с.
8. Уинстон П. Искусственный интеллект / Уинстон П. – М., : 1980. – 580 с.