Звенигородский А.С. — Концепция и задачи понимания смысла текста в системах искусственного интеллекта

Автор: Звенигородский А.С.
Источник: Электронный архив Донецкого национального технического университета

Аннотация

Звенигородский А.С. Концепция и задачи понимания смысла текста в системах искусственного интеллекта В статье рассматривается проблема построения концепции искусственного интеллекта для понимания смысла текстов на естественном языке. Предлагается смысл текста рассматривать не с точки зрения семантики языка, а с точки зрения смысла для субъекта. Формулируется новая постановка задачи понимания смысла текстов в системах искусственного интеллекта.

Введение

Задача понимания смысла текста и его составляющих разрабатывается в искусственном интеллекте не один десяток лет. Предложено множество теорий, моделей, но удовлетворительных результатов пока нет [1]. Очевидно, назрела необходимость пересмотра традиционных подходов к этой проблеме, которые в основном исходят из лингвистических теорий. В статье предлагается авторское концептуальное видение решения данной проблемы. Исследование проблемы смысла в смежных дисциплинах показало [2], что смысл текста является экстралингвистическим явлением, следовательно, модели смысла, полностью основанные на моделях языка, по своей природе не могут решить эту проблему в полной мере.

Целью данной работы является формирование концепции автоматического понимания смысла, не зависимой от языка (от текста), т.е. рассматривать смысл как некоторое объективное явление или процесс, присущие группе субъектов, что даст предпосылки для его реализации на новом уровне в системе искусственного интеллекта (СИИ).

Назначение и виды смыслов субъекта

Не вдаваясь в детальное обсуждение использования смысла, которое исследуется в смежных дисциплинах, выделим наиболее значимые назначения смысла для субъекта: осуществление коммуникации между субъектами в повседневной жизни и ее основные виды – диалог и монолог; устную речь; речевые акты; передачу информации о внешнем мире и объектах профессиональной деятельности; передачу информации о внутреннем мире (эмоции, переживания, мотивации, цели); передачу и приобретение знаний о мире — природе и предметных профессиональных областях деятельности при обучении.

Таким же способом приведем далеко не полный перечень видов смыслов, речь о которых идет в таких дисциплинах, как философия, психология, лингвистика: смысл–значение [3] cмысл–переживание [4] личностный смысл; социальный смысл; предметный смысл; переносный смысл; смысл–вопрос, смысл–действие.

Все эти смыслы присущи человеку или субъекту и находят выражение в текстах и поведении. Необходимо отметить, что они зависят от текущего внутреннего состояния субъекта, его мотиваций, намерений, целей. Говорить о том, что все эти смыслы можно представить одной общей теорией, нет оснований хотя бы потому, что, например, предметные смыслы связаны с органами чувств субъекта и имеют сенсорную природу, а смыслы-переживания возникают внутри мозга (сознания) субъекта и их природа до сих пор не известна.

Если теперь обратиться к смыслу текста, то там можно найти сложнейшее переплетение всех указанных смыслов. Кроме этого, понимание смысла текста связано с процессами мышления. Если смысл–значение можно рассматривать как задачу отображения множества знаков на множество известных смыслов, то переносный смысл требует вывода смысла на основе опыта (знаний) субъекта. Смысл субъект выражает с помощью средств языка, который из–за своей избыточности, изменчивости, многозначности может приводить субъекта–читателя к выявлению смысла, которого субъект–автор не имел намерений выражать в тексте. Подобным образом на смысл влияют культурные традиции и социальное окружение.

Из изложенного следует, что трудности решения задачи понимания смысла в полном объеме необычайно велики. Поэтому на первом этапе мы считаем, что задачу надо ограничить и определить концепцию смысла для СИИ и прикладные задачи для нее, а не для модели смысла на уровне субъекта. СИИ, понимающую смысл, мы рассматриваем как дополнительный инструмент для субъекта в его предметной профессиональной деятельности.

Под предметной профессиональной деятельностью мы понимаем природные и социальные процессы, в которые вовлекается субъект на определенное время. К ним относятся действия субъекта в природных и бытовых условиях, производстве, науке, спорте. Предметная профессиональная деятельность связана с физическими объектами (одеждой, домами, компьютерами и т.д.) и объектами в сознании (инфляция, число, индекс цен и т.д.), которые для субъекта существуют объективно. Стоит отметить, что язык и его использование тоже являются профессиональной деятельностью. Процессы профессиональной деятельности подчиняются объективным законам физики, химии и в какой–то мере психологии, поэтому субъекты в этих сферах при некотором необходимом для профессии уровне опыта и знаний выражают смысл практически однозначно. Этот опыт и знания субъект приобретает в результате обучения, начиная с момента рождения. В СИИ этот опыт и знания задаются априорно. Смысл объектов профессиональной деятельности и отношения между ними мы называем предметным смыслом.

Проблема первого лица

Некоторые философы считают, что слова в тексте и сам текст никакого смысла не имеют [4]. Если говорить о смысле, то надо говорить о смысле для субъекта. Так, Мерло–Понти пишет: «Слова “смысл течения воды” ничего не выражают, если я не предполагаю субъекта, который смотрит с какого–то места в определенном направлении... Подобно этому, и “смысл ткани” воспринимается только субъектом, который может подойти к предмету с одной или с другой стороны, и ткань обладает каким-то смыслом лишь благодаря моему появлению в мире...» [5].

При моделировании процессов наука исследует природу от третьего лица, т.е. с точки зрения независимого наблюдателя, который не оказывает влияния на процесс. В случае со смыслом ситуация иная: воспринятый смысл зависит от того, кто его воспринимает. В этом случае возникает проблема первого лица. Например, то, что Я как субъект понимаю смысл текста, для меня не вызывает сомнений. То, что другой субъект воспринимает точно такие смыслы, Я могу только предполагать или принимать на веру. Опыт показывает, что с одинаковыми объектами и событиями, отраженными в тексте, разные субъекты соотносят разные смыслы.

Таким образом, если ставится задача проектирования СИИ, понимающей смысл на уровне субъекта, то она должна рассматривать смысл с позиций первого лица. Но это означает, что мы должны знать все механизмы мышления человека и процессы в мозге на протяжении всей его жизни, что в настоящее время невозможно. Поэтому будем подходить к решению задачи понимания смысла с позиции третьего лица. Это означает, что необходимо выделить глубинные свойства упоминавшихся выше видов смыслов, которые не зависят от субъекта. Проще всего это сделать для предметного смысла профессиональной деятельности. Профессиональная деятельность отличается целостностью, повторяемостью и прогнозируемостью результатов, что может быть при условии одинакового понимания смысла субъектами социальной группы. В этом случае будем считать, что смысл не зависит от субъекта и его можно моделировать. В повседневной жизни субъект участвует во множестве областей профессиональной деятельности. В каждом виде этой деятельности он играет роль: в семье — родитель, на улице — пешеход, на производстве — служащий, на пикнике — отдыхающий и т.д. Таким образом, имея смысловые модели всех сфер предметной профессиональной деятельности для разных социальных групп, можно путем их комбинаций строить сложные модели предметного смысла, приближающиеся по своему объему к субъекту.

На практике СИИ, понимающие предметный смысл, будут использоваться в качестве инструмента для субъектов в их областях профессиональной деятельности и решать следующие задачи: обучение субъектов в диалоге на естественном языке (будет иметь отдельные преимущества по сравнению с учителем-субъектом, например, не зависеть от времени суток); создание авторефератов в заданных предметных областях; извлечения данных и знаний из текстов, созданных субъектами; автоматизированное проектирование новых изделий и систем; частичная замена субъектов в сфере обслуживания; диалог в системах–советчиках и др.

Концепция смысла текста для СИИ

Смысл для субъекта связан с внешним миром. Внешний мир, в свою очередь, связан с пространством и временем, объектами и их свойствами, взаимодействием объектов, последовательностью взаимодействий или событий и точкой отсчета (субъек–том). Это нашло отражение в теориях о «падежах» или семантических ролях, таких, как: агент, объект, кого – что, содержание, инструмент, результат, источник, направление, место [6—8]. В этих теориях для нас важно то, что между «ролями» — элементами глубинной структуры и аргументами — элементами текста и элементами поверхностной структуры, нет взаимно–однозначного соответствия. Это подтверждает мысль о том, что семантические роли не зависят от языка, а являются составляющими сценария действия, описываемого в тексте. Семантические роли позволяют учитывать при анализе текста глубинную структуру предложения благодаря соответствующему предварительному описанию модели мира в терминах «ролей».

Учитывая вышеизложенное, в основу нашей концепции моделирования предметного смысла профессиональной деятельности положены следующие постулаты: смысл существует независимо от текста; знаки текста при его анализе активируют смысл; модель смысла ограничивается одной предметной областью; выражение смысла в тексте производится с помощью ограниченного подмножества естественного языка, в котором отсутствует омонимия — несколько разных смысловых значений для одного элемента языка; текст — это последовательность знаков (слов) различной физической природы, принадлежащих естественному языку; в предметной профессиональной деятельности есть набор объектов, поведение которых определяется семантической ролью. Cодержание семантической роли определяется законами, правилами или соглашениями (убеждениями), добровольно принятыми субъектами; это могут быть математические модели, правила игры, уставы, здравый смысл жизненного опыта и др.; убеждения не меняются на протяжении некоторого времени, что гарантирует неизменность смысла; изменение убеждений приводит к появлению новых смыслов; прошлые смыслы не исчезают, к ним можно вернуться, если восстановить убеждения; результатом понимания текста является установление факта непротиворечивости свойств и поведения объектов предметной области с убеждениями и выделение этих свойств и поведения в виде данных, сценария и автореферата, которые запоминаются в базе данных.

Постановка задачи

Задача понимания предметного смысла текста формулируется следующим образом: построить модель отображения последовательности знаков на множество объектов и сценариев предметной профессиональной деятельности, заданной набором убеждений. При этом алгоритм понимания будет состоять из следующих шагов:

Определить, принадлежат ли знаки на входе системы естественному языку с учетом правил языка (морфологии и синтаксиса), в противном случае делается предположение о грамматических и синтаксических ошибках в тексте, которые не искажают смысла;
Исходя из текста и априорных начальных условий, определить объекты профессиональной деятельности;
Построить сценарий событий для объектов из п. 2 на основе семантических ролей;
Определить непротиворечивость событий и объектов семантических ролей убеждениям профессиональной деятельности, в противном случае текст не имеет смысла;
Извлечь данные и составить автореферат.

Выводы

В основу предлагаемой концепции заложена идея о том, что смысл текста не содержится в самом тексте, а является внутренним свойством субъекта, которое активируется последовательностью знаков языка, называемых текстом. По своей природе субъект воспринимает текст от первого лица, что требует задачу автоматического понимания смысла существенно ограничивать, так как в науке принято исследуемые процессы рассматривать с позиции третьего лица. Поэтому предлагается идея введения узких профессиональных областей деятельности, в которых смысл не зависит от субъекта. Предложенная концепция направлена не на моделирование субъекта, как носителя смысла, а на моделирование одного из видов смысла – предметного, как общего свойства субъектов, который проявляется в практических задачах профессиональной деятельности групп субъектов.

Список использованной литературы

1. Люгер Д.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем / Люгер Д.Ф. ; [пер. с англ.] – М. : Издательский дом «Вильямс», 2003. – 864 с.
2. Леонтьев Д.А. Психология смысла: природа, строение и динамика смысловой реальности / Леонтьев Д.А. – М. : Смысл, 2003. – 487 с.
3. Фреге Г. Смысл и денотат / Г. Фреге // Семиотика и информатика. – 1977. – Вып. 8. – С. 181-200.
4. Выготский Л.С. Мышление и речь / Выготский Л.С. – М. ; Л. : Соцэкгиз, 1934. – 324 с.
5. Мерло-Понти М. Временность / М. Мерло-Понти // Историко–философский ежегодник. – 1990. – М. : Наука, 1991. – С. 271–293.
6. Фундаментальные направления современной американской лингвистики / под ред. А.А. Кибрика и др. – М. : Изд–во МГУ, 1997. – 455 с.
7. Шенк Р. Обработка концептуальной информации / Шенк Р. – М. : Энергия, 1980. – 361 с.
8. Уинстон П. Искусственный интеллект / Уинстон П. – М., : 1980. – 580 с.