Научно-производственный центр Интелтек Плюс

Экспертные юридические системы – миф или реальность?

Авторы: Андреев А.М., Березкин Д.В., Кантонистов Ю.А.



Вскипает, светится, встает со дна:
Работа долгая завершена.
Нам говорят “безумец” и “фантаст”,
Но, выйдя из зависимости грустной,
С годами мозг мыслителя искусный
Мыслителя искусственно создаст.
............................................................
Чего желать? Сбылась мечта наук.
С заветной тайны сорваны покровы.
Внимание! Звенящий этот звук
Стал голосом и переходит в слово.

И. Гете. Фауст.

В 20 веке после создания первых вычислительных машин идея искусственного интеллекта стала чрезвычайно актуальной, а приведенные выше строки “Фауста” часто цитировались с большим пафосом как учеными, так и людьми, весьма далекими от технических наук. В какие-то моменты казалось, что современный электронный гомункул вот-вот разобьет свою колбу и появится на свет: достаточно правильно применить и немного улучшить технологии в микроэлектронике, разработать новое программное обеспечение, привлечь к работе лучших ученых, выделить миллиарды долларов на финансирование проектов и через 2 - 3 года победа будет в кармане. Но ситуация оказалось удивительно похожей на ту с которой каждый раз сталкивались средневековые алхимики - успех в самый последний момент ускользал, оставалось только сетовать на неудачное совпадение сложных мистических явлений и просить своего богатого сюзерена (нынешнего “спонсора”) выделить очередной мешок золота на продолжение работ, которые уж наверняка будут успешными. Однако, необходимо отметить, что также как и у алхимиков многие побочные результаты деятельности оказывались очень полезными, усилия современных специалистов в области искусственного интеллекта не прошли даром. Хотя универсальная интеллектуальная ЭВМ, способная имитировать мышление человека, так и не была создана, разработаны и успешно применяются экспертные и робототехнические системы во многих сферах производственной деятельности.

В направлении создания экспертных систем (ЭС) различного назначения накоплен значительный опыт. Они традиционно представляются как аппаратно-программные комплексы или компьютерные программы, в которых делаются попытки воспроизведения результатов, достигаемых реальными специалистами высокой и средней квалификации в конкретной области профессиональной деятельности.

Практические достижения в области разработки ЭС делают возможным использование технологии приобретения и накопления знаний для построения систем семантической обработки текстов. И это, несмотря на то, что многолетние исследования лингвистов не привели к удовлетворительному определению самого понятия “смысл”. Тем не менее системы машинного понимания текста (используется ограниченный естественный язык) постоянно развивались, оставаясь одним из наиболее перспективных способов построения пользовательского интерфейса в сложных информационных системах.

Попытки осуществления интеллектуального компьютерного анализа текстовой информации, что наиболее характерно для исследования правовых документов, приводит к поиску и разработке механизмов логико-семантического анализа, позволяющих создать аргументно-предикатную структуру высказываний или другой вид семантического представления предложения и текста. Из сказанного понятно, задача машинного понимания естественно-языкового текста является частным случаем проблемы машинного перевода, для успешного решения различных аспектов которой выполнено огромное количество работ ( в том числе и в области математической лингвистики) , начиная с середины 40-х годов.

Одной из первых юридических ЭС была JUDITH (1975 г.), разработанная в Гейдельбергском и Дармштадском университетах, позволяющая юристам получать экспертные заключения по гражданским делам. База знаний системы состоит из предпосылок и исполнительных файлов, указывающих на взаимоотношения, существующими между наборами предпосылок. JUDITH служит инструментом изучения юридических рассуждений.

LEGAL ANALYSIS SYSTEM помогает адвокатам проводить юридический анализ дел об умышленном оскорблении действием. Правовые знания теория и факты дела представляются в виде семантических сетей. Система представляет свои выводы, включая логику , на которой они основаны. Она обосновывает свои заключения ссылками на судебные решения и вспомогательные законодательные документы. Разработана в Массачусетском технологическом институте.

Демонстрационный прототип SARA , разработанный в норвежском исследовательском центре по компьютерам и праву. ЭС SARA помогает юристам анализировать решения, исходя из дискреционных норм. Пользователь сообщает системе факторы и их значения, существенные для некоторого решения. Система приписывает веса всем факторам так, чтобы объяснить как можно больше принятых решений. Факторы и решения представляются в виде фреймов. Для вычисления весов используется итеративный корреляционный метод.

Приведенные здесь примеры далеко не исчерпывают перечень созданных разработок в области юридического компьютерного анализа.

Современные персональные компьютеры предоставляют пользователю немало новых возможностей, существенно ускоряя его труд. При этом проблема понимания компьютером устного и письменного человеческого языка плавно перешла в разработку средств автоматизации ввода, вывода и обработки информации с участием человека и на сегодняшний день во многом успешно решена. Упор сделан на разработку так называемых “интуитивно понятных” пользователю интерфейсов. Практически все фирмы сейчас громогласно заявляют о том, что они предлагают свои продукты с этими “интуитивно понятными” интерфейсами, аргументируя свои слова красивостью отдельных интерфейсных элементов и мультимедийностью и скромно умалчивая при этом, что на сегодняшний день никто не знает, что такое человеческая интуиция и можно ли ее хоть как-то математически формализовать, а тем более запрограммировать.

Основные предпосылки проекта “Минерва”

После не столь оптимистичного начала обратимся к конкретной проблеме пути решения которой мы предлагаем и готовы обсудить с читателями нашей статьи - создание экспертной правовой системы.

Чем определяется актуальность самой проблемы? Наша компания - Научно-производственный центр “Интелтек Плюс” уже много лет занимается вопросами разработки правовых информационно-поисковых систем (ИПС) и мультимедийных баз данных. О наших разработках и используемых для этого технологиях проектирования мы уже писали в журнале "Мир ПК" №8 за 1997 год и №4 за 1998. Занимаясь продвижением своего программного продукта ИПС “ODB-Text”, а также выполняя заказы по разработке документальных систем правовой направленности, мы накопили много откликов и пожеланий пользователей. Обычно пользователи используют базы данных нормативных актов известных правовых информационных систем "Консультант Плюс", "Гарант" и ряда других фирм, а для создания баз данных собственных документов используюят ИПС “ODB-Text”. Несмотря на то, что ИПС “ODB-Text” дала пользователю ряд новых возможностей по организации баз данных и предоставила мощный механизм поиска по запросам на языке, близком к естественному, ряд задач остались по прежнему не решенными.

  • При поиске пользователю в качестве результата нужен не список найденных документов, а конкретный ответ на вопрос или нужное место в единственном документе. Хотя ИПС “ODB-Text” ранжирует список найденных документов в соответствие с близостью к поисковому запросу так, что очень часто нужный документ стоит в списке найденных документов первым, проблема, безусловно, до конца не решена;

  • Правовые информационные системы должны иметь возможность предоставлять пользователю по его запросу ту редакцию документа, которая действует на сегодняшний день (т.е. поддерживать текущую редакцию правовой базы) или, в более общем случае, редакцию документа, который действовал на заданную дату (т.е. поддерживать возможность формирования временных срезов в правовой базе). В существующих системах эти вопросы решаются самими производителями программных продуктов путем редактирования документов с участием опытных юристов и занесения этих изменений в базу. Очевидно, что такой подход возможен только для официальных правовых документов, несет в себе опасность редакторских ошибок и не позволяет пользователю обрабатывать собственные документы. При использовании ИПС “ODB-Text” пользователь может изменять собственные документы и сохранять все необходимые ему редакции в базе данных, но по-прежнему остаются необходимость привлекать к работе опытных юристов и опасность внести ошибки при редактировании документов;

  • На настоящем переходном этапе своего развития законодательство Российской Федерации претерпевает постоянные перемены во всех сферах жизни и в первую очередь в области законодательства. Текущее законодательство России содержит большое число противоречий, которые очень волнуют органы государственной власти всех уровней, специалистов вовлеченных в законотворческий процесс, а также юристов-практиков. Остро чувствуется необходимость в системе, которая смогла бы уже на ранней стадии разработки нормативного документа обнаружить противоречит ли он Конституции Российской Федерации, действующему законодательству России и субъектов Российской Федерации, а также вскрыть внутренние противоречия в самом документе. Аналогичные проблемы встают при составлении договоров и контрактов, когда также необходимо исключить противоречия с законодательством России, а в ряде случаев и международным правом. Если это не сделано возможна ситуация, когда дело в суде будет проиграно не потому, что не верно совершены сделки, а по причине неверного оформления документов. Данная проблема существующими правовыми системами не решается;

  • Как правило, пользователь имеет большое число собственных документов одинаковых или близких по форме и отличающихся отдельными реквизитами. Например, каждый банк подписывает со своими клинтами договора на банковское обслуживание, тексты которых, как правило, однотипны и отличаются только своими номерами, датами подписания, названиями и реквизитами клиентов. Для такого типа документов пользователь хочет иметь возможность автоматически формировать их тексты при изменении их реквизитов. Для простейших случаев это сделать сравнительно легко. Такая задача под силу программисту, освоившему VisualBasic. Офисные приложения, формирующие документы в среде Microsoft Word или Microsoft Excel распространены довольно широко. Однако, в более сложных случаях, такое механическое изменение реквизитов неизбежно будет приводить к ошибкам, которые в документах значительного объема будет трудно находить. Поэтому, мы считаем, что успешно решить задачу синтеза документов по заданным формам и реквизитам можно только, если программа будет понимать смысл той информации, которую компьютер должен переработать. Следовательно, ее также нужно возложить на экспертную правовую систему.

Есть потребность в технологии, которая обеспечивала бы смысловой поиск документов в базе данных, автоматически генерировала различные редкции одного и того же документа, а также текст документа по шаблону и реквизитам и была бы в состоянии обнаружить противоречия в текстах документов. С указанными задачами в состоянии справиться экспертная правовая система, проект получил рабочее название “Минерва”.

Обзор зарубежных разработок

На сегодняшний день есть несколько завершенных проектов в этой области.

Название проекта

Разработчик

Особенности системы

Применение

RELATUS

Массачуссетский Технологичский институт

RELATUS приобретает знания посредством отображения точных и явных текстов в динамическое представление знаний в виде структурированных ссылок. Такое представление ценно само по себе, например, для восстановления исходного текста, а также для дальнейших умозаключений – аналогий, обобщений. Следует отметить, что работа с RELATUS по силам лишь специалистам, рядовому пользователю потребовалось бы пройти серьезное обучение.

Создавалась с целью анализа текстов, отражающих политические события. С помощью RELATUS удается выявить общие моменты в возникновении и развитии ряда локальных конфликтов в течение последних сорока лет.

START

INTERNET-система

Лаборатория искусственного интеллекта Массачуссетского Технологического института

Программа, которая “понимает” несложные вопросы на английском языке и генерирует осмысленные ответы. Например, можно получить ответы на вопросы: “Кто является создателем программы анализа текста?” (ответ – доктор Бервик), “Как связаться с доктором Бервиком?” (в ответ получаем его адрес электронной почты)

Электронный секретарь Web-узла.

Core Language Engine (CLE – Анализатор Ядра Языка)

 

Один из наиболее продвинутых проектов, в котором для представления знаний используются так называемые квази-логические формы, носит название Core Language Engine (CLE – Анализатор Ядра Языка). Знания в нем представляются в виде набора форм, слабо зависящих от контекста. Таким образом, CLE может использоваться как в системах перевода текстов, так и в реализации систем управления базами данных для интерпретации поисковых запросов на естественном языке. Применение CLE позволяет ограничить область возможных интерпретаций синтаксической структуры предложения, отсекая варианты, не имеющие квази-логической формы для преобразования. В то же время следует отметить, что слабую зависимость CLE от контекста в большинстве случаев следует скорее считать недостатком, так как смысл слов и высказываний часто варьируется в зависимости от контекста.

Машинный перевод, преобразование текстовых документов в базу знаний

DYANA

 

Динамическая интерпретация естественного языка

Академический проект, результаты которого могут использоваться для создания экспертных систем и средств для общения с компьютером на естественном языке.

 

Проект “Минерва”

Основной целью проекта является создание экспертной системы, предоставляющей пользователю возможность формирования семантического описания текста документа и помещения его в базу данных, что позволит во время добавления нового документа производить проверку противоречивости данных и анализировать семантику нового документа.

Предлагается, по существу, новый механизм поиска информации в правовой базе данных - механизм семантического поиска. Будет найдена та, информация, которая соответствует смыслу запроса пользователя, а не просто выдан список документов, в которых присутствуют поисковые ключи.

Системы языкового анализа обычно разделяются на три блока: морфологический, синтаксический, семантический. Разбор морфологии слов и синтаксиса предложения может опираться на статистический или процедурный подход. Чисто процедурный и чисто статистический подход пока не приносят удовлетворительных результатов, поэтому применяется комбинированный метод. Наиболее проработаны два первых блока анализатора текста. Ключевым в системе понимания текста является переход от синтаксического представления высказывания к его семантической интерпретации. Считается, что принципиально невозможно построить адекватный машинный переводчик если он не анализирует смысл переводимого текста.

Современные системы справляются с семантическим анализом лишь в определенной узкой предметной области. Область эта, как правило, задается словарем и набором правил. Вообще говоря, те же правила могут быть неверны или неполны при работе с иной предметной областью. Трансформация структуры предложения от синтаксического графа осуществляется при помощи вспомогательных структур. В различных работах и проектах они называются по-разному: упоминавшиеся выше квази-логические формы, семантические шаблоны, семантические правила и т.п.

 

Структура системы

Структура экспертной правовой системы, представлена на Рисунке 1.

image8.gif

Рисунок 1. Структура экспертной правовой системы.

Можно выделить три основных блока экспертной системы - логический анализатор текста, блок семантического анализа, базу данных для хранения знаний экспертной системы.

В настоящее время наряду с решением технических вопросов проектирования экспертной системы: разработка моделей представления и хранения знаний, разработка синтаксиса языка описания знаний и языка запросов, а также программная реализация соответствующих компиляторов, проработка интерфейсных элементов системы и т.д. ведется значительная по объему подготовительная работа с целью выявления, систематизации, языковых конструкций, используемых в текстах нормативных актов. Это обеспечит высокую степень автоматизации отображения синтаксических структур в семантические конструкции вплоть до полной автоматизации. Типовые конструкции (шаблоны) существенно упростят этап синтаксического анализа и обеспечат автоматическую конвертацию выражений, записанных на естественном языке, в выражения на языке описания семантики. В случае если программа не в состоянии адекватно обработать фрагмент текста, пользователю будет предоставлена возможность ответить на ряд уточняющих вопросов, чтобы ввести информацию, дополняющую непонятный фрагмент.

Квалифицированный пользователь, владеющий языком "Минерва", может самостоятельно формировать знания непосредственно на формальном языке на основании своего представления о предметной области. И в этом случае возможные противоречия в его формулировках будут выявлены и указаны конкретные нормативные акты, с которыми конфликтует его формулировки.

В качестве исходного материала для начального заполнения базы знаний предусматривается использовать базы данных нормативных актов основных правовых информационных систем, а также обеспечить полную совместимость с базами данных и интерфейсом ИПС “ODB-Text”.

Предполагается поддерживать платформы Windows 3.1, Windows 95, Windows NT. Также планируется проинтегрировать разрабатываемую экспертную систему в документальную систему корпоративного уровня. Здесь необходимо отметить, что наша компания выполняет работы по стыковке объектной СУБД JASMINE (совместной разработки компаний Computer Associates International, Inc. (CA) и Fujitsu Limited) и объектной СУБД “ODB-Jupiter” (разработка НПЦ “Интелтек Плюс”) , что позволит создавать полнотекстовые ИПС корпоративного уровня, поддерживающие русскоязычную полнотекстовую индексацию. Кроме указанных платформ такой подход позволит поддерживать платформы Macintosh и UNIX, а также получить доступ к документам по сетям ИНТЕРНЕТ/ИНТРАНЕТ.

Рассмотрим более подробно основные элементы экспертной системы.

Логический анализатор текста

Он состоит из следующих элементов (См. рисунок 2):

  • словарь ограниченного русского языка
  • морфологический анализатор
  • синтаксический анализатор

image5.gif

Рисунок 2. Структура экспертной правовой системы.

Функция логического анализатора текста заключается в преобразовании предложения русского языка, содержащего термины предметной области, в граф предложения, отражающий синтаксические связи между членами предложения. Граф предложения в дальнейшем используется как данные для преобразования предложения в эквивалентное выражение на языке описания знаний экспертной системы.

Словарь ограниченного русского языка с возможностью пополнения. Создается группой экспертов, состоит из слов, употребляемых в документах предметной области. Качество преобразований предложений языка в семантические конструкции напрямую зависит от полноты данного словаря.

Для каждого слова в зависимости от языковой категории указываются его морфологические характеристики, например, для существительного будут указаны его род, признак одушевленный/неодушевленный и тип падежных окончаний. Также определяется одно или несколько метапонятий, которые могут определяться словом в зависимости от контекста.

Пример метапонятия

Слово “лицо” в различном контексте может интерпретироваться как часть тела человека, если оно встречается в связке с прилагательным – физическое лицо, то это определенный юридический термин, если в связке с прилагательным “юридическое лицо”, то это еще один юридический термин.

Для предикатов задаются модели управления. С их помощью на этапе синтаксического анализа можно существенно уменьшить количество вариантов, подлежащих анализу. Это позволит на этапе семантического анализа, рассматривая модель управления, идентифицировать семантическую роль термина в предложении. Набор моделей управления также формируется специалистами на этапе создания экспертной системы.

 

Пример

Модель управления для предиката ВЫПОЛНЯТЬ. Глагол ВЫПОЛНЯТЬ может встречаться, например, в таких предложениях:

  1. Министерство Российской Федерации выполняет постановление.
  2. Экспертная группа выполняет анализ для вынесения заключения.
  3. Подрядчик выполняет работы по поручению заказчика.

Для таких предложений модели управления указаны в соответствующих строках таблицы.

Таблица модели управления для предиката выполнять

N

Предлог

Часть речи - кандидат

Синтаксический падеж слова-кандидата

Семантическое метапонятие слова-кандидата

Семантическая роль

Есть альтер-нативы

1

 

Существительное

Именительный

СУБЪЕКТ

Агент

Нет

2

Для

Существительное

Родительный

ОБЪЕКТ

Цель

Нет

3

По

Существительное

Дательный

ОБЪЕКТ

Инициатор

Нет

Морфологический анализатор производит разбор входного потока слов с распознаванием таких частей речи как существительное, прилагательное, глагол, инфинитив, деепричастие, наречие, местоимение, союз, предлог, частицы, знак препинания. Для каждой части речи имеется набор характеристик, определяющих возможные словоформы.

image6.gif

Рисунок 3. Словарь в Логическом анализвторе текстов.

Необходимо отметить, что в настоящее время существует действующий прототип ЛАТ, в рамках которого есть словарь терминов (см. рис. 3), морфологический анализатор и синтаксический анализаторы (см. рис. 4). Результат синтаксического разбора - дерево предложения, в вершинах которого располагаются термины.

Синтаксический анализатор выполняет построение синтаксического графа предложения. Необходимо отметить ряд особенностей его функционирования:

  • При выполнении синтаксического анализа учитываются синтаксические характеристики русского текста, например, для выделения идиом.

  • Выделяются именные группы, определяющие понятия.

  • Выделяются предикативные слова и группы.

  • Производится идентификация синтаксических конструкций, которые могут быть автоматически транслированы в текст формального языка, с учетом шаблонов, определенных экспертами.

image7.gif

Рисунок 4. Синтаксическая структура предложения в Логическом анализвторе текстов.

Блок семантического анализа

Семантический анализ в этом блоке выполняется как преобразование графа предложения, построение которого выполняется Синтаксическим анализатором (см. выше) в выражения на языке “Минерва” с применением шаблонов. Состоит из собственно анализатора и библиотеки шаблонов синтаксических конструкций русского языка, для которых уже имеется представление на формальном языке представления знаний.

Пример

Рассмотрим фрагменты текста постановления Верховного Совета Российской Федерации “О порядке введения в действие Закона Российской Федерации "Об основах налоговой системы в Российской Федерации"”

... правительству РФ ...:

провести переговоры о заключении с иностранными государствами соглашений об избежании двойного налогообложения доходов (прибыли) и имущества юридических и физических лиц;

и

разработать и ввести, начиная с 1992/93 учебного года, в программу средней школы курс по налоговому законодательству.

Они имеют сходную структуру, в которой присутствует следующие смысловые категории:

СУБЪЕКТ - ПРЕДИКАТ - ОБЪЕКТ - ТЕМА

Шаблон, формирующий знание для такого рода предложений, выглядит так:

Boolean СУБЪЕКТ::ПРЕДИКАТ ( ОБЪЕКТ )
begin

if( ОБЪЕКТ.Название () = ТЕМА)

assign Истина

else

assign Ложь

end

Ключевое слово Boolean означает, что данный шаблон выдает логический ответ: ИСТИНА или ЛОЖЬ в зависимости от названия получаемого ОБЪЕКТА.

Программа на языке “Минерва”

Язык описания семантики текстов документов должен быть объектным, чтобы можно было адекватно отразить объекты (например, СУБЪЕКТ ПРАВА, ПРЕЗИДЕНТ, НАЛОГ), их свойства и модели отношений между ними.

Основой модели представления знаний в экспертной подсистеме служит понятие абстрактного объекта, или класса. Класс - это описание совокупности элементов данных, объединенных под общим именем. Элементы данных, называемые "свойствами" класса, в свою очередь характеризуются именами, типами и значениями. В вырожденном случае класс может вовсе не иметь свойств, а описываться только именем. Если множества свойств нескольких классов вложены друг в друга, то можно говорить об иерархии классов. В этом случае между классами устанавливается отношение наследования: базовый класс - производный класс.

Объект, или экземпляр (представитель) класса, - это совокупность элементов данных с заданными значениями; объект можно уподобить записи базы данных соответствующей структуры. В частном случае некоторые свойства отдельного объекта могут быть не заданы.

На множестве объектов, представителей своих классов, могут быть заданы отношения трех видов: факты, правила, следствия. Факт - это отношение между экземплярами классов, которое представляет сведения об объектах, заданные извне, своего рода исходные данные для системы, или первичные знания. Правило - это отношение между классами или внутри класса, которое распространяется на все объекты. На основании фактов и правил с помощью механизма вывода системой могут быть получены выводимые знания. Следствие - это разновидность правила, с помощью которого системой устанавливаются "вторичные факты"; следствия используются для проверки непротиворечивости знаний.

Итак, в терминах введенной модели знания о предметной области представляются в виде совокупности объектов с набором свойств, определяемых классом каждого объекта, и совокупности отношений между отдельными объектами и целыми классами. Для описания классов, объектов и отношений разработан специальный язык описания знаний, позволяющий описывать семантику документов.

Этот формальный язык получил рабочее название, сходное с названием самого проекта - “Минерва”. Далее представлен пример обработки системой нормативного акта – от исходного текста до выражений заложенных в нем знаний на формальном языке.

Текст исходного документа:

П О С Т А Н О В Л Е Н И Е

ВЕРХОВНОГО СОВЕТА РОССИЙСКОЙ ФЕДЕРАЦИИ

О порядке введения в действие Закона Российской Федерации

"Об основах налоговой системы в Российской Федерации"

1. Ввести в действие Закон Российской Федерации "Об основах

налоговой системы в Российской Федерации" с 1 января 1992 года, за

исключением положений о порядке распределения в бюджетную систему

налогов на добавленную стоимость и прибыль предприятий и организа-

ций.

. . .

3. Правительству Российской Федерации:

. . .

в) разработать и ввести, начиная с 1992/93 учебного года, в прог-

рамму средней школы курс по налоговому законодательству;

г) провести переговоры о заключении с иностранными государствами

соглашений об избежании двойного налогообложения доходов (прибыли) и

имущества юридических и физических лиц;

После морфологического и синтаксического анализа из исходного текста автоматически выделяется набор именных групп (в тексте примера выделены жирным шрифтом) и предикатов, которые к ним относятся (выделены подчеркиванием).

Пример выделения понятий и предикатов

верховный совет РФ {постановлять} постановление

постановление {вводить в действие} Закон РФ "Об основах налоговой системы в Российской Федерации"

1.

1.1 постановление {ввести в действие} Закон РФ "Об основах налоговой

системы в РФ".

1.2 постановление {ввести в действие} Закон РФ "Об основах налоговой

системы в РФ" с 1 января 1992 года.

1.3 постановление NOT{ввести в действие} положение

1.4 положение {есть} "О порядке распределения в бюджетную

систему налогов на добавленную стоимость и прибыль предприятий и

3.11 правительство РФ {разработать} курс по налоговому законодательству.

3.12 правительство РФ {ввести} курс по налоговому законодательству.

3.13 курс по налоговому законодательству {ввести в программу} средней школы.

3.14 правительство РФ {ввести} курс с 1992/93 учебного года.

3.15 правительство РФ {провести} переговоры.

3.16 переговоры {провести} с иностранными государствами.

3.17 переговоры {избежать} двойного налогообложения доходов (прибыли)

Система формирует объект и его модель поведения. Если в базе знаний уже такой объект, то его модель поведения дополняется.

Пример

Объект Правительство РФ

Его модель поведения определяется следующими предикатами:

{определить}

{взимать}

{разработать}

{ввести}

{провести}

{решить}

Далее, в соответствие с синтаксическими шаблонами, система конвертирует графы предложения в выражения на языке “Минерва”. Если в тексте встречается предложение, структура которого не соответствует ни одному шаблону, то пользователю задается ряд уточняющих вопросов. Пользователь также может добавить описание такого предложения как новый шаблона.

Пример

Возьмем рассмотренные ранее предложения и шаблон для них. В роли СУБЪЕКТа выступает Правительство РФ, ОБЪЕКТ в первом случае - переговоры, во втором – курс. Модель поведения в первом случае определяется глаголом Провести, во втором - Ввести. Система автоматически сформирует два следующих выражения для объекта Правительство РФ:

Boolean Правительство РФ::Провести (Переговоры)

begin

if(Переговоры.Название () = “двойное налогообложение”)

assign True

else

assign False

end

Boolean Правительство РФ::Ввести ( Курс )

begin

if(Курс.Название () = “налоговое законодательство”)

assign True

else

assign False

end

База данных для хранения объектов и моделей поведения

Для хранения атрибутов объектов и их методов целесообразно применить объектную базу данных. Именно объектная СУБД обеспечивает эффективное хранение объектов, взаимодействие между ними посредством передачи сообщений (в терминах объектного программирования – вызовом методов с определенными параметрами), чтение/запись объектов из/в базу. Следует отметить, что применение объектной базы данных позволяет совместить хранение знаний в виде объектов и связей между ними наряду с текстами самих документов. Объектная СУБД ODB-Jupiter, разработанная в НПЦ "Интелтек Плюс", хорошо подходит для этой цели. В информационно-поисковой системе ODB-Text, использующей эту СУБД как сервер документов, уже решены вопросы хранения текстов юридических документов в виде гипертекста, реализован сложный полнотекстовый поисковый механизм.

Именно эти идеи были учтены при разработке экспертной системы по организационно-правовой защите интеллектуальной собственности в высшей школе “ПраЗИС”, которая осуществлялась в целях осуществления принятой Комитетом по высшей школе Российской Федерации программы “Интеллектуальная собственность высшей школы” группой сотрудников кафедры “Электронные вычислительные машины и системы” МГТУ им. Н.Э. Баумана. Среди них были авторы настоящей статьи.

Обобщая все сказанное выше, покажем на конкретном примере, взятом из действующего законодательства, как экспертная система будет устанавливать противоречия в правовых документах.

Пример установления противоречий

Выявление противоречия статьи 11 федерального закона "О государственной регистрации прав на недвижимое имущество и сделок с ним" по отношении к Конституции РФ.

Конституция РФ. Статья 57:

Каждый обязан платить законно установленные налоги и сборы. Законы, устанавливающие новые налоги или ухудшающие положение налогоплательщиков, обратной силы не имеют.

На основании статьи 57 система сформирует такие знания:

Субъект_права.Платить ( Налог )

Субъект_права.Платить ( Сбор )

Субъект_права.Иметь ( Имущество )

Федеральный закон “О государственной регистрации прав на недвижимое имущество и сделок с ним”. Статья 1:

. . .

недвижимое имущество (недвижимость), права на которое подлежат государственной регистрации в соответствии с настоящим Федеральным законом, - земельные участки, участки недр, обособленные водные объекты и все объекты, которые связаны с землей так, что их перемещение без несоразмерного ущерба их назначению невозможно, в том числе здания, сооружения, жилые и нежилые помещения, леса и многолетние насаждения, кондоминиумы, предприятия как имущественные комплексы...

Статья 11 :

1. Система государственной регистрации прав создается за счет платы

за регистрацию и предоставление информации о зарегистрированных правах, бюджетных средств и иных не запрещенных законом источников.

2. Плата за регистрацию и предоставление информации о зарегистрированных правах на недвижимое имущество и сделок с ним взимается в размерах, установленных субъектами Российской Федерации.

Максимальный размер платежей на территории Российской Федерации устанавливается Правительством Российской Федерации.

  1. Средства, получаемые в виде платы за регистрацию и предоставление указанной информации, используются исключительно на создание, поддержание и развитие системы государственной регистрации прав на недвижимое имущество и сделок с ним, в том числе на обеспечение государственных гарантий зарегистрированных прав.

Статья 1, которая определяет необходимость регистрации недвижимого имущества, на языке “Минерва” будет представлен так:

Boolean Субъект_права.Должен_Регистрировать ( Имущество )

begin

if (Субъект_права.Иметь ( Имущество ) AND Имущество = Недвижимость)

return Истина

else

return Ложь

end

Статья 11, которая определяет порядок такой регистрации, на языке “Минерва” будет представлен так:

Boolean Субъект_права.Регистрация ( Имущество )

begin

if ( Субъект_права.Регистрировать( Имущество ) AND Субъект_права.Платить ( Плата) )

return Истина

else

return Ложь

end

После описания на “Минерве” процедуры регистрации при попытке добавления в базу знаний будет выявлено отсутствие у объекта Субъект_права метода Платить с аргументом Плата, поскольку в Конституции РФ декларируется обязанность Субъект_права платить только налоги и сборы. В законе "Об основах налоговой системы в Российской Федерации", где определяется понятие налогов, термин Плата также не фигурирует, следовательно, среди объектов формального языка не присутствует. Пользователь получит сообщение с информацией о документах, в которых встречались упоминание о Субъекте_права (в нашем случае – Конституция РФ и закон "Об основах налоговой системы в Российской Федерации") система укажет ему имя объекта и метода, вызвавших конфликт и выделит строку программы языка "Минерва":

if ( Субъект_права.Регистрировать( Имущество ) AND Субъект_права.Платить ( Плата) ),

на которой произошел останов. Система также сможет позиционироваться на том абзаце и словах документа, где выявлено противоречие. В нашем примере это будет статья 11 закона "Об основах налоговой системы в Российской Федерации".

Синтез текста документа, временной срез

Имеющееся описание смысла документа на формальном языке может быть преобразовано в текст документа на естественном языке. Для этого выполняется преобразование, обратное преобразованию, выполняемому блоками семантического анализа и логическим анализатором текста. Описание на языке "Минерва" преобразовывается в граф предложения, определяющий его синтаксическую структуру. Далее граф предложения преобразовывается в предложение на ограниченном естественном языке.

Системой также решается проблема получения текущей редакции документа и редакции, действующей на заданную дату. Для этого должен быть сформулировано поисковое выражение на языке “Минерва”. Для большинства случаев достаточно использовать поисковые выражения, подготовленные специалистами, изменяя в них лишь дату. Если добавить диалоговый интерфейс, то конечный пользователь сможет просто вводить дату и получать текст документа, минуя непосредственное использование языка “Минерва”.

Что уже сделано и что предполагается сделать в ближайшее время

На сегодняшний день (работа над статьей была завершена в апреле 1998 года) создан действующий прототип Логического анализатора текста, разработан объектный язык описания семантики текстов документов “Минерва” и начаты работы по реализации его компилятора. Специфицирована модель знаний в объектно-ориентированной СУБД ODB-Jupiter.

Для успешного завершения работ по созданию прототипа экспертной системы предстоит:

  • Завершить разработку словаря терминов и правил, необходимых для функционирования логического анализатора текста;

  • Провести комплексное тестирование Логического анализатора текста;

  • Создать библиотеку синтаксических шаблонов;

  • Обеспечить взаимодействие программистов, лингвистов и юристов, поскольку решение может быть только комплексное.

Эти работы планируется завершить в конце 1998 года и приступить к комплексному тестированию системы на реальных правовых базах и внедрению опытного образца.

В заключении можно отметить, что компанией НПЦ “ИНТЕЛТЕК ПЛЮС” совместно с Информационно-аналитическим управлением Совета Федерации Федерального Собрания Российской Федерации начаты научно-исследовательские работы направленные на разработку подходов к компьютерному анализу смысла правовых документов по проекту “Минерва” и внедрению задуманной экспертной системы в работу органов государственного управления непосредственно связанных с законотворческим процессом. Мы уверены, что и другие организации, как государственные, так и частные откликнутся на нашу статью и примут активное участие в обсуждении затронутых вопросов, а также непосредственной работе над проектом.

Поэтому можно закончить статью также словами Гете:

Я убеждаюсь, что дождался часа,
Когда природы тайную печать
Нам удалось сознательно сломать
Благодаря пытливости привычной,
И то, что жизнь творила органично,
Мы научились кристаллизовать.


© НПЦ "ИНТЕЛТЕК ПЛЮС", 1997-2006, E-mail: publish@inteltec.ru