УДК 004.81
СЕМАНТИЧЕСКИЙ АНАЛИЗ ИНФОРМАЦИИ И ОБРАБОТКА ЕСТЕСТВЕННЫХ ЯЗЫКОВ
Шатохин Н.А., Дмитриева О. А.
Донецкий национальный технический университет
Мотивация работыВ течении достаточно долгого времени, процесс общения человека с машиной был достаточно трудоемкой задачей. Взаимодействие пользователя и вычислительной машины осуществлял человек-специалист — оператор ЭВМ. Все изменилось с появлением персональных компьютеров и операционных систем, имеющих интерфейс пользователя. Сначала управление компьютером осуществлялось с помощью командной строки, а затем появились и графические интерфейсы. Но даже этот способ управления машиной требует определенной подготовки пользователя. Кроме того, существуют области, в которых гораздо удобнее использовать труд человека, чем работу машины. К ним относятся различные справочные службы и техническая поддержка, перевод текста с одних языков на другие, поиск информации и т.п. Возникает необходимость разработать интерфейс, позволяющий общаться с машиной, как с живым человеком [1].
Цель работы: разработать систему, способную преобразовывать фразы на естественном языке в определенные семантические конструкции, понятные программе, и манипулировать ими.
Задачи:Система состоит из трех модулей: модуля преобразования предложения на естественном языке в лексемы [2], модуля построения ответа к полученному запросу и модуля преобразования построенной лексемы-ответа в предложение естественного языка.
Давайте разберемся с тем, как работает система. Вначале, пользователь вводит предложение. Оно поступает на вход первого модуля. Программа определяет некоторые свойства предложения: является оно вопросительным или повествовательным, не задавал ли уже собеседник этот вопрос и т.п. Затем предложение разбивается на массив слов и каждое слово поочередно сравнивается с базой данных. Если слово отсутствует в базе, то система сообщит об этом пользователю и попросит ввести это слово. Когда все слова найдены, первый модуль сформирует лексему и передаст ее на вход второго модуля.
Второй модуль является главным модулем системы. Используя инструкции, зашифрованные в лексеме, он определяет смысл входящего предложения и строит лексему-ответ. Построенная лексема передается на вход третьего модуля, который работает аналогично первому, но в обратном порядке.
Сравнение с существующими системамиСравнение с языком Пролог
Данная разработка имеет огромные перспективы. На ее основе можно создавать когнитивные переводчики (как текста, так и устной речи), справочные системы, системы бронирования билетов. Ее можно использовать в компьютерных играх, либо в специальных тренажерах, обучающих общению с людьми. Систему можно встраивать в “Умный дом”, чтобы позволить хозяину управлять бытовыми устройствами посредством человеческой речи.
Разумеется, на данном этапе говорить об этом пока рано, но система непрерывно совершенствуется и кто знает, какие у нее будут возможности через год или два.
Литература