УДК 004.423.46 МОДЕЛИРОВАНИЕ
СЕМАНТИКИ – ЯЗЫКОВЫХ ВЫСКАЗЫВАНИЙ В
АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ Юневич Б.А., Ащаулов А.В., Казакова Е.И. Источник: Сучасні проблеми науки та освіти.
Матеріали 8-ї Міжнародной міждисциплінарної науково-практичної конференції (28
квітня - 9 травня 2007 р., м. Алушта, Автономна республіка Крим, Україна) Проблема
автоматической обработки естественного языка/
привлекает ученых
самых различных специальностей: математиков, специалистов по
искусственному
интеллекту, лингвистов и др. Решением данной проблемы является
необходимость
исследования и моделирования на ЭВМ процессоров понимания
естественного языка
человеком. Системы языкового
общения можно разделить на четыре группы: форматные, с текстовой
основой, с
ограниченной логикой и с общим выводом. Форматные системы
относятся к наиболее простым диалоговым системам и обычно
используют два
жестких формата: один – для представления знаний, хранимых в системе,
другой – для
представления входных и выходных сообщений. Примером может
служить модель
общения, использующая табличный знак. В системах с
текстовой
основой непосредственно храниться текст на естественном языке. Текст
снабжается
различного рода схемами индексирования, на основе которых строятся
запросы, и
производиться поиск запрашиваемых предложений или фрагментов
текста. Наиболее
распространены в этой группе, являются системы, использующие
дескрипторные
языки. Дескрипторы – это лексические единицы информационно-поискового
языка,
обладающие смысловой однозначностью. Они используются для
индексирования
текста Дескрипторы и связи между ними устанавливаются на основе
профессионального языка пользователя и формализуются в виде
дескрипторного
графа. При общении разрешается только использовать только
слова из словаря
дескрипторов. Структура запроса строиться только в соответствии со
структурой
связи между дескрипторами. Недостатком этих языков является
невозможность
организации процедур выбора более сложных, чем поиск по дескрипторному
графу. Структура подсистемы
семантической обработки естественно-языковых сообщений может быть
представлена
в виде: 1. Модель
текста 2. Модель
фразы (группы слов) 3. Модель
словосочетания (пары слов) 4. Модель слова
а) модель аффиксов
b)
модель корня Особую роль
предлагаемые модели сыграют в системах
машинного перевода. Перевод текста с одного языка на другой можно
свести к
получению семантического эквивалента будет осуществляться синтез текста
на
русском, украинском и любом другом языке, при этом будет одновременно
осуществляться семантический контроль как входных, так и выходных
текстовых
конструкций. Применение подобных моделей возможно и в системах анализа
звучащей
речи, эти модели смогут осуществлять как коррекцию ошибок, так и
семантический
анализ входных сообщений. |