УДК 004.423.46

МОДЕЛИРОВАНИЕ СЕМАНТИКИ  ЯЗЫКОВЫХ ВЫСКАЗЫВАНИЙ В АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

Юневич Б.А., Ащаулов А.В., Казакова Е.И.

Источник: Сучасні проблеми науки та освіти. Матеріали 8-ї Міжнародной міждисциплінарної науково-практичної конференції (28 квітня - 9 травня 2007 р., м. Алушта, Автономна республіка Крим, Україна)

Проблема автоматической обработки естественного языка/ привлекает ученых самых различ­ных специальностей: математиков, специалистов по искусственному интеллекту, лингвистов и др. Решением данной проблемы является необходимость исследования и моделирования на ЭВМ про­цессоров понимания естественного языка человеком.

Системы языкового общения можно разделить на четыре группы: форматные, с текстовой ос­новой, с ограниченной логикой и с общим выводом.

Форматные системы относятся к наиболее простым диалоговым системам и обычно использу­ют два жестких формата: один  для представления знаний, хранимых в системе, другой  для пред­ставления входных и выходных сообщений. Примером может служить модель общения, использую­щая табличный знак.

В системах с текстовой основой непосредственно храниться текст на естественном языке. Текст снабжается различного рода схемами индексирования, на основе которых строятся запросы, и произ­водиться поиск запрашиваемых предложений или фрагментов текста. Наиболее распространены в этой группе, являются системы, использующие дескрипторные языки. Дескрипторы  это лексические единицы информационно-поискового языка, обладающие смысловой однозначностью. Они исполь­зуются для индексирования текста Дескрипторы и связи между ними устанавливаются на основе профессионального языка пользователя и формализуются в виде дескрипторного графа. При обще­нии разрешается только использовать только слова из словаря дескрипторов. Структура запроса строиться только в соответствии со структурой связи между дескрипторами. Недостатком этих языков является невозможность организации процедур выбора более сложных, чем поиск по дескрипторному графу.

Структура подсистемы семантической обработки естественно-языковых сообщений может быть представлена в виде:

1. Модель текста

2. Модель фразы (группы слов)

3. Модель словосочетания (пары слов)

4. Модель слова

             а) модель аффиксов

             b) модель корня

Особую роль предлагаемые модели сыграют в системах машинного перевода. Перевод текста с одного языка на другой можно свести к получению семантического эквивалента будет осуществляться синтез текста на русском, украинском и любом другом языке, при этом будет одновременно осуществляться семантический контроль как входных, так и выходных текстовых конструкций. Применение подобных моделей возможно и в системах анализа звучащей речи, эти модели смогут осуществлять как коррекцию ошибок, так и семантический анализ входных сообщений.