Юневич Б.А., Ащаулов А.В., Казакова Е.И. МОДЕЛИРОВАНИЕ СЕМАНТИКИ - ЯЗЫКОВЫХ ВЫСКАЗЫВАНИЙ В АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

УДК 004.423.46

МОДЕЛИРОВАНИЕ СЕМАНТИКИ – ЯЗЫКОВЫХ ВЫСКАЗЫВАНИЙ В АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

Юневич Б.А., Ащаулов А.В., Казакова Е.И.

Источник: Сучасні проблеми науки та освіти. Матеріали 8-ї Міжнародной міждисциплінарної науково-практичної конференції (28 квітня - 9 травня 2007 р., м. Алушта, Автономна республіка Крим, Україна)

Проблема автоматической обработки естественного языка_/ привлекает ученых самых различных специальностей: математиков, специалистов по искусственному интеллекту, лингвистов и др. Решением данной проблемы является необходимость исследования и моделирования на ЭВМ процессоров понимания естественного языка человеком.

Системы языкового общения можно разделить на четыре группы: форматные, с текстовой основой, с ограниченной логикой и с общим выводом.

Форматные системы относятся к наиболее простым диалоговым системам и обычно используют два жестких формата: один – для представления знаний, хранимых в системе, другой – для представления входных и выходных сообщений. Примером может служить модель общения, использующая табличный знак.

В системах с текстовой основой непосредственно храниться текст на естественном языке. Текст снабжается различного рода схемами индексирования, на основе которых строятся запросы, и производиться поиск запрашиваемых предложений или фрагментов текста. Наиболее распространены в этой группе, являются системы, использующие дескрипторные языки. Дескрипторы – это лексические единицы информационно-поискового языка, обладающие смысловой однозначностью. Они используются для индексирования текста Дескрипторы и связи между ними устанавливаются на основе профессионального языка пользователя и формализуются в виде дескрипторного графа. При общении разрешается только использовать только слова из словаря дескрипторов. Структура запроса строиться только в соответствии со структурой связи между дескрипторами. Недостатком этих языков является невозможность организации процедур выбора более сложных, чем поиск по дескрипторному графу.

Структура подсистемы семантической обработки естественно-языковых сообщений может быть представлена в виде:

1. Модель текста

2. Модель фразы (группы слов)

3. Модель словосочетания (пары слов)

4. Модель слова

а) модель аффиксов

b) модель корня

Особую роль предлагаемые модели сыграют в системах машинного перевода. Перевод текста с одного языка на другой можно свести к получению семантического эквивалента будет осуществляться синтез текста на русском, украинском и любом другом языке, при этом будет одновременно осуществляться семантический контроль как входных, так и выходных текстовых конструкций. Применение подобных моделей возможно и в системах анализа звучащей речи, эти модели смогут осуществлять как коррекцию ошибок, так и семантический анализ входных сообщений.