Назад

Реализация нечеткой реляционной базы данных, используя объединение определения состава величин

Автор статьи: Карен Л. Джой Смита Даттатри

Перевод статьи: Бережная Наталья Юрьевна

ПРОБЛЕМЫ И МОТИВАЦИЯ

   Большинство традиционных баз данных, используемых сегодня базируются на основе реляционной модели. Значения в отношении берутся из конечного набора строго типизированного значения области. Каждая связь в базе данных представляет собой предложение, и каждая запись в соотношении с заявлением, что оно принимает значение "истина" для этого предложения (например, [3], [5]). Однако можно утверждать, что для этого требуется точность, ведь в действительности оно дает недостаточное представление о мире. Модель базируется на бинарных соотношениях черное - белое, но большая часть реальности действительно существует в оттенке серого. Таким образом, обычные модели реляционной базы данных имеют ограниченную полезность.

    Одной из областей, которая иллюстрирует это ограничение в повседневной жизни, является субъективный язык, который обычно используется для описания людей. Например, человек может быть описан как "высокий, с широким лицом и темно-карими глазами". Это описание было бы трудно представить в рамках обычной реляционной модели потому, что оно использует описательные слова, которые по своей сути являются неточными,, а также потому что разные сообщества (т. е. группы с внутренним соглашением о субъективных значениях этих терминов), могут описать одно и то же лицо по-разному. Цель этого исследования состояла в реализации реляционной базы данных, которая представляет изображения с неточными атрибутами и, путем включения обратной связи с пользователями, будет адаптировать описания атрибутов так, чтобы надлежащим образом представить базу консенсуса конкретному сообществу пользователей.

 ПРЕДИСТОРИЯ И СВЯЗАННОЕ С РАБОТОЙ

    Традиционная модель реляционной базы данных базируется на основе точных значений. Концепцию нечеткости конструктивно описывает Заде [7], однако, она включает в себя неточности, неопределенности и степени достоверности значений. Нечеткие теории реляционных баз данных распространяются на реляционные модели, для представления неточных данных и,, таким образом, он обеспечивает более точное представление о разрешении на цифровую или материальную копии всей работы или ее части для личного использования или использования в классе. Работа предоставляется бесплатно, при условии, что копии сделаны и распространяются без цели получения прибыли или получения коммерческой выгоды, и что они несут копии данного уведомления и полное описание на первой странице. Чтобы копировать, переиздавать, размещать на серверах или перераспределять в списки, требуется предварительное специальное разрешение и / или внесение платы. 

    Обработка естественного языка запросов к базе данных позволяет использовать обыденный язык. Интерфейс на естественном языке обычно имеет собственный словарь, содержащий термины, связанные с отношениями и их соотношениями, а также стандартный словарь языка. Стандартный подход, используемый в естественных языковых системах проявляется в том, что семантическая грамматика создается для базы данных и используется для анализа запроса; синонимы должны быть приведены также. Недостатком такого подхода является то, что грамматика должна быть индивидуальная для каждой конкретной базы данных и может иметь  недостаточно информации в базе данных для создания надежной системы [1]. Такой подход будет иметь ограниченную полезность в базе данных / запроса системы, предназначенной для постоянного изменения его дескрипторы на основе отзывов пользователей.

ПОДХОД И УНИКАЛЬНОСТЬ

    В рамках этого проекта система была разработана, чтобы позволить пользователям запрашивать базу данных с помощью субъективный, обыденный язык и вернуться к изображениям, которые удовлетворяют эти субъективные описания. Кроме того, каждый пользователь сообщества, а не разработчик базы данных, будет определять изображения. Таким образом, каждое сообщество могло бы описать те же изображения, по-разному. Нечеткая реляционная модель идеально подходит для представления этих субъективных дескрипторов изображений. Существуют различные методы учета неточности в базу данных системы. Применяемый здесь метод заключается в повышении обычных реляционных баз данных путем добавления членства значения [0,1], чтобы представлять правдивость каждого предложения - степень каждого атрибута в отношение. Такая стратегия позволяет базе данных представлять собой диапазон значений без ущерба для целостности данных в реляционной модели [4].

    Приложение было реализовано в VB.NET и SQL Server 2000. Пользователь вошел через естественный язык запросов, который был разбит на отдельные компоненты в реальном запросе, и в его атрибуты и модификаторы, которые хранятся в файлах данных. Реализация хранимых процедур обрабатывает эти данные, т. е. определяет диапазоны значений для модификаторов, запускает изменение запросов к базе данных, и возвращает соответствующие изображения пользователю.

   Каждый атрибут изображений в первоначально установленной базе данных, случайная величина членского состава. Атрибутам модификаторов присвоены численные квоты. Например, средний модификатор "(пример " средне зеленые глаза") колебалась от 0,30 до 0,74, а "очень" колебалась от 0,75 до 1,0. Каждый модификатор использует пороговое значение, которое было разработано для «стабилизации» атрибутов членства, значение каждого атрибута в пределах квоты модификатора, для более точного представления сообщества консенсуса. Эта стабилизация собственности осуществляется следующим образом. Когда пользователи рассматривали изображения, которые в настоящее время соответствовали их критериям, они обеспечивали обратную связь с указанием, какого-либо изображения, выполняя свои критерии, или они считали, что изображение будет лучше определяется с помощью более сильного или слабого модификатора. Если пользователь выбрал предыдущий, тогда членство значения атрибута сдвинется к пороговому значению этого диапазона модификатора. Регулируя вес состава, так, чтобы он был более глубоко внутри диапазона модификатора, общественное мнение было укреплено с одновременной обратной связью. Однако, если пользователь выбрал последний, то вес атрибута слегка отодвинется от порогового значения в направлении предложенном самим пользователем. Таким образом, именно благодаря использованию каждого сообщества, его правильные значения были установлены. Эта стратегия потенциально создает базу данных, которая является более надежной и с повышением общей пользы.

РЕЗУЛЬТАТЫ И МАТЕРИАЛЫ

    Первоначальные результаты показали прототипную реализацию для достижения успеха. Пользователи получили возможность получения изображений с помощью субъективных дескрипторов, и различные группы пользователей могут успешно изменить базу данных атрибутов имиджа, точно представляя смысл своей группы.

    Дальнейшая работа проекта будет включать разработку улучшенных  естественно-языковых интерфейсов для более эффективного перевода обыденного языка дескриптора запросов в SQL. Дополнительные работы будут также направлены на совершенствование методов для создания синонимов - атрибутов дескрипторов. В настоящее время синонимы отображаются на естественно-языковых интерфейсах. Однако, как говорилось выше, этот метод имеет ограниченную полезность для базы данных системы, которая предназначена для гибкого пользования. В настоящее время ведется разработка системы, при которой сама база данных постоянно учит синонимы для каждого пользовательского сообщества.

Назад