Агентная система накопления и хранения информации

А. Н. Швецов. В. И. Летовальцев
Вологодский Государственный Технический университет

Источник: http://www.sai.vstu.edu.ru/load/agent_system.doc


В современной динамично развивающейся компании возникает необходимость обеспечения возможности доступа сотрудников в глобальную сеть Интернет. Причин для такой необходимости несколько. Основная причина состоит в том, что обеспечение выхода во Всемирную сеть – это самый простой способ предоставить работнику возможность получения необходимой свежей информации. Но перед многими компаниями встает проблема чрезмерных расходов на телекоммуникационные услуги. При этом организации не желают оплачивать использование сотрудником Интернета в личных целях.

Для решения этой проблемы чаще всего используются системы учета сетевых ресурсов, лишенные интеллектуального потенциала и проводящие лишь подсчет проходящего трафика на основе IP-адресов или DNS-имен ресурсов. Превышение квоты доступа к нерабочим ресурсам влечет некоторые санкции (например, ограничение или запрет доступа до конца отчетного периода). Все недостатки такой системы очевидны и изложены в [1]. Кроме того, авторами данной статьи в [1] также предложен выход из этой ситуации – использование агентной системы учета трафика, проводящей содержательный анализ просматриваемых страниц на предмет их соответствия рабочим ресурсам. Соответствие определяется путем соотнесения просматриваемых ресурсов с моделью предметной области, которая является целевой для данного работника. Так у работников разных специальностей предполагается наличие различных предметных областей, которые можно считать для них рабочими.

Тогда перед системой встает проблема хранения «отображений» различных предметных областей и организации совместного доступа к ним. Хранение предметных областей в данном случае, по мнению авторов, удобно реализовать на базе онтологий. Впервые термин формальной онтологии был введен еще Эдмундом Гуссерлем, который в своих «Логических исследованиях» (1900/01) различает формальную логику, с одной стороны, и формальную онтологию, с другой. Формальная логика имеет дело с взаимосвязями истин (или пропозициональных значений в общем случае) - с отношением выводимости, с непротиворечивостью и общезначимостью. Формальная онтология имеет дело с взаимосвязями вещей, с объектами и свойствами, частями и целым, отношениями и совокупностями[2]. Сейчас онтологии в искусственном интеллекте используются достаточно часто. Так на них базируется идея SemanticWeb, онтологии используются для взаимодействия агентов в мультиагентные системах и средах (например, в Jade), все больше свободно распространяемых онтологий, созданных профессиональными инженерами по знаниям становится доступно в сети Интернет. Поэтому использование онтологий позволит решить проблемы с стандартизацией механизмов доступа и обработки к данным о предметных областях пользователей.

Стоит особо выделить одно важное свойство системы учета сетевых ресурсов. Через нее проходит большой объем информации, ценной для сотрудников компании. При этом эта информация безвозвратно теряется, если запрашивающий ее субъект не позаботится о сохранении. Так, предположим, что технический специалист потратил на поиск документации в Интернете 1 час и использовал 10Мб трафика. Вероятность, что нечто потребуется его коллегам, работающим над похожей задачей достаточно велика. Если отдел составляет 5 человек, то как минимум двоим (половине оставшегося количества работников) может потребоваться подобная информация, т. к. технические специалисты чаще всего работают группами. Тогда, если первый работник не сохранил данные своего поиска или не рассказал о них по к.-л. причине (например, не знал, что коллеги столкнулись с похожей проблемой), то остальным работникам придется производить поиск самостоятельно, снова затратив на это время и потребляя трафик. Т. е. затраты компании на эту операцию можно снизить (в идеале) в три раза.

Для этого система учета сетевых ресурсов должна иметь возможность хранения, доступа и ранжирования по релевантности информации, которая уже запрашивалась ранее. Схема взаимодействия агентов в такой системе представлена на рис. 1. Охарактеризуем основные классы агентов.

Рис. 1 – Схема корпоративной агентной системы накопления и хранения информации

  1. Агент пользователя
    Предоставляет пользователю интерфейс взаимодействия с системой (необходимую информацию по поводу текущего состояние его квот, личных настроек, возможности для поиска информации в локальных информационных хранилищах и на Интернет-поисковиках), а также обеспечивает связь пользователя с другими пользователями системы. Все необходимые данные сохраняются в локальной БД.
  2. Агент администратора
    Позволяет проводить мониторинг и управление системой, распределение и назначение квот, отслеживание и анализ текущей информации.
  3. Агент лингвистической обработки информации
    Все операции связанные с лингвистической (графематической, морфологической, синтаксической) обработкой целесообразно сконцентрировать в одном агенте. Этот агент будет совершать необходимые лингвистические преобразования над текстами, предоставляемыми другими агентами системы. Для передачи лингвистических данных используем специальный протокол netWord. Этот проблемно ориентированный протокол прикладного уровня модели OSI разработан авторами на основе языка разметки XML и предназначен для передачи лингвистической информации через сеть.
  4. Агент предоставления и мониторинга ресурсов
    Этот агент непосредственно осуществляет доставку необходимых ресурсов из внешней сети в локальную сеть предприятия. Он проводит учет и мониторинг действий пользователя и тесно взаимодействует с агентом семантического анализа.
  5. Агент семантического анализа
    Этот агент осуществляет непосредственно сам семантический анализ и разделение трафика на рабочий и нерабочий. Кроме того, он дает оценку релевантности запрашиваемой информации и проводит обработку запросов пользователя, вводимых на естественном языке. В основе этого агента могут лежать как достаточно простые способы семантического анализа (один из таких способов предложен в [3]), так и достаточно изощренные методы анализа на основе инстенсиональных логик, концептуальных графов и т. д.
  6. Агент обработки запросов.

Основной функцией этого агента является управление поиском. При этом необходимо обрабатывать запросы пользователя, вводимые на естественном языке, осуществлять маршрутизацию этих запросов таким образом, чтоб поиск проводился в локальных хранилищах тех агентов, которые с наибольшей вероятностью обладают этой информацией. При работе этого агента на первый план выходят социальные аспекты поведения агентных систем. Так все агенты представленной системы решают единую задачу посредством множества взаимодействий, которые могут не программироваться явно.

Мультиагентная архитектура системы позволяет безболезненно в будущем заменить отдельные части системы. Например, заменить алгоритм маршрутизации запросов, реализовав другого агента, управляющего поисковыми функциями системы.

Агентная реализация также обеспечивает масштабируемость. Так при росте компании система не потребует коренной перестройки, а может быть просто расширена. При введении нового сервера доступа в глобальную сеть достаточно будет добавить еще одного агента предоставления и мониторинга ресурсов. При изменении количества пользователей также будет изменяться и количество пользовательских агентов.

При построении системы необходимо будет решить и ряд вопросов, которые до сего момента не рассматривались авторами: неприкосновенность личной информации пользователей, возможности репликации данных, распределение нагрузки на основе вычислительных мощностей.

Результатом работы должна стать самопополняющаяся платформа накопления информации, распределенной по предметным областям


Список использованных источников

  1. Швецов А. Н., Летовальцев В. И. Агентная система учета трафика при организации доступа сотрудников в Интернет //Труды Восьмого международного симпозиума – М.: РУСАКИ, 2008. – С. 273-277
  2. Васюков В.Л. Формальная онтология и искусственный интеллект // Искусственный интеллект / под ред. Д.И. Дубровского и В.А. Лекторского, М.: ИИнтеЛЛ, 2006.
  3. Швецов А. Н., Летовальцев В. И.Агент семантического поиска информации на основе онтологий. //Научный сервис в сети Интернет: многоядерный компьютерный мир. 15 лет РФФИ: Труды Всероссийской научной конференции. – М.: Изд-во МГУ, 2007. – С. 295-299