КОМАНДНАЯ РАБОТА АГЕНТОВ В РЕАЛЬНОМ ВРЕМЕНИ

КОМАНДНАЯ РАБОТА АГЕНТОВ
В РЕАЛЬНОМ ВРЕМЕНИ

И. В. Котенко, Л. А. Станкевич

В статье рассматриваются вопросы управления работой команды интеллектуальных агентов. Определяются обобщенные модели командной работы. Предлагается подход к обеспечению работы команды агентов в условиях временных ограничений (в реальном времени), основанный на комбинировании моделей приближенных вычислений и anytime-алгоритмов. Описываются примеры моделей построения команд агентов, реализующих данный подход, для двух приложений: симуляционного футбола роботов и моделирования боевых действий, реализуемых группой беспилотных летательных аппаратов.

1. ВВЕДЕНИЕ

Командная работа агентов актуальна для множества приложений (программные поисковые агенты в сети Интернет, управление коллективом совместно работающих мобильных объектов, компьютерное моделирование различных форм боевых действий, футбол роботов и т.д.).

Согласно современным представлениям, управление командной работой должно выполняться распределенными иерархическими системами с развитыми функциями координации и управления. Ключевой проблемой в таких системах является координация в реальном времени коллективного поведения членов команды, распределено решающих общую задачу. Специфика проблемы заключается в том, что агенты, составляющие команду, обладают общими и частными навыками и собственным поведением, неполными знаниями об окружающей среде и ограниченными ресурсами. При этом должны быть способны выполнить общую задачу посредством реализации индивидуальных задач и коммуникации. Каждый такой агент действует в динамически меняющейся среде, и его действия привязаны ко времени и пространству. Члены команды при выполнении запланированных операций могут объединяться в подгруппы и подчиняться лидеру (назначенному или выбранному). Они функционируют внутри антагонистической среды, которая может мешать их командным действиям.

Существует несколько подходов к описанию и формализации командной работы агентов [7]. Один их них, известный под названием “Теория общих намерений”, предложенный в работе [3], формулирует, в основном, общие рамки, определяющие командное поведение и характер взаимодействия членов команды. Второй, более формализованный подход, описанный в работе [8], известен под названием “Теория общих планов”. В работе [18] ключевые идеи обоих подходов обобщены, частично объединены и использованы при создании программного инструментария для разработки приложений в области командной работы агентов.

Одним из важнейших требований к командной работе агентов является обеспечение гарантированного решения задач в режиме реального времени (при временных ограничениях). Существующие подходы к решению проблемы обеспечения временных ограничений основываются на применении следующих архитектур:

(1) реактивные архитектуры (называемые также рефлективными), в которых элементы вывода построены в виде множества пар “стимул ® реакция” ([1], [4] и др.);

(2) архитектуры, базирующиеся на использовании нескольких асинхронно действующих подсистем ([10], [15] и др.);

(3) простые “делиберативные” архитектуры (например, как в системе PRS [12]), в которой механизмы поиска определенным образом ограничены для обеспечения предсказуемости общего времени реакции (отклика) системы;

(4) более сложные делиберативные архитектуры, основанные на использовании механизмов приближенных вычислений [14], “гибких” вычислений [11], делиберативного планирования вычислений [2], планирования вычислений “проектирование ко времени” [5], планирования вычислений “проектирование по критериям” [19], контрактных anytime-алгоритмов ([20], [21] и др.) и прерываемых anytime-алгоритмов ([9] и др.), которые базируются на инкрементных методах улучшения решения;

(5) комбинированные архитектуры, построенные путем интеграции различных делиберативных механизмов планирования вычислений и других механизмов ([6], [13] и др.).

Целью настоящей статьи является разработка архитектур и моделей принятия решений, которые позволят командам агентов решать сложные поведенческие задачи в реальном времени. В статье рассмотрена обобщенная модель управления командной работой, раскрыт предлагаемый подход к обеспечению командной работы в условиях временных ограничений, представлена реализующая данный подход модель агента-футболиста, обеспечивающая симуляцию командной игры, а также кратко описана модель агента-пилота, которая может обеспечить командную работу группы беспилотных летательных аппаратов.

2. УПРАВЛЕНИЕ КОМАНДНОЙ РАБОТОЙ

Команда агентов должна обеспечивать достижение общих целей в динамической внешней среде в присутствии шума и противодействия со стороны соперника. Командная работа есть нечто большее, чем просто скоординированное множество индивидуальных действий отдельных агентов. Принято говорить, что в командной работе агенты “сотрудничают”. Сотрудничество есть специальный вид скоординированной деятельности агентов, в которой они совместно решают некоторую задачу для достижения общей цели. Основной вопрос при организации командной работы агентов состоит в том, каким образом можно обеспечить работу агентов как единой команды в ситуации, когда каждый из агентов реализует собственные намерения с помощью индивидуальных действий, исполняемых параллельно или последовательно с действиями других агентов.

Настоящая работа базируется на идеях, изложенных в работе [18]. Предполагается, что командная работа агентов организуется (рис.1) с помощью общего (группового) плана действий, особенности которого заключаются в следующем: (1) групповой план действий требует, чтобы команда агентов пришла к согласию выполнять предписание (множество заданных инструкций); (2) агенты должны принять на себя обязательства по отношению не только к своим индивидуальным действиям, но также к действиям других агентов и действиям группы в целом; (3) план групповой деятельности может иметь в качестве компонентов как планы индивидуальных агентов для назначенных действий, так и планы подгрупп; (4) при выполнении командной работы агенты команды должны с помощью коммуникаций прийти к согласию с предписанием, а также согласовать собственные намерения друг с другом (рис.1).

Каждый агент команды должен иметь механизм для принятия решений о том, кто именно будет выполнять отдельные действия (рис.2). Агент может иметь два вида планов: полный общий план и частичный общий план.

Полный общий план детально описывает все аспекты последовательности совместных действий команды агентов, что включает совместные убеждения агентов команды и общее согласие команды выполнять совместные действия согласно некоторому исчерпывающе описанному предписанию. Это предписание содержит в себе описание множества отдельных действий и множества условий их выполнения. Полный общий план должен описывать все множество взаимосвязанных намерений и убеждений агентов, вовлеченных в команду.

Однако на практике команда не имеет полного общего плана, а располагает только частичным общим планом, который представляет собой только некоторый “срез” ментального состояния команды в частной ситуации, возникающей в процессе командной работы.

В рамках общего плана агенты могут иметь план подгруппы, в которой они должны тесно взаимодействовать при выполнении запланированной последовательности действий, а также собственные индивидуальные планы. Коммуникации агентов имеют целью восполнить условия полного общего плана. В процессе коммуникации групповые намерения согласуются с групповыми убеждениями, в результате чего вырабатывается согласие выполнять предписание по планируемой последовательности действий группы агентов. Кроме того, согласуются индивидуальные намерения и убеждения агентов подгрупп, в результате чего вырабатывается согласие выполнять предписанное агенту действие из планируемой последовательности.

Существенное влияние на качество командной работы оказывает тип и архитектура реализуемых агентов. Предполагается, что агенты могут быть гетерогенными и иметь реактивную, делиберативную или когнитивную архитектуру. Реактивные агенты реализуют командную работу в соответствии с набором правил, определяющих текущее взаимодействие агентов по типу “стимул-реакция”. Делиберативные или разумные агенты используют модель мира в символьной форме и принимают координированные решения о действиях на основе формальных рассуждений. Когнитивные агенты являются интеллектуальными агентами, построенными как когнитивные системы, имеющие нервно-системную организацию структур, функций и поведения [16]. Они решают задачи координации и выбора поведения с использованием когнитивных структур, которые способны обучаться и принимать решения ассоциативно.