КОМАНДНАЯ РАБОТА АГЕНТОВ
В РЕАЛЬНОМ ВРЕМЕНИ
И. В. Котенко, Л. А. Станкевич
В статье рассматриваются вопросы управления работой команды интеллектуальных агентов. Определяются обобщенные модели командной работы. Предлагается подход к обеспечению работы команды агентов в условиях временных ограничений (в реальном времени), основанный на комбинировании моделей приближенных вычислений и anytime-алгоритмов. Описываются примеры моделей построения команд агентов, реализующих данный подход, для двух приложений: симуляционного футбола роботов и моделирования боевых действий, реализуемых группой беспилотных летательных аппаратов.
1. ВВЕДЕНИЕ
Командная
работа агентов актуальна для множества приложений (программные поисковые агенты
в сети Интернет, управление коллективом совместно работающих мобильных
объектов, компьютерное моделирование различных форм боевых действий, футбол
роботов и т.д.).
Согласно современным представлениям, управление командной работой должно выполняться распределенными иерархическими системами с развитыми функциями координации и управления. Ключевой проблемой в таких системах является координация в реальном времени коллективного поведения членов команды, распределено решающих общую задачу. Специфика проблемы заключается в том, что агенты, составляющие команду, обладают общими и частными навыками и собственным поведением, неполными знаниями об окружающей среде и ограниченными ресурсами. При этом должны быть способны выполнить общую задачу посредством реализации индивидуальных задач и коммуникации. Каждый такой агент действует в динамически меняющейся среде, и его действия привязаны ко времени и пространству. Члены команды при выполнении запланированных операций могут объединяться в подгруппы и подчиняться лидеру (назначенному или выбранному). Они функционируют внутри антагонистической среды, которая может мешать их командным действиям.
Существует несколько подходов к описанию и формализации командной работы агентов [7]. Один их них, известный под названием “Теория общих намерений”, предложенный в работе [3], формулирует, в основном, общие рамки, определяющие командное поведение и характер взаимодействия членов команды. Второй, более формализованный подход, описанный в работе [8], известен под названием “Теория общих планов”. В работе [18] ключевые идеи обоих подходов обобщены, частично объединены и использованы при создании программного инструментария для разработки приложений в области командной работы агентов.
Одним из важнейших требований к
командной работе агентов является обеспечение гарантированного решения задач в
режиме реального времени (при временных ограничениях). Существующие подходы к
решению проблемы обеспечения временных ограничений основываются на применении
следующих архитектур:
(1)
реактивные архитектуры (называемые также рефлективными), в которых элементы
вывода построены в виде множества пар “стимул ® реакция” ([1], [4] и
др.);
(2)
архитектуры, базирующиеся на использовании нескольких асинхронно действующих
подсистем ([10], [15] и др.);
(3) простые
“делиберативные” архитектуры (например, как в системе PRS [12]), в которой механизмы поиска определенным образом ограничены для
обеспечения предсказуемости общего времени реакции (отклика) системы;
(4) более
сложные делиберативные архитектуры, основанные на использовании механизмов
приближенных вычислений [14], “гибких” вычислений [11], делиберативного
планирования вычислений [2], планирования вычислений “проектирование ко
времени” [5], планирования вычислений “проектирование по критериям” [19], контрактных anytime-алгоритмов ([20], [21] и др.) и прерываемых anytime-алгоритмов ([9] и др.), которые базируются на инкрементных методах улучшения
решения;
(5)
комбинированные архитектуры, построенные путем
интеграции
различных делиберативных механизмов планирования вычислений и других механизмов
([6], [13] и др.).
Целью настоящей статьи является разработка архитектур и моделей принятия решений, которые позволят командам агентов решать сложные поведенческие задачи в реальном времени. В статье рассмотрена обобщенная модель управления командной работой, раскрыт предлагаемый подход к обеспечению командной работы в условиях временных ограничений, представлена реализующая данный подход модель агента-футболиста, обеспечивающая симуляцию командной игры, а также кратко описана модель агента-пилота, которая может обеспечить командную работу группы беспилотных летательных аппаратов.
2. УПРАВЛЕНИЕ КОМАНДНОЙ РАБОТОЙ
Команда агентов должна обеспечивать достижение общих
целей в динамической внешней среде в присутствии шума и противодействия со
стороны соперника. Командная работа есть нечто большее, чем просто
скоординированное множество индивидуальных действий отдельных агентов. Принято
говорить, что в командной работе агенты “сотрудничают”. Сотрудничество есть
специальный вид скоординированной деятельности агентов, в которой они совместно
решают некоторую задачу для достижения общей цели. Основной вопрос при
организации командной работы агентов состоит в том, каким образом можно
обеспечить работу агентов как единой команды в ситуации, когда каждый из
агентов реализует собственные намерения с помощью индивидуальных действий,
исполняемых параллельно или последовательно с действиями других агентов.
Настоящая работа базируется на идеях, изложенных в работе [18]. Предполагается, что командная работа агентов организуется (рис.1) с помощью общего (группового) плана действий, особенности которого заключаются в следующем: (1) групповой план действий требует, чтобы команда агентов пришла к согласию выполнять предписание (множество заданных инструкций); (2) агенты должны принять на себя обязательства по отношению не только к своим индивидуальным действиям, но также к действиям других агентов и действиям группы в целом; (3) план групповой деятельности может иметь в качестве компонентов как планы индивидуальных агентов для назначенных действий, так и планы подгрупп; (4) при выполнении командной работы агенты команды должны с помощью коммуникаций прийти к согласию с предписанием, а также согласовать собственные намерения друг с другом (рис.1).
Каждый агент команды должен иметь механизм для принятия решений о том, кто именно будет выполнять отдельные действия (рис.2). Агент может иметь два вида планов: полный общий план и частичный общий план.
Полный общий план детально описывает все аспекты последовательности совместных действий команды агентов, что включает совместные убеждения агентов команды и общее согласие команды выполнять совместные действия согласно некоторому исчерпывающе описанному предписанию. Это предписание содержит в себе описание множества отдельных действий и множества условий их выполнения. Полный общий план должен описывать все множество взаимосвязанных намерений и убеждений агентов, вовлеченных в команду.
Однако на практике команда не имеет полного общего плана, а располагает только частичным общим планом, который представляет собой только некоторый “срез” ментального состояния команды в частной ситуации, возникающей в процессе командной работы.
В рамках общего плана агенты могут иметь план подгруппы, в которой они должны тесно взаимодействовать при выполнении запланированной последовательности действий, а также собственные индивидуальные планы. Коммуникации агентов имеют целью восполнить условия полного общего плана. В процессе коммуникации групповые намерения согласуются с групповыми убеждениями, в результате чего вырабатывается согласие выполнять предписание по планируемой последовательности действий группы агентов. Кроме того, согласуются индивидуальные намерения и убеждения агентов подгрупп, в результате чего вырабатывается согласие выполнять предписанное агенту действие из планируемой последовательности.
Существенное влияние на качество командной работы оказывает тип и архитектура реализуемых агентов. Предполагается, что агенты могут быть гетерогенными и иметь реактивную, делиберативную или когнитивную архитектуру. Реактивные агенты реализуют командную работу в соответствии с набором правил, определяющих текущее взаимодействие агентов по типу “стимул-реакция”. Делиберативные или разумные агенты используют модель мира в символьной форме и принимают координированные решения о действиях на основе формальных рассуждений. Когнитивные агенты являются интеллектуальными агентами, построенными как когнитивные системы, имеющие нервно-системную организацию структур, функций и поведения [16]. Они решают задачи координации и выбора поведения с использованием когнитивных структур, которые способны обучаться и принимать решения ассоциативно.