Глава 3. Модель функционирования распределенных вычислительных систем

Смелянский Р.Л. Анализ производительности распределенных микропроцессорных вычислительных систем на основе инварианта поведения программ. / Дисс. на соискание ученой степени доктора физико-математических наук. М.:МГУ, 1990. Глава, посвященная моделированию распределенных систем.

Глава 3. Модель функционирования распределенных вычислительных систем

3.1. Введение

Цель этой главы - построение математической модели динамики функционирования распределенных вычислительных систем. Под этими словами мы понимаем разработку согласованной системы математических понятий и взаимосвязей между ними, адекватно описывающих характерные особенности функционирования распределенных вычислительных систем (РВС). На качественном уровне эти особенности были рассмотрены в предыдущей главе, здесь мы их лишь перечислим:

отсутствие централизованного управления;
отсутствие единого времени;
наличие конфликтов и разделяемых ресурсов;
внутренний и внешний недетерминизм в поведении программы;
независимость поведения программы от времени;
наличие двух видов параллелизма.

Ни одна из известных на сегодня теорий Ч.Хоара[2], Р.Милнера[3], Г.Дегано и У.Монтанари[4], М.Найвта[5], Капитоновой Ю.В. и Летичевского А.А. [6], Миренкова Н.Н. [15] не охватывают все эти особенности. Упомянутые теории создавались прежде всего с целью построения математического аппарата для спецификации поведения программ и исследований их эквивалентных преобразований. В них либо не разделяют программу и физическую среду ее исполнения, либо физическая среда, а, следовательно, и время, как метрическая величина, отсутствует. Во всех указанных работах используется только одна семантика параллелизма - чередование. Наша цель - количественный и алгоритмический анализы распределенных вычислительных систем (подробно об этих видах анализа см.[7]). Предлагаемая ниже модель охватывает не только поведение программ, но и характеристики аппаратуры и того программного окружения, которое обеспечивает выполнение программы: она описывает влияние аппаратуры на динамику взаимодействия программ: содержит множественное время как количественную сущность: отражает иерархичность и структурность организации вычислительных систем.

Ее основу составляют три понятия: поведение - модель функционирования программного обеспечения: исполнитель - модель аппаратных средств: наблюдатель - исчисление, определяющее выбор конкретной истории из поведения программы на конкретном исполнителе при заданных исходных данных.

3.2. Основные представления

Динамику функционирования распределенной вычислительной системы определяет взаимодействие процессов прикладной программы с логической средой и исполнителем. Прообразом последнего является физическая среда. Схематично наше представление об этом взаимодействии можно описать так. Каждый последовательный процесс определяет логическую последовательность действий. Часть этих действий есть обращение к динамическим логическим ресурсам, а часть - к статическим. (Эти виды логических ресурсов, равно как и само понятие логического ресурса были введены в разделе 2.2.3.) Обращения к динамическим логическим ресурсам сопровождаются передачей сообщений надлежащего типа.

Сообщение суть совокупность параметров обращения. Тип сообщения - класс эквивалентности на множестве допустимых сообщений. Каждый динамический ресурс для нас есть процесс с известным поведением.

Передачу и управления и сообщения осуществляет нечто называемое последовательный наблюдатель. Это внешняя для процессов и исполнителя сущность. По отношению к нему мы определяем "степень прозрачности" процесса, эквивалентность процессов, типов сообщения и т.п.. Передача управления от процесса А к процессу В означает, что ресурсы исполнителя и логической среды начинает использовать процесс В. Исполнитель выполняет внутренние действия (те, что образуют статический логический ресурс), определенные процессом. Эти действия невидимы для наблюдателя. На временной оси исполнителя отмечаются события, соответствующие действиям процесса В. "Предельная" степень прозрачности процесса для наблюдателя - атомарные процессы, то есть те неделимые, элементарные действия, которые может выполнять исполнитель (прообраз атомарного процесса - команда процессора). Результатом выполнения этих действий с точки зрения наблюдателя является сообщение определенного типа и имя процесса (динамического логического ресурса), которому наблюдатель должен передать управление и это сообщение.

Передача управления может происходить по инициативе самого процесса, а может произойти в результате воздействия на исполнителя извне (прерывания), например, со стороны другого исполнителя под влиянием выполняемого на нем процесса. Одному исполнителю может быть сопоставлено несколько процессов. Их количество ограничено запоминающими способностями исполнителя, которые определяет его характеристика, соответствующая объему оперативной памяти.

Исполнители делятся на распределенные и последовательные. Последовательный исполнитель в одно и то же время может выполнять действия, запрошенные только одним последовательным процессом. Один последовательный исполнитель может в режиме разделения времени обслуживать несколько последовательных процессов.

Последовательные исполнители соединяются каналами связи. Эта совокупность образует распределенного исполнителя. Через каналы связи процессы, расположенные на разных исполнителях, могут обмениваться сообщениями. Эти каналы не являются исполнителями, так как не могут работать по самостоятельной программе. Единственное что они могут делать - это пропускать через себя без каких-либо изменений сообщения от одного исполнителя к другому, внося определенную временную задержку между моментами их отправления и моментами их получения. Величина этой задержки и объем единовременно передаваемой информации есть постоянные характеристики данного канала.

На одном исполнителе процессы могут выполняться как последовательно, так и параллельно. Дело в том, что слово "параллельно" часто трактуется в двух смыслах: в одно и тоже время, совместно: либо в смысле - независимо. В последнем случае неважно развиваются ли процессы в одно и то же время или нет.

Везде далее мы будем предполагать

Каждый последовательный исполнитель связан с определенным набором других последовательных исполнителей. Их набор ограничен, фиксирован и не изменяется в ходе работы прикладной программы.
Каждый последовательный процесс программы связан с определенными другими процессами. Их набор также фиксирован и не меняется со временем.
Атомарные процессы непрерываемы и могут выполняться только последовательно, то есть на одном и том же исполнителе, пока не закончился один атомарный процесс другой начаться не может.

Так кратко на содержательном уровне можно описать сущность рассматриваемого нами явления, математическую модель которого мы хотим построить в соответствии с концепциями, изложенными в разделе 2.4.5. "Основные требования к модели". Подчеркнем, что нам нужна модель не какой-то конкретной вычислительной системы, а модель класса систем, характеристики которого были сформулированы в разделе 1.2 "Формулировка задачи в общем случае".

3.3. Поведение

3.3.1. Понятие шага

Обозначим:

M_msg - конечное множество типов сообщений;

M_ps- конечное множество процессов наблюдаемых в системе, причем M_ps = M_le P и M_le P = Æ , где

M_le - множество процессов логической среды;

P - множество процессов программы.

Поведение процесса будем описывать как структуру над множеством шагов. Шаг s определим как выражение вида a -q ® b p,

где a ,b Î M_msg; pÎ M_ps,qÎ Q^* .. Он состоит из:

в о з д е й с т в и я - получения сообщения типа a и управления от другого процесса;

р е а к ц и и - посылки сообщения типа b и передачи управления процессу p:

т е л а - последовательности внутренних действий

q₁ ,q₂ ,...,q_n, множество которых обозначим через Q;

Q* - конечное замыкание Q, т.е. множество цепочек символов q_iÎQ конечной длины.

Итак, шаг есть элемент множества

S = M_msg ´ Q^* ´ (M_{msg ´}M_ps),

где ´ - декартово произведение.

В дальнейшем будем использовать следующие обозначения: S(P)× (S(p_i)) - множество шагов программы P(процесса p_i); infl(s), rpl(s), bod(s) - воздействие, реакция, внутренниe действия шага s соответственно.

Тело шага - величина, позволяющая определить время выполнения внутренних действий шага на конкретном исполнителе. Для этого зададим отображение тела на множество векторов трудоемкости (см. раздел 2.3.5) через однозначную вектор-функцию, которую назовем функцией трудоемкости (подробно о ней см. раздел 2.3.5):

сwm: : Q*→ {(n₁ ,n₂ ,...,n_k)_j},

где;(n ,n ,...,n_k) - вектор трудоемкости

n_i - количество выполнений i-го атомарного процесса исполнителем при реализации тела шага (подробно об атомарных процессах будет сказано в разделе "Исполнитель").

Считаем, что эта функция обладает следующими свойствами:

w(Æ )=(0,...,0) ,

где Æ - отсутствие внутренних действий, и

сwm(q₁, q₂ ,...,q_m )=сwm(q_i).

Для оценки времени на передачу сообщений между исполнителями введем такую характеристику сообщения как объем. Определим ее как однозначную функцию vlm на множестве типов сообщений с областью значений - целые числа, т.е.

vlm(x)=n, где xÎ M_msg, nÎ N.

Два шага s₁ и s₂ равны, если infl(s₁)=infl(s₂) и rpl(s₁)=rpl(s₂), (мы пока не требуем равенства сложности шагов).

Историей процесса p назовем не пустую конечную последовательность его шагов замкнутую слева, т.е.

если h(p)=s₁ ,s₂ ,...,s_k - история, то

" i: i£ k Þ s₁ , s₂ ,...,s_i -история.

Будем обозначать через |h(p)| число шагов в истории h(p) и назовем это число длиной истории h(p).

Две истории h₁(p) и h₂(p) равны если |h₁(p)|=|h₂(p)| и

" i: 1£ i£ |h(p)| Þ s_1,i = s_2,i , где s_i,j - i-й шаг j-го процесса.

Подысторией ^~h(p) назовем любой постфикс истории h(p).

Цепь - это любое подслово слова h(p).

3.3.2. Поведение процесса

Поведением процесса p назовем множество всевозможных историй этого процесса, которое мы будем обозначать bh(p). Исследуем структуру bh(p) с целью его описания. Для этого введем на множестве S (p) - множество шагов процесса и их последовательностей две операции ":" - следования и "+" - альтернативы.

Цепь l=l₁ ;l₂ есть цепь l такая, что |l|=|l₁|+|l₂| и l₁ - префикс, а l₂ - постфикс l, т.е. операция следования есть конкатенация цепей, рассматриваемых как последовательности символов в алфавите S(p). Выражение вида h(p)= h(p₁);~h(p₂) означает, что процесс p сначала ведет себя в соответствии с историей h(p₁), а затем - в соответствии с подысторией ~h(p₂). Нетрудно видеть, что ":" ассоциативна, но не коммутативна.

Выражение вида h₁(p)+h₂(p) описывает поведение процесса p, который может развиваться в соответствии либо с историей h₁(p), либо с историей h₂(p). Правило выбора конкретной истории эта операция не определяет. Свойства операции "+":

l₁ + l₂ = l₂ + l₁ ,
(l₁ + l₂ ) + l₃ = l₁ + (l₂ + l₃ ),
l₁ ; (l₂ + l₃ ) = l₁ ; l₂ + l₁ ; l₃ ,

т.е. это коммутативная, ассоциативная и дистрибутивная справа относительно ";" операция.

Везде далее выражение вида l₁ +l₂ +...+l_r будем кратко записывать в виде .

Теорема 1. " p: h(p) представима в виде h(p)=h₁(p);^~h(p), где h₁(p)Î bh(p).

Доказательство. Справедливость этого утверждения следует из замкнутости слева любой истории и свойств операции следования.

Теорема 2. Пусть bh'(p)={h_i'(p) | " i: h_i'(p)=h₀ ;^~h_i'(p)},

где ^~h_i'(p)Î ^~bh'(p) и ^~bh'(p) - множество подысторий историй из bh'(p).

Тогда представима bh'(p)=h₀;.

Доказательство. Для доказательства этого факта достаточно воспользоваться дистрибутивностью ":" относительно "+", согласно которой

но по условию

" i : h₀ ; ^~h_i(p)Î bh¢ _i(p).

Обозначим b*h₀(p)={h(p)|h(p)=h₀; ^~h(p), где h(p)Î bh(p)}.

Теорема 3. Для любого фиксированного h_0Îbh(p) представление b*h₀(p)Î bh(p) в виде

h₀ ;.

единственно с точностью до ассоциативной перестановки слагаемых.

Доказательство. Если предположить существование h"(p)Î b*h₀(p), но не представимого в указанном виде, то придем к противоречию.

Действительно,: в этом случае у h"(p) не будет префикса h₀ .

Следствие. Префикс h'(p) любой истории из bh(p) задает на bh(p) класс эквивалентности

b*h'(p) = {h(p)|h(p)=h'(p);~h(p)}.

Причем для " h'(p),h"(p) из bh(p) таких, что

h'(p)¹ h"(p) следует b*h'(p) b*h"(p) =Æ .

Введем однозначную процедуру построения по bh(p) некоторой структуры. Согласно теореме 3 поведение любого процесса представимо в виде

bh(p)=b*s_i (p).

Этому выражению сопоставим некоторое число вершин равное числу шагов s_i , с которых могут начинаться истории процесса p, и вершины · - фиктивная вершина, вводимая в интересах построения и называемая начальной. Соединим · с каждой вершиной s_iдугой, т.е. дуга (· ,s ) существует если s_i - префикс хотя бы одной истории из bh(p).

Далее " i: b*s_i = s_i

Сопоставим каждому из этих ˜b^*s_jмножество вершин и дуг, по выписанным выше правилам. В качестве начальной вершины возьмем вершину, помеченную соответствующим s_i, при построении на предыдущем шаге. Если s_i последний шаг истории, то добавляем к нему дугу вида (s_i ,J ), где J специальный символ, обозначающий окончание наблюдения истории.

Полученную в результате указанной процедуры структуру обозначим Tbh(p).

Теорема 4. Пусть bh(p) поведение процесса p.

Тогда Tbh(p) - дерево, между множеством путей которого и множеством историй из bh(p) существует взаимно однозначное соответствие.

Доказательство. Наше доказательство построим из двух частей:

сначала докажем, что Tbh(p) - дерево;
затем покажем, что " L:LÎ Tbh(p)Þ $ !h(p)Î bh(p), где L - путь в Tbh(p).

Это и даст справедливость сделанного утверждения.

1. Докажем что Tbh(p) - дерево. Для этого достаточно доказать, что два пути L₁ ,L₂ Î Tbh(p), с одинаковыми начальной и конечной вершинами, совпадают. Этого достаточно в силу справедливости следующего утверждения [16];

граф T - дерево тогда и только тогда, когда любые L₁ и L₂пути в нем, имеющие общие начальную и конечную вершины, совпадают (L₁ =L₂ ).

Индукцией по длине путей L₁ и L₂ можно показать, что если на каком-то шаге индукции предположить несовпадение вершин в L₁и L₂ , то, согласно выше изложенной процедуре построения, не совпадут их концевые вершины.

2. Взаимная однозначность между Tbh(p) и bh(p) следует из построения Tbh(p) и доказательства свойства (1). Итак, bh(p) представимо в виде дерева, которое впредь будем обозначать Tbh(p):

Tbh(p)=(V,S(p),lp(v),Ebh(p)), где

V - множество вершин;

S(p) - множество шагов процесса p;

lp(v):V ® S(p) функция разметки;

Еbh(p) - множество дуг.

(Везде далее под словом "шаг" мы будем понимать размеченную вершину этого дерева.) Иногда нам будет удобно представлять каждый шаг в виде упорядоченной пары вершин, соединенных дугой: первая вершина представляет воздействие, вторая - реакцию.

Одной из основных особенностей поведения параллельных программ является недетерминизм. Мы выделили два его вида: внутренний и внешний (подробнее см.[1] и раздел 2.2.3). Будем говорить что выражение s_i + s_j описывает внешний недетерминизм, если infl(s_i)¹ infl(s_j), и внутрениий - если infl(s_i)=infl (s_j), но rpl(s_i)¹ rpl(s_j). Это определение недетерминизма позволяет оценить его количественно.

Скажем, что процесс p₁ более недетерминирован, чем p₂если их поведения таковы, что: " i:˜ b*s_{1i Í}˜b*s_2i, где s_1i Î S(p₁ ) и s_2i Î S(p₂ ).

3.3.3. Поведение программы

Определим поведение программы как множество поведений процессов, ее образующих:

Bh(P) =.

Структура Bh(P) - это лес из деревьев Tbh(p), который мы будем обозначать FBh(P). Множество шагов S(P) в поведении Bh(P) частично упорядоченно. Это отношение отражает взаимодействия между процессами и порядок следования шагов в истории каждого процесса. Рассмотрим это отношение подробнее, поскольку оно описывает причинно-следственные связи на множестве действий программы. От него зависит семантика параллелизма.

Обозначим

R_L (p) ={(s_i, s_j)| s_{i ,} s_{j Î}h(p) & h(p) = h΄(p); s_{i
:}s_j: ~_;h(p) }.;

s_j назовем причиной, а s_j - следствием.

Это отношение определяет причинно-следственные связи на S(p), где pÎ P.

Будем писать s_k*s_i, если (s_k, s_i)Î R*_L(p), где R*_L(p) - транзитивное замыкание R_L(p), т.е. существует множество

и .и s _m1= s _k

Теперь распространим отношение R_L(p) на случай событий. Событие - это либо воздействие, либо реакция. Обозначать событие будем буквой e с надлежащим индексом. По определению:

e_ie_j Û $ s_k : (e_i =infl(s_k) e × e_j =rpl(s_k) либо

$ s_l : e_i Î s_k e e_j Î s_l e (s_k ,s_l )Î R_L(p).

Выражения вида e_i =infl(s), e_j =rpl(s) означают, что эти события соответствуют воздействию, реакции соответственно.

Для описания взаимодействия между процессами введем вспомогательное отношение на множестве шагов программы

R~(P)={(s_i,s_j )|s_i Î S(p) & s_{j Î}S(q) &pÎ P&qÎ P Þ infl(s_j ). q=rpl(s_i )}.

Взаимодействие между процессами определим через отношение R f (P):

R f (P)= { (s_i,s_j)} если

$ h(p₁), $ h(p₂):s_iÎh(p₁)e s_jÎh(p₂)e rpl(s_i)=p₂. infl(s_j);
$ s_kÎh(p₁), $ s_qÎh(p₂): s_k*s_i e (s_k ~ s_q V s_q ~ s_k )

e (s_i ~ s_j V s_j ~ s_i) e s_j*s_q}

т.е. реакция на шаге s_i в поведении процесса p₁ есть обращение к шагу s_j в поведении процесса p₂ (смысл пункта 2 разъясним чуть позже.).

Если (s_i,s_j) Î R f (P), то этот факт будем записывать в форме s_i, f s_j .

Отношение Rf (P) несимметрично, иррефлексивно.

По аналогии с ранее сделанным, распространим отношение R f (P) на случай событий:

e_i f e_j Û $ s_k , $ s_m : (s_k , s_m )Î R f (P) e e_i Î s_k e e_j Î s_m .

Это отношение обозначим Re f (P).

Обозначим R® (P) = Rf (P) È {R_L(p_i)}_{piÎ P}. Не трудно показать,что это отношение несимметрично, иррефлексивно. Теперь разъясним п. 2 в определении отношения Rf (P); благодаря этому ограничению, отношение R® (P)P) не содержит "зацикливающих" связей вида а) и б) из рисунка 3.1.

рис 3.1

Историей выполнения программы H(P) назовем тройку

H(P)=({h(p_i)}_{piÎ
P}, {a _i }, Rf (P)),

т.е. это совокупность историй процессов - {h(p_i)}_{piÎ P}, удовлетворяющих отношению Rf (P);{a _i} - начальные воздействия, которые определяют первые шаги в тех процессах, с которых начинается выполнение программы.

3.3.4. Взаимосвязь логической среды и программы

Рассмотрим различия в описаниях поведений процессов логической среды и программы.

В поведении прикладных процессов по аналогии с [2] вместо некоторого шага может быть указано имя прикладного процесса. Это означает, что процесс, начиная с этого места, ведет себя также как тот, чье имя указано. (Так можно описывать процесс с "рекурсивным поведением").
Процессы прикладной программы представлены в поведениях процессов из логической среды с помощью переменных с именами специального вида, которые могут встречаться в реакциях шагов, и которые мы будем обозначать dm_i , а их множество Dm. Множество значений dm_i - множество S(p) надлежащего p. Реакция, в которой указано dm_i означает передачу управления прикладному процессу, сопоставленному этому имени. Соответствие между именами из Dm и процессами из P устанавливает взаимнооднозначное отображение Shd: P ® Dm. Здесь мы предполагаем, что Shd от времени не зависит. Однако, наделяя Shd различными свойствами, например, введя зависимость от времени, можно описывать динамику порождения и уничтожения процессов.
Считаем, что множества Dm и M_le фиксированы. Ясно, что введение Dm ограничивает множество допустимых к рассмотрению программ, а именно: |Dm|³ |P|. Везде далее мы предполагаем, что программы отвечают этому ограничению.
В логической среде есть процесс с именем Stop, обращение к которому означает завершение и остановку того процесса, который к нему обратился. В реакциях шагов, вместо имени процесса, может встречаться имя предопределенной переменной back, которую можно представлять себе как вершину стека. Множество ее значений -

{s.p_i | sÎ bh(p_i)}_pi.Î P

Для работы с ней есть две функции put - запомнить и get - выдать значение.

3.3.5. Виды параллелизма и их семантика

Для описания ранее введенных двух видов параллелизма введем две операции композиции процессов: p₁ ^~p₂ - совместно независимое выполнение; p₁||p₂ - истинно параллельное выполнение. Есть два основных способа описания параллелизма: недетерминированное чередование (interleaving) и частичное упорядочение. Первый часто используется при описании семантики языков программирования, например, CSP [9],CCS [3], COSY [10], семантики описания операторов работы с разделяемыми переменными [11]. Последний чаще используется в теории сетей [12,13].

Для совместного независимого исполнения процессов будем использовать семантику чередования (interleaving). Это означает, что события, определяемые h(p₁) и h(p₂) образуют цепочку, в которой они не имеют предпочтения в порядке следования между собой. Ограничения на чередование определяет некоторое отношение независимости, задаваемое на S(P). Такая семантика учитывает единство временной оси исполнителя. Это выражается в том, что все события, происходящие на данном исполнителе, собираются в цепочку.

Семантику истинно параллельного выполнения процессов будем описывать отношением частичного порядка на множестве их событий. Запись p₁||p₂ означает, что цепочка событий, определяемая историей h(p₁), появляется между точками взаимодействия отдельно и независимо от цепочки, определяемой историей h(p₂). Естественно возникает вопрос о взаимосвязях этих видов описания параллелизма и особенно их эквивалентности, который мы рассмотрим в разделе 3.5.4.

3.4. Исполнитель

3.4.1. Последовательный исполнитель

Определим последовательный исполнитель как:

SEx = < (M_prim,v_t(a)), C(e), (Stg(p),N), Cr, F >,

где (M_prim,v_t(a)) - набор атомарных процессов;

C(e) - функция времени;

(Stg(p),N) - память;

Cr - носитель;

F - арбитр.

v_t(a):M_prim

Ниже дано подробное и строгое определение этих понятий.

Атомарные процессы. M_prim - множество атомарных процессов. Атомарный процесс - это частичное отображение Mmsg ® Mmsg. v_t(a)- функция, определяющая время выполнения атомарного процесса a. Она определена на M_prim, с областью значений - целые числа. Целое число обозначает количество так'ов - единиц времени по часам SEx. v_t(a) задана в виде вектора, который будем называть вектором технической производительности данного исполнителя).

Основные свойства атомарных процессов таковы:

" a_i :$ a :$ !b : a_iÎM_prim & a ,b Î M_msg Þ a(a )=b .

Для любого a_iÎM_prim определено множество входных типов сообщений и множество сообщений-результатов. Между ними a_i определяет однозначное соответствие. Недетерминизма на уровне исполнителя нет.

" a_i:$ K: a_iÎM_prim & КÎ N & K>1 Þ v_t(a_i)<K.

Время выполнения любого a_iÎM_prim конечно, постоянно и равно vt(a_i).

Выполнение атомарного процесса не прерываемо, т.е. начавшись, атомарный процесс не может быть приостановлен и будет закончен через v_t(a_i) так'ов. Иными словами, исполнитель становится не восприимчивым к внешним воздействиям на период выполнения атомарного процесса.
Поведение атомарного процесса a_i описывает дерево вида

Напомним, что переменная back представляет имя процесса , инициировавшего этот атомарный процесс. Это означает, что после выполнения атомарный процесс всегда возвращает управление тому процессу, который инициировал его выполнение, если ему на вход поступило сообщение допустимого типа

У атомарного процесса моменты передачи сообщения-результата и момент возврата управления совпадают: если управление передано, то сообщение - доступно.

Свойства функции C(e). Эта функция сопоставляет событию количество так'ов, наступивших к моменту его возникновения на данном исполнителе. Моментом наступления события считается время начала выполнения первого атомарного процесса надлежащего действия. Функция C(e) определена на множестве всех событий в процессах, приписанных данному исполнителю. Область ее значений - множество натуральных чисел.

Будем писать e_i*e_j,если (e_i ,e_j ) Î R^*_L(p),где R^*_L(p) -транзитивное замыкание R_L(p).

Постулируем свойства функции C(e):

П1: " e_i,e_j:e_i,e_j Î bh(p_m) & e_i* e_j Þ C(e_i )<C(e_j ),

т.е. в одном процессе причина наступает всегда раньше следствия.

П2: " e_i,e_j:e_{i Î}S(p_k)&e_j Î S(p_m) & e_i f e_j & p_k~p_m Þ C(e_i)<C(e_j),

т.е. если причина и следствие принадлежат разным процессам и эти процессы исполняют на одном и том же исполнителе, то по часам этого исполнителя причина наступит всегда раньше следствия.

Следствия:

Между двумя последовательными событиями одного процесса (между причиной и следствием) всегда проходит хотя бы одна единица времени.
" e_i,e_j:e_i,e_j Î S(p) e_i*× e_j Þ C(e_i)<C(e_j);

Любой процесс исполняется последовательно.
" e_j : e₀,e_j Î S(p) & e₀ *× e_j Þ C(e₀)<C(e_j);

Обращение к процессу всегда наступает раньше (по часам данного исполнителя), чем возникнет какое-либо событие в этом процессе.
" e_i ,e_j : e_i Î S(p_k) & e_j Î S(p_m) & p_k ⌡ p_m Þ C(e_i)<C(e_j) Ú C(e_i)>C(e_j);

Все процессы на одном исполнителе выполняются последовательно.
" e_i,e_j:(e_i,e_j)Î R*f (P)&e_i Î p_k & e_j Î p_m & p_k~p_mÞC(e_i)<C(e_j),

где R*f (P) - транзитивное замыкание Rf (P). Если два события, связанные причинно-следственной связью, принадлежат разным процессам, исполняемым одним и тем же исполнителем, то причина всегда наступает по часам этого исполнителя раньше следствия.

Теорема 5. C(e) не нарушает отношения причинно-следственности на множестве процессов, исполняемых одним исполнителем:

(e_i,e_j)Î R® (P) Þ C(e_i)<C(e_j)

где e_i - причина; e_j - следствие.

Доказательство. Справедливость этого утверждения следует из того факта, что функия C(e) монотонная. В свою очередь этот факт есть тривиальное следствие п.п.1-5.

Обозначим t - переменную на Â , значение которой равно значению астрономического времени, ход которого можно определить с помощью астрономических наблюдений. Это феномен, который никоим образом не зависит от свойств вычислительной системы, но который важен для ее пользователей.

Расширим область определения функции C(e), а именно обозначим C(t) - количество так'ов наступивших к моменту t. При этом постулируем следующее свойство C(t):

П3: $ r," t," D :r,t,D Î R &0<D <rÞ C(t+r) - C(t)=1& C(t+D )-C(t)=0,

т.е. часы "тикают" с постоянной скоростью r. На практике r флюктуирует. Поэтому ослабим постулат П3:

П3': $ r': $ e :" D :" r: e ,r,r'>0 & 0<D <(r'-e ) & r'-e <r<r'+e Þ

C(t+D )-C(t)=0 e C(t+r)-C(t)=1.

Теперь обеспечить однозначность показаний часов в различных экспериментах мы можем лишь в течении определенного периода наблюдений d t, такого что |[d t/(r-e )]|=|[d t/(r+e )]|, где |[ . . . ]| - взятие целой части. Отсюда, зная r и e , можно вычислить d t, либо, зная необходимый d t, - определить характеристики часов.

Память. Набор (Stg(p),N,R) определяет объем памяти, регистровую и стековую структуру исполнителя:

Stg(p) - это функция, определенная на множестве процессов M_ps с областью значений целые числа (т.е. количество единиц памяти, необходимое для хранения процесса p);

N - максимальное количество единиц памяти у данного исполнителя. На данном исполнителе может выполняться такое множество процессов Mps', чтобы

В предельном случае N>max{Stg(a_i)}, где a_iÎMprim, т.е. исполнитель способен хранить только одну команду с операндами.

R - набор параметров, характеризующий регистровую и стековую структуры исполнителя. Этот набор был подробно рассмотрен в разделе 2.3.5, поэтому мы его здесь обсуждать не станем.

Cr - носитель. Понятие носителя является основным средством для описания структуры исполнителя. Носитель последовательного исполнителя (или просто последовательный носитель) будем обозначать SCr. По определению:

SCr = <Ent, s _n , Ext, x _k >,

где: Ent - множество полюсов, которые будем называть входами;

s _n - разметка входов: однозначное отображение [1,n]`→Ent, где [1,n]Ì N;

Ext - множество полюсов, называемых выходами; Ent Ç Ext = Æ .

x _k -разметка выходов: однозначное отображение Ext® [1,k], где [1,k]Ì N.

По определению считаем, что SCr₁ =SCr₂ Û

Ent₁ =Ent₂ ;
Ext₁ =Ext₂ ;
s _n1 =s _n2 ;
x _k1 =x _k2 .

Полюса ext_i Î Ext обеспечивают передачу воздействий на процессы, размещенные на других исполнителях. Каждому ext_i заранее сопоставлен атомарный процесс (обозначим его p_ext_i ). Длительность срабатывания ext_i полагаем равной v_t(p_ext_i). С каждым ext_i связана функция

c _i(n): N® {0,1}; c _i(n)=1 если nÎ [C(t₀),C(t₀)+vt(p_ext_i)],

в противном случае - 0. Здесь C(t₀)= C(e_*), где e_* - воздействие на p_ext_i .

Назовем ее характеристической. Если c _i(n)=1, то будем говорить, что соответствующий выход возбужден. Один ext может быть соединен с несколькими entr_j своего либо других исполнителей. Всем этим entr_j одновременно будет передано одно и то же сообщение. Время достижения сообщением надлежащего entr_j определяют характеристики соответствующей связи. (Способ ее задания будет определен позднее.) Объем и тип сообщения, единовременно передаваемого за одно обращение к ext_i , определяет атомарный процесс p_ext_i.

Каждому entr можно сопоставить (способ сопоставления будет уточнен позднее) только один выход своего либо другого исполнителя; и один процесс из Mps, управление которому будет передано, если данный entr возбужден и он выиграл арбитраж. Вход возбужден если c _i(n)=1 у выхода, связанного с этим входом.

Арбитр F - однозначный функционал, описывающий арбитраж на входах последовательного исполнителя. Область определения F - C(t) данного исполнителя и множество характеристических функций выходов, связанных с его входами; область значений - имена процессов, сопоставленных входам. По истечении vt(a_i),т.е. времени реализации очередного а процесса, на данном исполнителе, F выбирает один из возбужденных в этот момент входов. Если время возбуждения выхода, возбудившего этот вход исполнителя, не истекло раньше, чем завершилось выполнение очередного а процесса. Этот вход и будет определять внешнее воздействие на исполнитель.

3.4.2. Распределенный исполнитель

DEx = < {SEx_i}, DCr, W > - распределенный исполнитель, где

{SExi} - множество последовательных исполнителей;

DCr - распределенный носитель;

W - поток.

Распределенный носитель DCr - это гиперграф, множество вершин которого образуют подмножества полюсов носителей SCr_i, входящих в состав SEx_i , образующих данный DEx_i:

DCr = < { SCr_i }, E, s _n, x _j >,

где {SCr_i} - множество последовательных носителей, которое обозначим V. По существу, множество V:

V = È {Ext_i È Ent_i | Ext_i Î SCr_i & Ent_{i Î}SCr_i }.

E - множество дуг, которые мы будем обозначать Arc:

E = { Arc_j | Arc_j Î V & " j:$ !extÎ Arc_j },

т.е. дугу в нашем гиперграфе образует множество полюсов, среди которых есть только один полюс типа выход.

s _n - функция разметки входов DCr: ent - вход в DCr если

$ SCr_j : SCr_j Î DCr Þ " Arc:ent Ï Arc & entÎ Ent_j & Ent_j Î SCr_j ;

т.е. это один из входов SCr, не использованных в дугах DCr. Заметим, что теперь мы не требуем однозначности s _n , но полагаем, что она имеет обратную функцию, которая однозначна.

Причем:

" i: Ø $ SCr: SCrÎ DCr & s (i)=ent_k & s (i)=ent_n & ent_k , ent_nÎSCr ,

т.е. в точках неоднозначности s (i) не может иметь значений в Ent одного итого же SCr.

x _j - однозначная функция разметки выходов DCr: ext_j - выход DCr, если

$ SCr_j : ext_j Î Ext_j & Ext_j Î SCr_j Þ " Arc: ext_j Ï Arc ,

т.е. это один из выходов SCr, не использованный в дугах DCr. x _j такова, что

" k: Ø $ i: i¹ k e x _j (ext_k)= x _j (ext_i) e ext_k Î SCr₁ e ext_i Î SCr₂,

т.е. на выходах разных SCr x _jобязательно имеет разные значения.

Поток W - это отображение множества дуг из DCr на множество пар вида (v,wd), где v - время передачи одного блока (в тактах источника); wd - размер блока (одновременно передаваемых данных) в битах. Пару (v,wd) будем называть задержкой. Считаем, что сопоставленный возбужденному и выигравшему арбитраж входу, получит сообщение через тактов. Отметим, что мы считаем здесь v постоянной. Однако, определив ее как функцию, например, от числа активных входов и выходов, времени и т.п., мы сможем описывать достаточно "тонкие" случаи из практики, например, мультиплексирование.

3.4.3. Алгебра носителей

Определение распределенного исполнителя из предыдущего раздела не дает конструктивного правила для описания его структуры и манипулирования ею. С этой целью построим алгебру носителей. Обозначим Ì Â множество носителей:

Ì Â = Ñ Ì Â È S Ì Â ,

где: S Ì r - множество последовательных носителей;

Ñ Ì Â - множество распределенных носителей;

Будем обозначать:

S Ì Â (m,n) - множество последовательных носителей, имеющих не более n-входов и m-выходов (далее мы не всегда будем указывать n и m).

SCr(i,j) - последовательный носитель с i входами и j выходами. Последовательный носитель вида SCr(1,1) будем обозначать Plug.

Будем говорить, что DCr₁ = DCr₂ , если

" SCr_1,i : SCr_1,i Î DCr₁ Þ $ SCr_2,j :SCr_2,j Î DCr₂ e SCr_1,i = SCr_2,j;
E₁=E₂ ;
n₁=n₂ ;
j₁=j₂ ;

т.е. равенство с точностью до изоморфизма.

Определим на Ñ Ì Â операции объединения, слияния входов, композиции и замыкания носителей. Везде далее считаем заданными носители Cr₁ =(V₁ ,E₁ , s _n1 , x _k1 ) и Cr₂ =(V₂ ,E₂ , s _n2 , x _k2 ) и Cr₁, Cr₂ Î Ì Â .

Oбъединение носителей. Объединением Cr₁и Cr₂- " Cr₁+Cr₂ " будем называть носитель Cr₃ = (V₃ ,E₃ , s _n3 , x _k3 )Î Ñ Ì Â _n, такой что:

V₃ = V₁ È V₂ ;
E₃ = E₁ È E₂ ;
n₃ = n₁ +n₂ ;
k₃ = k₁ +k₂;

Графически эту операцию иллюстрирует рис.3.2. Обозначать ее будем знаком "+".

Рис. 3.2

Теорема 6. Если Cr_{1Î å Ì}r и Cr_{2Î å Ì}r, то Cr_{3Î Ñ Ì}r.

Доказательство. Справедливость этого утверждения следует из определения распределенного исполнителя.

Теорема 7. Операция объединения ассоциативна и коммутативна. Доказательство. Это так в силу определения равенства распределенных носителей и определения операции объединения носителей.

W(Plug)=(v,wd)_i , если PlugÎ Arc_i.

Слияние входов носителей. (Oграничение |Ent₁|=|Ent₂|) Результат операции слияния входов "Cr₁ #Cr₂ " есть

носитель Cr₃ =(V₃ ,E₃ , s _n3 , x _k3 )Î Ñ Ì Â такой, что:

V₃ = Ent È {Ext₁ È Ext₂ };

E₃ = E₁ È E₂ ;

s _n3(i) = s _n1(i) e s _n2(i);

Рис. 3.3

Суть этой операции в том, что входы Cr₁ отождествляют с входами Cr₂ , тем самым в Cr₃ допустима операция типа broadcasting, т.е. возбуждение "композиционного" входа передается как Cr₁, так и Cr₂ . Графически эту операцию иллюстрирует рис.3.3.

Теорема 8. Если Cr_{1Î å Ì}r и Cr_{2Î å Ì}r, то Cr₃= Cr₁ #Cr₂ Î Ñ Ì r.

Доказательство. Это утверждение является простым следствием определения операции слияния входов носителей и определения распределенного исполнителя.

Теорема 9. Операция слияния ассоциативна и коммутативна. Доказательство. Это утверждение также есть простое следствие из определений равенства распределенных носителей и операции слияния входов.

Композиция носителей. Результат операции композиции "Cr₁ * Cr₂ " есть носитель Cr₃ = (V₃ ,E₃ , s _n3 , x _k3 )Î Ñ Ì r, такой, что:

Ent₃=Ent₁ ;

Ext₃=Ext₂ ;

s _n3=s _n1 (n1=n3) ;

x _k3=x _k2 (k2=k3) ;

E₃ = E₁ È E₂ È (x _k1 (1), s _n2(1)) È ... È (x _k1(k1), s _n2 (k1)), где k1=n2.

Эта операция определена только для тех операндов, у которых число выходов первого равно числу входов второго. Графически эту операцию иллюстрирует рис.3.4.

Рис. 3.4

Теорема 10. Если Cr_{1Î
Ì}r и Cr_{2Î Ì}r, то Cr₃= Cr₁ * Cr₂ Î Ñ Ì r.

Доказательство. Аналогично доказательству теорем 8,9.

Теорема 11. Операция композиции ассоциативна и не коммутативна.

Доказательство. Не коммутативность этой операции следует из несимметричности вхождения ее операндов в ее определение.

Замыкание носителя. Обозначим g(i) целочисленнозначную частичную функцию с областью определения DgÍ {1,...,k} и с областью значений ImgÍ {1,...,n}. Замыканием Cr₁ по g(i) назовем носитель

Cr₂ =[Cr₁]g(i) = (V₂ ,E₂ , s _n2 , x _k2), такой что:

Ext₂=Ext₁\{ext_i | x _k1(ext_i)Î Dg};

Ent₂=Ent₁\{ent_i | ent_i = s (m), где mÎ Img};

E₂ =E₁ È {( ext_i, s _n1 (g(x _k1(ext_i))) | ext_i: x _k1(ext_i)Î Dg};

s _n2(i)=s _n1(j), где j>i e " k:j>k>i Þ kÎ Img, jÎ Img, n2=n1-|Img|;

x _k2 определяется аналогично, т.е. происходит перенумерация с уплотнением: отбрасываются замкнутые входы и выходы. Графически эту операцию иллюстрирует рис.3.5.

Теорема 13. Если Cr_{1Î
å Ì}r то Cr₂ = [Cr₁]g(i)Î å Ì r;

Если Cr_{1Î Ñ Ì}r то Cr₂= [Cr₁]g(i)Î Ñ Ì r.

Доказательство. Эта теорема прямое следствие определения последовательных и распределенных носителей и операции замыкания.

Рис. 3.5

3.4.4. Свойства алгебры носителей

Из определений носителя и операций объединения, слияния, композиции и замыкания следует, что структура < Ì Â , +, #, *, [ ] > - частичная алгебра.

Теорема 14. При любых фиксированных m и n для любого носителя из Ñ Ì Â существует разложение на последовательные носители из å Ì Â с помощью операций объединения, слияния, композиции и замыкания.

Доказательство. Возьмем произвольный носитель

Cr = (V ,E , s _n , x _k )Î Ñ Ì r,

так как для носителей из å Ì r эта теорема есть тавтология. Доказывать существование разложения мы будем по следующей схеме: глядя на Cr, построим по строго определенным правилам носитель DCr₀ ; для DCr₀ докажем его равенство Cr. В силу произвольности Cr мы сможем утверждать существование разложения по указанным правилам для любого носителя из Ñ Ì r .

Построим DCr' = å SCr_i = (V` ,E` , s _n` , x _k` )такой,

SCr_i DCr

что E'¹ Æ , V'=V. Такой носитель построить можно по определению множества Ì r и операции объединения носителей.
Построим носитель PLUG по следующему правилу:

Для каждой Arc_i Î E построим носитель, который обозначим Plug_i(j) вида:

Plug_i(j)= Plug₁#Plug₂#...#Plug_j, где j=|Arc_i |;

Объединим все Plug_i(j), полученный носитель обозначим PLUG, то есть:

PLUG = å Plug_i(j).

Arc_iÎE

Из построения носителей DCr' и PLUG следует:

|Ext'|=|Ent"| ,

где Ent" - множество входов PLUG;

Еxt' - множество выходов DCr';

|Ext"|=|Ent'| ,

где Ext" - множество выходов PLUG;

Еxt' - множество входов DCr'.

Следовательно, и к DCr" и к PLUG применима операция композиции. Построим DCr":

DCr"=DCr'*PLUG.
Построим однозначную, целочисленную функцию g(i) (подстановку) по следующему правилу:

D_g = {1,...,|Ext"|}; Im = Ds _n' ;
значения этой функции определяются следующим:

" i: iD_g e x "(ext)=i Þ (s '(g(i)),ext)Î Arc.

Так как |Ent"|>1 и |Ext"|>1, то к DCr" применима операция замыкания. Построим:

DCr₀ = [DCr"]g(i),

где i пробегает все значения из Dg.

DCr₀ = (V₀ ,E₀ , s _n0 , x _k0), из построения DCr₀ следует n₀ =n, k₀ =k.

Поэтому можем определить s _n0 и x _k0 так, что:

s _n0 = s _n ; и x _k0 = x _k .

Теперь переходим к доказательству того, что DCr₀=Cr.

Согласно определению для этого надо доказать что:

V₀=V;
E₀=E; и n₀=n и k₀=k. Мы докажем более сильное утверждение, а именно что
s _n0 = s _n;
x _k0 = x _k .

Пункты (3),(4) - истины по построению. (1) - истино в силу пункта 1. (2) - истино в силу пунктов 2 и 4. Действительно, предположим, что в E: $ i:(ext,ent)Î Arc_i , но (ext,ent)Ï E₀ . Однако, это противоречит 2.1.

Итак, " Cr: CrÎ Ñ Ì r может быть представлен в форме

Cr =[ (å SCr_i ) * (å # Plug_i(j))]_g ,

SCr_i Cr SCr_i Cr j |Arc |

где Arc_iÌEÎ Cr. (Доказательство окончено.)

Эта теорема гарантирует нам выразимость структуры любого исполнителя из Ñ Ì Â в виде алгебраического выражения над å Ì Â . Доопределим понятие исполнителя на случай алгебраического описания его структуры. Основную проблему доопределения представляет переопределение потока W на случай носителей типа Plug, а не дуг Arc. Напомним, что W определена на множестве E - дуг гиперграфа DCr. Напомним: эта функция каждой дуге сопоставляет задержку - пару (v,wd). Переопределим W на случай носителя Plug следующим образом:

Будем говорить, что

PlugÎ Arc_i , если его выход ext' замкнута; вход entr', такой, что пара (ext',entr')Î Arc_i.

Теперь постулируем свойство функции C_i(e) на случай распределенного исполнителя:

П4: " C_i(e): C_i(e)Î SEx_i Î DEx Þ C_i(t₀+v) - C_i(t₀)³ 1 ,

где t₀ - момент астрономического времени начала передачи единичного блока (момент начала передачи - возврат управления от процесса сопоставленного ext); время передачи сообщения длины l равно (l/wd)v.

3.5. Функционирование распределенной вычислительной системы

Функционирование распределенной вычислительной системы мы будем понимать как интерпретацию поведения программ, как прикладных, так и логической среды на конкретном исполнителе, т.е. как построение истории программы по поведению программы, поведению логической среды, исполнителю и начальному воздействию.

3.5.1. Связь логической среды и исполнителя

Связь логической среды с исполнителем будем задавать с помощью отображения:

Bind: LE Ext È Entr È {SEx_i} ,

где LE={bh(p)|pÎ Mle};

{SEx_i}Î DEx.

Ext_i = {ext_i |$ SEx: SExÎ DEx e ext_i Î SEx};

Entr={ext_j |$ SEx: SExÎ DEx e ext_j Î SEx}.

Свойства отображения Bind:

одному входу - один процесс;
нет двух или более исполнителей, которым приписан процесс с одним и тем же именем;
если p q и $ s_iÎbh(p), $ s_jÎbh(q): (s_i,s_j)Î R f (P)Þ

Bind(p)=ext₁ e Bind(q)=entr₂ e $ Arc:(ext₁ ,entr₂ )Î Arc.

Если два процесса взаимодействуют непосредственно и связаны отношением истинного параллелизма, то Bind их сопоставляет разным последовательным исполнителям, связанным по входу и выходу, причем так, что процесс, инициирующий взаимодействие, сопоставляется входу, а другой процесс - надлежащему выходу.

Bind не меняется в течении всего периода наблюдения.

3.5.2. Наблюдатель

Теперь мы можем дать математическое определение понятиям вычислительной системы и вычислительной среды. Вычислительной системой назовем тройку:

CS = <Bh(P),Shd,CE>

где: Bh(P) - поведение программы (см.раздел 3.3.3);

Shd - функция распределения процессов программы в логической среде: взаимно-однозначное отображение P ` Dm, свойства которого были указанны в разделе 3.3.4;

CE - вычислительная среда:

CE = <LE,Bind,DEx>,

где: LE - поведение процессов логической среды

(см.раздел 3.3.3);

Bind - привязка процессов логической среды к исполнителю

(см.раздел 3.5.1);

DEx - распределенный исполнитель

(см.раздел 3.4.2).

Свойства всех этих объектов были определены.

Исполнение программы P на CS есть исчисление, которое будем называть распределенным наблюдателем. Зададим его в виде набора идентичных алгоритмов и правил взаимодействия между ними. Эти алгоритмы будем называть последовательными наблюдателями (или просто наблюдателями если это не вызывает неоднозначности). Каждый из этих алгоритмов определяет выбор очередного шага из поведений процессов прикладной программы и логической среды, надлежащего последовательного исполнителя. Каждому последовательному исполнителю сопоставлен свой последовательный наблюдатель.

Последовательный наблюдатель, сопоставленный последовательному исполнителю SEx_i , будем обозначать Obs_i . По существу каждое Obs_i задает частичное отображение:

Mmsg ´ Mps ´ F _i ` S,

которое можно описать так:

Obs_i (s* , F _i ) = s,

где sÎ bh(p) и s, p определяются следующими условиями:

Если F _i ¹ 0, то p=Bind^-1(F _i) e sÎ bh(Bind^-1(F _i)),

т.е. выбираем шаг из процесса, сопоставленного возбужденному входу, выигравшему арбитраж. Этот шаг соответствует воздействию, поступившему на вход F _i . Если таких шагов несколько, то выбор случаен. При этом, если

p*Î Mle, то put(p*. s* ); если p* Î Mpr, то dm_j := p* . s* ,

где p* =Shd^-1(dm_j ), и put(dm_j ).

Если F _i = 0, то

если dm_k Î rpl(s*), то p=Shd^-1(dm_k) и выбирается шаг, следующий за указанным в dm_k и воздействие на котором соответствует rpl(s*) (если таких шагов несколько, то выбор случаен).
если backÎ rpl(s*), то p=get(back) и выбирается шаг, следующий за указанным в back и воздействие на котором соответствует rpl(s*) (если таких шагов несколько, то выбор случаен).
если pÎ rpl(s*), то sÎ bh(p) (выбираем текущий шаг процесса p, по значению переменной p и воздействие у которого соответствует реакции rpl(s*), если таких шагов несколько, то выбор случаен) и back:= p*. s* , где s*Î bh(p*).
если rpl(s*) содержит обращение к атомарному процессу, то сообщение в rpl(s*) преобразуется согласно определению этого атомарного процесса и следующим будет выбран шаг, следующий за s* в поведении того процесса, которому принадлежит данный s*.
если в выбранном процессе нет шага с воздействием, соответствующим rpl(s*), то работа данного Obs_i блокируется.

Текущим значением p* становится s*.

3.5.3. Свойства наблюдателя

Исследуем свойства наблюдателя с целью обоснования его корректности. Под корректностью наблюдателя мы будем понимать то, что та совокупность цепочек шагов, которую будут порождать {Obs_i}, будет историей программы, т.е. удовлетворять отношению R® (P)=R f (P) È RL(P).

Пусть S*(P) - множество цепочек в алфавите S(P) и wÎ S*(P). Обозначим [w]p_i , где p_i Î P, последовательность только тех шагов из w, которые принадлежат S(p_i), и в том порядке, в каком они расположены в w; т.е. [w] p_i Î S*(p_i). Назовем [w]p_i - проекцией w на p_i .

Для обоснования корректности наблюдателя надо доказать,что " i: p_iÎP, " j:Obs_j порождает:

цепочку шагов, в которой не нарушены ни RL(p_i) (причинно-следственные связи на bh(p_i) ), ни R f (P) (причинно-следственные связи между процессами), т.е. w удовлетворяет R® (P), и " p_i , $ h(p_i):[w]p_i=h(p_i), где w - цепочка шагов, получаемая при интерпретации. Таким образом, это будет означать, что Obs_i корректно воспроизводит параллельное выполнение процессов в форме чередования:p₁~p₂ .
если процессы прикладной программы P распределены между двумя и более последовательными исполнителями SEx_i , то совокупности цепочек {w_k}, порождаемых надлежащими Obs_i , обладают тем свойством, что

" p_i: p_iÎP, $ w_k: [w_k]p_i =h(p_i) e ({w_k} удовлетворяют R f (P) ),

т.е. множество Obs_i корректно воспроизводит истинный параллелизм: p_i p_j .

3.5.4. Взаимосвязь двух видов параллелизма

Для обоснования корректности наблюдателя нам надо разобраться во взаимосвязи двух видов параллелизма: чередования и истинного. Первый строится на основе отношения независимости: шаги разных процессов могут чередоваться, если они удовлетворяют отношению независимости. Основу второго составляет отношение частичного-порядка на множестве шагов процессов, которое определяет упорядоченность шагов как внутри процессов, так и при межпроцессных взаимодействиях. Все шаги, которые несравнимы в этом отношении, считаются одновременными, а, стало быть, параллельными. Обозначим: R*® (P) - транзитивное замыкание R® (P);

^R*® (P) - симметричное замыкание R*® (P), т.е.

" a,bÎ S(P):(a,b)Î R*® (P) Þ (b,a)Î ^R*® (P) e (a,b) )Î ^R*® (P)

B = ^R*® (P) È diag(S(P)),

где diag(S(P))={(a,a)|aÎ S(P)} - диагональ в S(P)´ S(P). Это отношение назовем отношением связанности. Будем говорить, что a и b связаны, если (a,b)Î B.

I = S(P)´ S(P)\B - отошение независимости.

Лемма. B - рефлексивно и симметрично;

I - иррефлексивно и симметрично.

Доказательство. B симметрично так как ^R*® (P) симмметрично и ^R*® (P)Ì B.

B рефлексивно так как diag(S(P))Ì B.

I симметрично так как если (a,b)Î I, но (b,a)Ï I, то следовательно (b,a)Î R*® (P). Отсюда получаем, что (a,b)Î B, но I Ç B = Æ . Пришли к противоречию.

I иррефлексивно по определению, так как diag(S(P))Ì B.

Теорема 15. " a,b: (a,b)Î I Þ в FBh(P) нет пути из a в b (напомним,что FBh(P) - лес из Tbh(p_i) по всем p_i из P).

Доказательство. " a,b: (a,b)Î I Þ (a,b)Ï R*® (P), но по построению R*® (P) содержит все пути из FBh(P).

Тройку <S,I,B> назовем опорной структурой и будeм обозначать • = <S,I,B>. Для сравнения цепочек из шагов, образованных параллельным выполнением нескольких процессов в форме чередования, введем отношение, которое будем обозначать R » (• ).

Пусть • - опорная структура. По определению считаем, что

(w,u)Î R» (• ) Û w=u, либо

$ w₁,w_2ÎS*(P), $ a,b:(a,b)Î I( ) e [w=w₁abw₂ e u=w₁baw₂].

т.е. две цепочки удовлетворяют R » (• ), если одна может быть получена из другой допустимой перестановкой соседних символов. Перестановка допустима, если эти соседние символы удовлетворяют отношению I.

Обозначим R@ ( ) - минимальное транзитивное замыкание R» (• ), т.е. если (w,u)Î R@ ( ), то u может быть получено из w конечной последовательностью перестановок независимых символов, т.е. символов, удовлетворяющих отношению I.

Теорема 16. R@ ( ) - отношение эквивалентности на S*(P).

Доказательство. Для доказательства этого утверждения надо показать, что R@ ( ) - рефлексивно, симметрично и транзитивно.

Оно рефлексивно, так как " u:uÎ S*(P) по определению (u,u)Î R Rf (” ) Þ (u,u)Î R@ ( ).
Оно симметрично, так как " u,w: (u,w) Î R@ ( ) Þ $ a,b:a,bÎ S(P) e (a,b)Î I Þ (b,a)Î I Þ (w,u)Î R@ ( ).
Оно транзитивно по определению.

Пусть wÎ S*(P). Обозначим класс эквивалентности на S*(P), содержащий w,: Tr(w)={w_i|w_iÎS*(P) e (w_i, w)Î R@ ( )}.

Будем говорить, что w - представитель Tr(w) Û wÎ Tr(w).

Поясним введенные выше понятия на примере. Пусть даны:

S={a,b,c,f,k,g};

B={(a,k),(a,f),(a,g),(b,c),(c,g),(b,k)} È diag(S);

I={(a,b),(a,c),(f,b),(f,c),(g,b),(c,k),(f,g),(f,k),(g,k)}.

Тогда:

(abgc,agbc), (fcak,fakc), (gbfac,bgcfa) Î R@ ( );

Tr(gbfac)={gbfac;gfbac;gfbca;gbfca;gbcfa;bgcfa;bgfca}.

Теорема 17. Пусть “ - опорная структура, тогда:

" w,u:wÎ S* , uÎ S* e (w,u)Î R@ ( ) Þ |w|=|u|;
" w₁ ,w₂ ,u₁ ,u₂ : w₁ ,w₂ , u₁ ,u₂ Î S* e [(w₁ ,w₂)Î R@ ( ) e (u₁ ,u₂) Î R@ ( )] Þ (w₁ u₁, w₂ u₂ ) Î R@ ( ),

где wu - конкатенация строк w и u.

Доказательство.

Если предположить что |w| ¹ |u|, то из этого предположения будет следовать, что число символов в этих строках различно. Следовательно u нельзя получить из w только перестановкой независимых символов, а поэтому (w,u)Î R@ ( ) не может быть, что противоречит исходной посылке.
Возьмем строку w₁ u₁ , так как $ w₂: w₁=w₂ Þ есть последовательность допустимых перестановок, преобразующая w₁ в w₂ , следовательно w₁ u₁ = w₂ u₁. Рассуждая аналогично, можно показать что w₂ u₁ = w₂ u₂, что в силу транзитивности отношения R@ влечет w₁ u₁ = w₂ u₂. (Доказательство закончено.)

Каждая строка wÎ S* может быть охарактеризована ориентированным, размеченным ациклическим графом. Идея его построения заключается в следующем: возьмем число вершин по числу символов в w и расположим их в том порядке, в каком они встречаются при движении вдоль w слева направо. Две вершины мы будем соединять дугой тогда и только тогда, когда они удовлетворяют отношению R® (P), т.е. ориентированному подмножеству B.

Пусть “ =(S,I,B) - опорная структура и wÎ S*. Характеристическим графом для w назовем

Г“ (w)=({1...n},E,S,l),

где l: {1...n} ` S;

E={(i,j)|1£ i, j£ n e i<j e l(i)=s_i e l(j)=s_{j
e}(s_i ,s_j )Î R® (P)}.

Теорема 18. Пусть ” - опорная структура и w,uÎ S* . Tr(w)=Tr(u) Û Гš (w) и Г— (u) изоморфны.

Прежде чем приступить к доказательству этой теоремы разъясним ее важность для нас. Эта теорема определяет взаимосвязь между строками, эквивалентными в смысле некоторого отношения независимости, и совокупностью строк {[Tr(w)]p_i}, связанных определенным отношением частичного порядка R® (P). Она утверждает, что если отношения независимости и частичного порядка связаны так, как это было сделано выше, то для сравнения структур из строк нам не надо предварительно преобразовывать чередованием каждую структуру в одну строку, а затем сравнивать строки между собой. Достаточно убедиться в том, что частичные порядки, которые отражают причинно-следственные связи в этих структурах, изоморфны. В этом случае и сами структуры и получаемые из них строки будут эквивалентны. Отсюда следует, что для установления взаимосвязи двух видов параллелизма надо рассмотреть то, как соответствующее исчисление сохраняет отношения частичного порядка на множестве S(P) шагов программы.

Доказательство.

Пусть Tr(w)=Tr(u), докажем что в этом случае Г“ (w) и Г“ (u) изоморфны. Из посылки теоремы следует существование конечной допустимой перестановки символов в w, в результате которой w преобразуется в u. В следствии этого и теоремы о том, что если (w,u)Î R@ ( ), то |w|=|u| следует, что существует такая перенумерация вершин в Г“ (w), в результате которой Г“ (w) становится конгруэнтным Г“ (u). Эта перенумерация определяет изоморфизм между Г“ (w) и Г“ (u). Существование такой перенумерации влечет существование изоморфизма между Г“ (w) и Г“ (u).
Пусть теперь Г“ (w) изоморфен Г“ (u), докажем что в этом случае (w,u)Î R@ ( ), а следовательно Tr(w)=Tr(u). Изоморфизм графов Г“ (w) и Г“ (u) означает существование такой перенумерации j вершин графа, в результате которой структуры их становятся конгруэнтными, а разметки + удовлетворяют соотношению lw(i)=lu(j (i)). Отсюда следует, что если переставить симовлы в строке w в соответствии с перестановкой (j (1),j (2),...,j (n)), то получим строку u. (Доказательство закончено.)

Для обоснования корректности наблюдателя надо доказать, что " i: Obs_i не нарушает отношения R® (P). Отсюда, как следствие теоремы 10, будет следовать, что для любых Shd и Bind множество {Obs_i} порождает корректную историю программы.

Теорема 19. " i: Obs_i сохраняет R® (P) (т.е. Obs_i реализует изотонное отображение).

Доказательство. Обозначим Trc_i - цепочку шагов, полученных в ходе интерпретации Obs_i за период наблюдения. Тогда [Trc_i]_pj - проекция Trc_i на j-ый процесс.

Докажем что " p: [Trc_i]_{p P} (bh(p), то есть Obs_i не нарушает R`(p). Предположим, что [Trc]_p Ï bh(p). Это возможно в двух p случаях:

$ s:sÎ [Trc_i]_{p e}sÏ S(p);
$ s_i ,s_i+1 :( s_i , s_i+1)Î [Trc_i]_p, но (s_i , s_i+1)Ï R`(p).

Рассмотрим первый случай. Он возможен, когда среди S(p) нет шага либо с infl(s), либо с rpl(s). Если допустить, что среди S(p) нет шага с infl(s), то согласно алгоритму, определяющему Obs_i, такое воздействие должно вызвать остановку интерпретации. Поэтому никакого Trc_i мы бы не получили. Случай существования rpl(s), не принадлежащего S(p), не возможен по определению Obs_j : интерпретируются шаги только из bh(p). Теперь разберем случай (2). Раз (s_i , s_i+1)Ï R`(p) Þ либо (s_i , s_i+1)Î R f (P), либо (s_i , s_i+1)Î I - но ни в первом, ни во втором случаях эта пара не может принадлежать [Trc_i]_p. В первом случае потому, что из определения R0(P) следует; s mS(p); во-втором: потому, что согласно теореме о взаимосвязи отношения I и леса FBh(P), нет пути в FBh(P) между s_i и s_i+1. Поэтому этот случай так же не возможен.

Теперь докажем, что Obs_j не нарушает R f (P). Рассмотрим [Trc_i]_pk,pm. Пусть $ s_q ,s_j Î [Trc_i]_pk,pmтакие, что s_qÎS(p_k), s_jÎS(p_m), но (s_q ,s_j)Ï R f (P) , (где s_q s_j - цепочка из двух символов). Здесь возможны случаи: (s_q,s_j)Î I, либо (s_j,s_q)Î R f (P)и (s_q,s_j)Î {^R* (P)\R* (P)}.

В первом случае мы можем переставить эти шаги. Такие перестановки мы сможем делать до тех пор пока либо не кончится цепочка шагов, что будет означать отсутствие взаимодействия между p_k и p_m , либо пока не встретим шаг s' такой, что (s',s_j )Ï I. Это означает, что s' либо из S(p_k), который в паре с s_j принадлежит R f (P), что дает нам доказываемое утверждение, либо s'Î S(p_m ), то есть (s',s_j) Î R (p_m). Это значит, что на данном локальном участке не было взаимодействия, что в силу произвольности выбора пары (s_q,s_j) фактически означает отсутствие взаимодействия между p_k и p_m.

Случай s_q,s_j Î [Trc_i]_pk`,pm` но (s_j,s_q)Î R f (P) означает следующее. Если рассматривать FBh(P), как неориентированную структуру, то в ней есть путь из s_q в s_j. Причем на этом пути есть хотя бы одна дуга, вдоль которой мы должны пройти в направлении противоположном ее ориентации, то есть нарушить причинно-следственную связь между шагами. Это противоречит процедуре, определяющей отображение Obs_i , так как в ней везде указан переход от причины к следствию. Таким образом мы опять пришли к противоречию, что означает справедливость доказываемого утверждения. Итак, корректность Obs_i гарантирует нам сохранение всех причинно-следственных связей в программе вне зависимости от используемого вида параллелизма. Использование исчисления, определяемого Obs_i, в инструментальной вычислительной среде гарантирует нам независимость получаемых результатов анализа от степени параллелизма, используемого в этой среде.

3.5.5. Недетерминизм поведения распределенных программ

В главе 2 был дан качественный анализ особенностей поведения распределенных программ. Основной особенностью, определяющей сложность анализа поведения программ, был назван недетерминизм. Там же были выделены две его формы; внешний и внутренний (см. раздел 2.2.4), дана классификация поведений программ и сформулированы в форме гипотез некоторые утверждения о связях различных форм недетерминизма и поведений программ различных классов (см.раздел 2.2.5).

Цель данного раздела дать математическое определение разным формам недетерминизма, в терминах этих определений сформулировать и доказать высказанные ранее утверждения о связях разных форм недетерминизма с разными классами поведения программ. (Способы описания разных форм недетерминизма были даны в разделе 3.3.2.)

Будем рассматривать дерево поведения программы Tbh(p) в ярусной форме. В обозначении шага будем использовать два нижних индекса; первый - номер яруса, на котором расположен шаг, второй - номер этого шага на ярусе.

Разделим множество сообщений на подмножества двух типов: множество сообщений-данных - ; и множество синхро-сообщений - . Сообщения-данные - это элементы множества , которые процесс использует исключительно как данные и не использует для целей синхронизации. Это означает, что если воздействие на шаге принадлежит множеству , то реакция этого шага не зависит от того, с какой скоростью развивались вычисления в других процессах, когда формировалось это воздействие. Под синхронизацией мы понимаем ограничения на порядок выполнения процессов программы. Множество синхро-сообщений - это подмножество , элементы которого процесс использует в msg целях синхронизации.

Будем говорить, что в bh(p) есть внутренний недетерминизм, если:

$ s_j,k ,s_j,m Î S(p): расположенные на одном и том же ярусе j и имеющие общего предшественника на ярусе j-1;
infl(s_j,k)=infl(s_j,m) и infl(s_j,k),infl(s_j,m)Î ;
rpl(s_j,k) ¹ rpl(s_j,m ).

Внутренний недетерминизм в поведении процесса описывает только влияние данных, полученных в других процессах, на последовательность вычислений в данном процессе. При этом, то от какого конкретного процесса получены эти данные, на эту последовательность вычислений влияния не оказывает. Другими словами, выбор одного из шагов s_j,k , s_j,m не зависит от скорости продвижения вычислений в других процессах. Будем говорить, что в bh(p) есть сильный внешний недетерминизм, если:

$ s_j,k ,s_j,m Î S(p) и расположенные на одном и том же ярусе j, и имеющие общего предшественника на ярусе j-1;
infl(s_j,k) ¹ infl(s_j,m) и infl(s_j,k),infl(s_j,m)Î ;
rpl(s_j,k) ¹ rpl(s_j,m).

Слабым внешним недетерминизмом назовем случай, который возникает если в определении сильного внешнего недетерминизма заменить п.3 на

rpl(s_j,k) = rpl(s_j,m).

Слабый внешний недетерминизм позволяет описывать стационарное поведение программ (см.раздел 2.2.5).

Отметим особо, что эти определения охватывают также и тот случай, когда одно и тоже сообщение процесс использует и как сообщение-данные и как синхро-сообщение. Этот случай мы будем относить к внешнему недетерминизму в силу доводов, представленных в разделе 2.2.5. (Именно наличие внешнего недетерминизма указывает на существование зависимости поведения программы от вычислительной среды.)

Скажем, что Bh(P) соответствует LE если:

множество процессов, указанных в реакциях шагов из S(P) есть подмножество M_LE ;
сообщения, указанные в rpl(s) где sÎ S(P), является приемлемыми воздействиями для шагов в поведениях процессов из M_LE ;
воздействия на процессы из P, указанные в реакциях шагов процессов из M_LE , являются приемлемыми для процессов из P.

Воздействие a приемлемо для bh(p) если $ sÎ S(p): infl(s)=a .

Теорема 20. Если " pÎ P: bh(p) обладает только внутренним недетерминизмом, то " LE, которой Bh(P) будет соответствовать, при фиксированном начальном воздействии на P, H(P) будет постоянной.

Доказательство. Возьмем LE₁ и LE₂ , которым соответствует Bh(P). Зададим начальное воздействие {a _i}. Пусть мы получим в LE₁ историю H₁(P), а в LE₂ - H₂(P). Надо доказать что H₁(P)= H₂(P). В силу произвольности выбора {a _i}, LE₁ и LE₂ это и будет служить доказательством утверждения теоремы.

Допустим, что утверждение теоремы не верно. Следовательно, для некоторого pÎ P: h₁(p)¹ h₂(p). Это значит, что существует r: s_r,h1 ¹ s_r,h2 , но " i:1£ i<r Þ s_r,h1 = s_r,h2 . Такой случай может возникнуть, если воздействия в Tbh(p) на r-ом ярусе в LE₁ и LE₂ были разные. Для того чтобы bh(p) на r-ом ярусе были приемлемы разные воздействия необходимо в силу определения внутреннего недетерминизма, чтобы шаги s_i,h1 и s_i,h2 имели разных предшественников на ярусе r-1. В этом случае в H₁(P) и в H₂(P) должны не совпадать и s_r-1,h1 ¹ s_r-1,h2. Пришли к противоречию.

В разделе 2.2.5 было высказано в форме гипотезы утверждение о взаимосвязи внешнего недетерминизма и нестационарности поведения программ. Напомним, что нестационарным мы назвали поведение процесса, зависящее от скорости вычислений в других процессах. Конкретизируя эту формулировку в терминах введенных понятий, мы можем сказать, что эта зависимость проявляется в том, что в Tbh(p) некоторые шаги будут иметь несколько преемников с разными воздействиями и разными реакциями. Эти воздействия принадлежат и инициируют их разные процессы. Только что сказанное ничто иное, как переформулировка определения сильного внешнего недетерминизма, которая была дана выше. Таким образом, справедлива следующая теорема:

Теорема 21. Если в поведении bh(p) процесса p есть зависимость от скорости вычислений в других процессах pÎ P, то в этом bh(p) есть сильный внешний недетерминизм. Заметим, что обратное утверждение не верно. А именно, если в bh(p) есть сильный внешний недетерминизм, то он может возникать из-за чувствительности поведения bh(p) к разным наборам данных, особенностям поведений процессов из LE.

Итак, наша теория охватывает все, известные нами из практики, особенности в поведении распределенных программ, позволяет описывать математически корректно, согласовано как качественно, так и количественно структуры и функции аппаратуры и программ распределенных вычислительных систем. Теперь мы можем перейти к математической постановке задачи и ее решению.

3.6. Построение временного профиля

В разделе 1.1 мы сделали заключение о том, что все известные виды производительности могут быть получены на основе временной диаграммы работы вычислительной системы. (То как это делать мы подробно рассмотрим в разделе 3.7.) Поэтому, заключили мы там, нашей целью является получение временной диаграммы работы системы. Эту диаграмму мы будем описывать с помощью временного профиля.

Временным профилем работы вычислительной системы CS назовем вектор-функцию

G(t) = (g₁(t), g₂(t),...,g_n(t)),

где " i: 1£ i£ n и g_i(t) - временной профиль последовательного исполнителя SEx_iÎCE.

Временным профилем последовательного исполнителя SEx_i назовем однозначную функцию g_i(t), определенную на R, с областью значений - множество кортежей вида

<p, s, q, a_i >

где, pÎ P, sÎ S(p), qÎ cx(s), a_iÎw(q_i).

В терминах введенных понятий нашу основную задачу из раздела 1.2 можно сформулировать так: пусть задана вычислительная система

CS = <Bh(P), Shd, CE>.

Требуется найти временной профиль G(t) системы CS. Задача построения G(t) разбивается на две:

Для каждого SEx_i определить последовательность выполняемых им действий;
Для каждого действия определить время, необходимое данному SEx_i на его выполнение.

3.6.1. Определение последовательности действий и времени их выполнения

Последовательность действий для SEx_i на уровне шагов i процессов определяет последовательный наблюдатель Obs_i . Каждый шаг состоит их последовательности действий q=cx(s), а каждое действие q_iÎcx(s) есть последовательность атомарных процессов, множество которых определяет функция сложности w(q_i)=(n₁ ,n₂ ,...,n_k ).

Предположим на время, что нам известна упорядоченность набора w(q_i). (Позднее мы вернемся к этой задаче определения упорядочения набора действий, в том числе и атомарных процессов.) С использованием этого предположения для построения g_i(t) достаточно модифицировать интерпретацию Obs_i следующим образом: Obs_i анализирует состояние Ф_i не между шагами sÎ S(P), а после выполнения каждого атомарного процесса текущего шага. При наличии возбуждения входа (Ф_i ¹ 0) в dm_i и back запоминается имя процесса, шаг, выполняемое q_i и цепочку невыполненных атомарных процессов. Значением g_i(t) в течении vt(a_i) тактов полагаем равным имени текущего процесса, шага, внутреннего действия q_i и атомарного процесса a_i . Таким образом, g_i(t) - это есть значение Obs_i в момент t. Напомним, что в течении vt(a_i) тактов , где a_i - атомарный процесс SEx_i не реагирует на внешние воздействия и не может выполнять других действий.

Эта модификация не нарушает логической корректности Obs_i . Это действительно так, поскольку она сводиться к замене в определении Obs_i шагов sÎ S(P) на атомарные процессы, которые также можно рассматривать как шаги.

3.6.2. Упорядоченность действий

Здесь мы рассмотрим задачу об упорядочении действий, задаваемых вектором трудоемкости (n₁ , . . . ,n_k ). Один из способов решения этой задачи уже был дан в разделе 2.2.6. Предложенное там решение опиралось на технику генерации кода и определенную модель вычислителя. Оно годится для случая, когда упорядочиваемыми действиями являются атомарные процессы, а вычислитель соответствует модели. Однако представляется полезным уметь упорядочивать не только атомарные, но и более сложные действия, когда достаточных сведений о вычислителе еще нет. (Такие ситуации достаточно часто возникают при проектировании вычислительных систем.) Здесь мы рассмотрим именно этот случай задачи об упорядочении действий.

Пусть нам задан набор действий в виде вектора (n₁ , . . . ,n_k ), которые должны быть выполнены. Здесь n_i - число действий i-го типа. Время выполнения действия каждого типа известно. По существу это вектор трудоемкости для случая не атомарных действий. Известно, что эти действия будут выполнены в определенном порядке, который заранее нам не известен. Назовем для определенности это упорядочение натуральным.

Надо так упорядочить эти действия, чтобы окончание j-го действия при нашем упорядочении, как можно меньше отклонялось от момента окончания j-го действия при натуральном упорядочении, которое может быть получено, например, с помощью генератора кода транслятора. Назовем это упорядочение искусственным.

В математическом виде нашу задачу можно переформулировать так:

дано: множество {l₁ , l₂ , ... ,l_k } из соизмеримых отрезков k видов (вид отрезка определяет его длина). Это множество упорядочено так, что

" i,j: 1£ i<j£ k Þ l_i £ l_j и l_i Î N.

Набор L=(n₁ , . . . ,n_k) из этих отрезков, в котором n_j отрезков j-го вида. Отрезки из L расположены вдоль прямой в стык друг к другу.

Обозначим Y_i точку на прямой, в которую попадает правый конец i-го по порядку отрезка (отрезки пронумерованы слева направо) при натуральном упорядочении. Это размещение нам не известно.

требуется: так разместить отрезки из набора L вдоль прямой, чтобы правый конец i-го отрезка, обозначим X_i точку на прямой, в которую он попадает, как можно меньше отклонялся от Y_i (размещаем и нумеруем отрезки слева направо).

Предполагаем, что натуральное размещение становиться нам известно, только после того, как построено искусственное.

Обозначим f_i(x), где xÎ R функционал вида

f_i(x) = Еr (x,Y_i |x_i-1 =X_i-1 , x_i-2 =X_i-2 ,...,x₁=X₁)= _låL P(x= X_i-1+l | x_i-1=X_i-1 , x_i-2 =X_i-2 ,..., x₁ =X₁ ) r (x, Y_i),

где r (x,y) - метрика, P(x=X | x_i-1=X_i-1 , ... ) - условная вероятность.

С помощью функционала f(x) критерий оптиммзации в нашей задаче можно сформулировать так:

" i: iÎ [1...N-1], где , надо выбрать X_i*Î L* так, чтобы

X_i*= argminf_i(X), где XÎ L*,

где L* множество отрезков, построенных из отрезков из L.

Нашу задачу рассмотрим для r (x,y) вида:

r (x,y) = |x-y|a .

Согласно [17] наиболее распространенными вариантами этой метрики являются:

a =1, т.е. f_i(x)=Е|X-Y_i|;
a =2, т.е. f_i(x)=Е|X-Y_i|²;
a =0, т.е. f_i(x)=

Е|X-Y_i|a .

Минимум в каждом из этих трех случаев достигается в следующих точках [17]:

a =1 - argmin Е|X- Y_i|=med X, где XÎ L* ;
a =2 - argmin Е|X- Y_i|²=ЕX, где XÎ L* ;
a =0 - argmin

Е|X- Y_i|²=mod X, где XÎ L, и a =0.

Теперь рассмотрим подробно выбор отрезков в каждом из этих трех случаев и оценим ошибку в каждом из них.

3.6.2.1. Случай a =1

По определению

med X = inf {a | P(X ³ a)³ e P(X £ a) ³ }.

Найдем med X₁ . Распределение случайной величины ( везде далее просто с.в.) X₁ известно, а именно:

P(X =l₁)=n₁/N, ... , P(X =l_i)=n_i/N, ...,

где и P(X₁=l_i)=1.

Тогда med X₁=l_j1 , где j1= min {j | 1 £ j £ k и }.

Оценим ошибку на первом шаге:

Е|Y₁ - l_j1 | = P(Y₁ =l_i , X₁=l_j1) |l_i - l_j1 | =

= P(Y₁ =l_i | X₁ =l_j1 ) P(X₁ =l_j1 ) | l_i - l_j1 | =

= P(Y₁ =l_i | X₁ =l_j1 ) | l_i - l_j1 | =

= | ,

где D max = max | l_i - l_j |.

l_{i ,}l_jL

Найдем выражение для X₂ :

med X=l_j2 , где XÎ L₂ =L\l_j1 ;

j₂ = min {j|1£ j£ k и P(X₂ =l_i | X₁ =l_j`1 ) ³ },

где P(X₂ =l_i | X₁ = l_j`1 )= + (1 ± sign(i-j1)) .

Оценим ошибку на этом шаге:

Е(|Y₂ - l_j2 | |X₁ =medX) = P(Y₂ = l_i , X₂ =l_j2 |X₁ =l_j1 ) |l_i - l_j2 |.

P(Y₂ = l_i | X₂ =l_j2 , X₁ =l_j1 ) P(X₂ =l_j2 |X₁ =l_j1 ) | l_i - l_j2 | =

= P(Y₂ = l_i , X₂ =l_j2 |X₁ =l_j1 ) .

По аналогии с предыдущим найдем выражение для X₃=l_j3 :

j₃ = min {j | 1 £ j £ k и P(X₃ =l_i | X₂ =l_j`2 ) , X₁ =l_j1 ) ³ },

= min{j | +(1 ± sign(i-j1)) +

+ (1 ± sign(i-j2)) }.

Или в общем случае:

j_q = min {j| +(1± sign(i-j_i)) }.

Итак, ошибка на каждом шаге не более .

3.6.2.2. Случай a =2

Рассмотрим критерий min Е|X-Y_i|² , где XÎ L*.

Поскольку argmin Е|X-Y_i|² = ЕX, где XÎ L* , то

X₁ = ЕX = P(Y₁ =l_i) l_i = .

Так как X₁ может не принадлежать L, то l_j1 выберем из условия

min| X₁ - l_j |= min| - l_j |= min { },

где минимум берется по l_jÎL .

Оценим ошибку на первом шаге:

P(Y₁ =l_i , X₁=l_j1) |l_i - l_j1 | =

= P(Y₁ =l_i | X₁ =l_j1 ) P(X₁ =l_j1 ) | l_i - l_j1 | =

= P(X₁ =l_j1) | l_i - l_j| = |EX - l_j1 | P(X₁ =l_j1) ,

откуда следует, что

Теперь рассмотрим выбор l_j2 :

X₂ = Е(X|X₁ = l_j1) = P(X₁ =l_i |X₁ =l_j1) l_i =

Отсюда получаем:

l_j2= argmin|X₂ -l_i | = argmin| - l_i |,

где минимум берется по l_iÎL₂ = L₁\l_j1 .

Оценим ошибку на втором шаге:

P(Y₂=l_i , X₂=l_j2) , X₁=l_j1) | l_i - l_j2 | =

= P(Y₂=l_i | X₂ =l_j2 ) P(X₂ =l_j2 | X₁=l_j1) P(X₁=l_j1) | l_i - l_j2 | =

= = P(X₂ =l_j2 | X₁=l_j1) P(X₁=l_j1) | l_i - l_j2| £ a ^{2 D}max ,

где 0<a <1/2.

По аналогии, делая выкладки для других шагов, получим

D q⁽²⁾ < a ^{q D}max .

Таким образом, второй метод точнее первого.

3.6.2.3. Случай a =0

Проанализируем случай метрики f_i(X)=Е|X-Y_i|a (это, так называемая, метрика Хевисайда). У этой метрики

argmin f_i(X)=modX , где XÎ L* .

По определению modX= argmaxF(X), где F(X) функция распределения с.в.X, т.е. это точка с максимальной вероятностью. Следовательно:

X₁=l_j1 , где l_j1 таково, что n_j1=max{n_i};

n_iL

X₂=l_j2 , где l_j2 таково, что n_j2=max{n_i} и т.д.

n_iL₂

Оценим ошибку на первом шаге:

P(Y₁=l_i , X₁=l_j1) , | l_i - l_j1 | =

= P(Y₁ =l_i | X₁ =l_j1 ) P(X₁ =l_j1 ) | l_i - l_j1 | =

= | l_i - l_j| = |EX - l_j1 | ,

что явно больше , так как =max P(X₁=l_i) ,

l_iL

Оценим ошибку на втором шаге:

P(Y₂=l_i , X₂=l_j2 , X₁ =l_j1) | l_i - l_j2 | =

= P(Y₂=l_i | X₂ =l_j2 ) P(X₂ =l_j2 | X₁ =l_j1)P(X₁ =l_j1) | l_i - l_j2 | =

= |EX- l_j2| .

что опять-таки больше, чем и т.д. В общем случае

где l_jq = modX и XÎ L_q .

Из проведенного анализа следует, что наиболее точным является метод с метрикой r (x,y) = |x-y|² . Ошибка при упорядочении по этому методу на шаге q не превышает величину a ^qmax|ЕX-l_i|, где a Î [0,1]. Поэтому, если рассматриваемыми действиями являются атомарные процессы и для любого последовательного исполнителя справедливо, что если

vt(p_ext_i)> a max|ЕX-l_i| ,

l_i L

то мы гарантированно не пропустим ни одного входного воздействия, а, стало быть, не нарушим логику причинно следственных связей.

3.7. Связь временного профиля с основными видами производительности

Здесь мы рассмотрим, как, зная временной профиль поведения системы, можно получить оценки разных видов производительности, а также выведем ряд соотношений, связывающий основные формы производительности с различными количественными характеристиками функционирования систем. (Подробно эти соотношения рассмотрены в [18].)

Пусть дана распределенная вычислительная система CS,состящая из Q последовательных исполнителей (например, процессоров). Введем следующий набор переменных, характеризующих функционирование CS:

T - длина периода наблюдения за работой CS по астрономическому времени;

J - число услуг, выполненных CS за период наблюдения. Услугу можно понимать как выполнение программы, функции, шага, команды и т.п.

Обозначим:

X = J/T - пропускную способность системы CS;

U_i - количество астрономического времени, которое i-ый последовательный исполнитель из CS, был занят выполнением услуг из J;

W_i = U_i/T - загрузку i-го исполнителя;

N_i - общее количество действий (действие - это нечто, что образует услугу), выполненных i-м последовательным исполнителем в течении периода наблюдения T.

Pw_i = U_i/N_i - среднее время действия на i-ом последовательном исполнителе (это вычислительная мощность исполнителя);

En_i = N_i/J - среднее число действий i-го устройства на одну услугу из J.

В этих обозначениях справедлива следующая теорема.

Теорема 22. (о пропускной способности). " i: 1 £ j £ Q Þ X= .

Доказательство: .

Следствие: " i,j: 1 £ i,j £ Q = .

Это соотношение является своего рода аналогом уравнения сохранения, часто используемого в том или ином виде в моделях физических систем. Однако, информационные системы имеют ряд специфических особенностей. Одно из них - отсутствие инерционности у информационных потоков. Образно говоря, информация может "возникнуть из ничего" и вдруг "исчезнуть бесследно". Поэтому "классические" уравнения сохранения мы здесь использовать не можем.

Рассмотрим некоторые актуальные применения этого закона. Постараемся определить соотношение между мощностью последовательного вычислителя Pw_i , числом N_i выполняемых им действий при решении задачи и отношением времени счета U_i к времени обмена

O_i : l _i= O_i/U_i, где T³ O_i+U_i.

Так как услугой теперь является решение одной задачи, то J=1 и

X= .

Так как U_i £ T - O_i, то

l _i < 1/W_i≈1 W_i £ 1/(l _i +1).

Откуда T/(l _i +1) ³ Pw_i N_i или

(*).

Определим минимальное время счета, которое должно приходиться на один обмен при заданной пропускной способности. Для этого представим

O_i = Ot_i m ,

т.е. разобьем время обмена на m частей. В наших обозначениях мы хотим определить

Тогда из (*) получим:

откуда

или .

Откуда, выражая g , получаем:

Теперь задачу о распараллеливании на заданной вычислительной системе CS можно сформулировать так:

дано N - общее количество действий, которые надо выполнить за время Т;

надо так распределить эти действия по Q процессорам чтобы:

или ³ N_i(l _i +1) ,

где и и T ³ O_i + U_i .

Теперь покажем то, как можно получить набор операционных переменных W, N_i , J и T, зная временной профиль G(t). Возьмем в качестве услуги выполнение процесса программы, а в качестве действия - атомарный процесс последовательного исполнителя. Тогда:

J= , где (t_k - момент окончания процесса, например, обращение к Stop в профиле g_i ).

U_i = , где c _p(t) - характеристическая функция шага процесса p, т.е. c _p(t)=1 если g_i(t)=p.s.d.a, где pÎ P или c _p(t)=0 в противном случае.

N_i = , где d _i(t) - функция, которая принимает значение 1 в момент изменения значения g_i(t) и равна 0 в остальные моменты времени.

Теперь рассмотрим другой важный вид производительности - время отклика. Пусть на CS расположено N процессов, к которым поступают запросы. В качестве ранее упоминавшихся услуг возьмем выполнение j-м процессом (1£ j£ N) запроса. Предполагаем, что N не меняется в течение периода наблюдения. Введем следующие обозначения:

J - число запросов, выполненных за период наблюдения Т.

r(k) - общее время, потраченное k-ым процессом на удовлетворение услуги k-го типа (т.е. время полезной работы k-го процесса). В этих обозначениях среднее время удовлетворения услуги можно выразить так:

R = .

J' - число запросов на услуги, поступившие в систему за период наблюдения (|J-J'|<N).

z(k)= T - r(k), т.е. время "простоя" k-го процесса.

В этих обозначениях среднее время ожидания запроса можно выразить так:

Z = .

Взаимосвязь между временем отклика и пропускной способностью системы определяет следующая теорема:

Теорема 23 (о времени отклика): .

Доказательство: " k:1£ k£ N Þ z(k) + r(k) = T. Отсюда

+ = NT.

В случае, когда CS - последовательный исполнитель

£ T.

+ .

или, используя ранее введенные обозначения, можно записать

откуда получаем утверждение теоремы

Следствие: Используя теорему о пропускной способности, получаем:

В случае N<<J:

Теперь рассмотрим связь этих двух видов производительности с характеристиками, которые описывают использование памяти в системе. Пусть функция Stg(p,t) определяет количество единиц памяти, занимаемой процессом p в момент t. Обозначим:

m_t(p) = и Str = ,

где N - это число процессов, которые присутствовали в момент t=0, т.е. мы не учитываем динамики порождения процессов, а сумма берется по всем p в системе. Тогда количество памяти, используемой в системе в момент t равно

m(t) = Stg(p,t) .

В этих обозначениях среднее количество используемой памяти в системе можно выразить как

M = .

или, используя выражение для m(t),

M = =

Откуда получаем

M = X Str (*).

Используя формулы времени отклика и подставив в нее выражение X из (*), получим

Приведенные соотношения позволяют количественно оценить параметры вычислительной системы, которая должна обладать желаемой пропускной способностью и временем реакции. Приведенные здесь соотношения также оказались полезны при проверке корректности имитационных моделей [19].

3.8. Выводы

Подводя итог сделанному, следует отметить, что созданная нами модель, по существу есть теория, которая описывает динамику взаимодействия процессов прикладной программы с логической и физической средами. В ней четко разделены программа и среда ее исполнения. Она отражает иерархическую структуру вычислительных систем, распределенность логической и физической сред. Первое отражается в том, что поведение программ не зависит от времени конкретного исполнителя, разные процессы программы развиваются независимо, последовательные исполнители функционируют автономно друг от друга, "привязывая" процессы программы к шкале метрического времени.

В рамках этой теории:

разработана математическая абстракция для описания поведения программ, охватывающая все известные из практики виды недетерминизма; в рамках созданного формализма определена и доказана взаимосвязь разных видов недетерминизма с разными классами поведения программ, указанными в разделе 2.2.5; созданный формализм создает основу для построения инструментальных средств описания динамики программ;
создан математический аппарат для описания структурных и функциональных свойств аппаратуры вычислительных систем. Он позволяет описывать децентрализацию управления, множественное метрическое время, конфликты. Созданная здесь конечно-порожденная частичная алгебра носителей позволяет выполнять над струкутрой вычислительных систем формальные преобразования, создает основу для построения инструментального средства для автоматизированной реструктуризации вычислительных систем;
построено исчисление (см. ⌠Наблюдатель■), описывающее динамику выполнения программ в распределенной вычислительной системе. С его помощью исследована взаимосвязь двух видов параллелизма; доказано что процедура его образующая не нарушает причинно-следственных связей в поведении программ; что оно позволяет корректно описывать как квази-параллелизм (чередование), так и истинный. Это исчисление в главе 4 будет использовано для построения системы моделирования распределенных вычислительных систем;
задача об анализе производительности сформулирована в математической форме в виде задачи построения временного профиля системы - вектор-функции, описывающей временную диаграмму функционирования распределенных вычислительных систем; дано решение этой задачи в виде модифицированной процедуры, описывающей работу наблюдателя;
исследован способ упорядочения действий, указанных в векторе трудоемкости, не требующий сведений о регистровой структуре исполнителя и даны оценки его точности;
показано как, зная временной профиль работы системы, можно получать разные характеристики производительности, установлена взаимосвязь временного профиля с основными видами производительности: пропускной способностью системы и временем отклика системы. Показано: как с помощью полученных соотношений можно оценить, например, минимальное время счета, которое должно приходиться на один обмен, чтобы общее время решения не превышало заданную величину; как связаны между собой техническая производительность исполнителя, число выполняемых им действий при работе программы, время обмена и время счета: полученные соотношения особенно полезны на ранних этапах разработки вычислительных систем, при проверке корректности имитационных моделей вычислительных систем.

ЛИТЕРАТУРА К ГЛАВЕ 3

Смелянский Р.Л. Подход к описанию и измерению поведения программ в распределенных вычислительных средах// Программирование (в печати)
Hoare C.A.R. Communicating sequential process.Prentis-Hall.1985.
Milner R. A calculus of communication system.1980.LNCS.92.
Degano G., Montanary U. Distributed system, partial ordering of events, and events structures // Control flow and Data flow: concepts of distrebuted programming. Springer-Verlag, 1986.P.7-106.
Nivat M. Behaviors of processes and synchronizing system of process //Theor. Found. Program. Methodology. N.-H. Press, 1982.P.473-550.
Летичевский А.А., Капитонова Ю.В. Математическая теория проектирования вычислительных систем. Мюб1988.
Молонов В.Г. Смелянский Р.Л. Комплексный подход к моделированию распределенных вычислительных систем//Программированиею Т1ю 1988юС.57-67
Смелянский Р.Л. Об инварианте поведения программ// Вестн.Моск.ун-та.Сер. 15. Вычисл. матем. и киберн.N4,1990.
Plotkin G. An operational semantics for CSP //Formal description of programming conceps.11&N.-H. Press, 1983.P.199-223.
Lauer P.E., Shields M.W., Best E. Formal theory of the basic COSY notation //Acta informatica.1979.12.P.109-158.
Hennesy M.,Plotkin G. Full abstraction for simple programming language//LNCS.1979. 74.P.108-120.
Genrich H.J., Lautenbach K., Thiagarajan P.S. Elements of general net theory//LNCS.1980. 84.P.21-163.
Goldz U.,Reising W. The non-sequantial behavior of Petry net//Information and Control.N5.1983.P.125-147.
Котов В.Е. Сети Петри. М.,Наука, 1984.
Миренков Н.Н. Параллельное программирование для многомодульных вычислительных систем.М.,1989.
Кристофидес Н. Теория графов% алгоритмический подход. М.Мир.1978.
Леман Э. Проверка статистических гипотез. М.Наука, 1979
Смелянский Р.Л. Операционные характеристики функционирования вычислительных систем.