Библиотека

Математические модели процессов функционирования информационных систем
(часть 1)

Источник: http://www.compulog.ru/mac/compulog/1999/01/a4.html

Костогрызов А.И.

1. ВВЕДЕНИЕ

Обеспечение качества современных информационных систем (ИС) немыслимо без применения моделей, позволяющих оценивать и оптимизировать процессы сбора, хранения и обработки информации. Как правило, сегодня для каждой ИС разрабатываются свои модели, учитывающие целевое назначение и специфику функционирования системы. Существует множество аналитических моделей, позволяющих оценивать отдельные характеристики функционирования систем /5-10/.

Однако, практически все ИС имеют одну общую цель – это удовлетворение потребностей пользователей в обеспечении надежного и своевременного представления полной, достоверной и конфиденциальной информации. Степень выполнения этих потребностей характеризует качество функционирования ИС с точки зрения конкретного пользователя информации. Наряду с этим, большинство ИС базируется на использовании довольно универсальных технологий сбора, хранения и обработки информации. Оба этих обстоятельства являются аргументами в пользу создания таких достаточно унифицированных моделей, которые позволяли бы по единым функциональным показателям достаточно адекватно оценивать качество функционирования ИС, сравнивать различные ИС, выявлять “узкие места” и оптимизировать процессы сбора, хранения и обработки информации.

Целью настоящей работы является создание именно таких математических моделей - достаточно адекватных, отражающих физическую суть процессов функционирования ИС, лишенных существенных аналитических ограничений и доступных в использовании широкому кругу исследователей.

2. ОПИСАНИЕ ПРЕДЛАГАЕМОГО КОМПЛЕКСА МОДЕЛЕЙ

Для оценки качества и оптимизации процессов функционирования ИС предлагается комплекс математических моделей процессов сбора, хранения и обработки информации. Составными показателями качества, характеризующими потребительские свойства используемой информации в стационарном режиме функционирования ИС, являются:

вероятность надежного представления информации при выполнении функциональной задачи (ФЗ);

вероятность представления требуемой информации за заданное время;

вероятность того, что в базе данных (БД) полностью отражены реальные объекты учета конкретного типа;

вероятность отсутствия скрытых случайных ошибок в проверяемой информации;

вероятность того, что до или за время выполнения ФЗ не возникнет скрытых случайных ошибок со стороны пользователей или обслуживающего персонала ИС;

вероятность того, что до или за время выполнения ФЗ не произойдет скрытого вирусного воздействия и выполнение ФЗ не прервется антивирусной профилактикой;

вероятность сохранения актуальности информации на момент ее использования;

вероятность предотвращения несанкционированного доступа (НСД);

вероятность сохранения конфиденциальности.

Структура комплекса предлагаемых моделей отражена на рис.1 /1,2/.

Основным условием математической корректности моделей является существование и независимость функций распределения (ФР), описывающих характеристики функционирования ИС. Построение моделей было основано на применении предельной теоремы для регенерирующих процессов /3,4/, а также на использовании известных результатов теории массового обслуживания /5-10/.

3. Модель процессов представления информации в условиях ненадежности программно-технических средств

Под надежностью представления запрашиваемой (выдаваемой принудительно) выходной информации понимается свойство ПТС при соблюдении эксплуатационных условий применения и технического обслуживания ИС сохранять во времени в установленных пределах значения параметров, характеризующих способность ПТС обеспечивать прием, автоматическую обработку запроса и представление (выдачу) выходной информации согласно реализованному алгоритму.

Для оценки надежности представления запрашиваемой (выдаваемой принудительно) выходной информации в ИС применяется следующая модель. В любой момент времени ПТС (с точки зрения получения информации пользователем) находятся в одном из двух чередующихся состояниях: работоспособном и неработоспособном. Среднее время пребывания ПТС в работоспособном состоянии равно средней наработке на отказ. Среднее время пребывания ПТС в неработоспособном состоянии равно среднему времени восстановления работоспособного состояния ИС.

В случайный момент времени пользователь направляет запрос на представление выходного документа (поступает команда на принудительную выдачу выходной информации). Возможны три варианта:

  • запрос, поступивший в процессе сеанса в момент времени t функционирования ПТС, застает ИС в работоспособном состоянии и ИС находится в этом состоянии все время, необходимое для представления требуемого документа (обработки запроса);
  • запрос, поступивший в процессе сеанса в момент времени t функционирования ПТС, застает ИС в работоспособном состоянии, но ИС находится в этом состоянии менее времени, необходимого для представления требуемого документа (обработки запроса);
  • запрос, поступивший в процессе сеанса в момент времени t функционирования ПТС, застает ИС в неработоспособном состоянии.

В первом случае происходит надежное представление информации, а во втором и третьем случаях происходит непредставление запрошенной информации.

Полученные в ходе проведения испытаний оценки средней наработки на отказ, среднего времени восстановления и среднего времени представления документа (времени реакции системы на запрос), являются исходными данными для проведения расчетов надежности представления запрашиваемой в течении сеанса (выдаваемой принудительно) выходной информации в ИС. Вся запрашиваемая (выдаваемая принудительно) информация разбивается на типы. Тип информации определяется конкретной формой выходного документа, в которой он может быть представлен. Описание модели приведено на рис.2.

4. Модель процессов массового обслуживания запросов на получение информации в СИСТЕМЕ

Получение выходной информации в системе осуществляется по запросам, требующим для своей обработки определенное время. Обработка запроса заключается в выполнении функциональных задач (ФЗ). В результате конкуренции различных запросов за информационные и программные ресурсы ИС (от пользователей, во исполнение технологических операций или автоматического приема информации, поступающей по каналам связи и др.) могут возникать очереди. Запросы из очереди обслуживаются согласно принятой технологии обработки. Когда подходит очередь обработки запроса, подключается требуемая к выполнению функциональная задача. Моментом окончания обработки запроса является представление запрашиваемого (выдаваемого принудительно) выходного документа. При этом, под временем обработки запроса может пониматься не только время, необходимое для получения одного выходного документа, но и время, необходимое для получения по запросу совокупности нескольких выходных документов.

Для оценки своевременности представления запрашиваемой (выдаваемой принудительно) выходной информации в ИС широко используются модели массового обслуживания /5-10/, иллюстративно представленные на рис.3. Процессы обработки запросов в ИС формируются как процессы массового обслуживания в приоритетной системе с бесконечным числом мест для ожидания и произвольной функцией распределения времени обработки запросов (M/G/1/? ).

При этом предположение о пуассоновости потоков заявок на обработку в систему может быть обосновано тем, что среди потоков типа Пальма пуассоновский поток ставит систему обслуживания в наиболее жесткие условия функционирования и для показателей времени ожидания запросов в очередях дает верхние оценки. Более того, потоки запросов одного типа представляют собой, как правило, сумму большого числа потоков от различных источников. Интенсивность каждого из слагаемых потоков мала по сравнению с интенсивностью суммарного потока - в такой ситуации действует предельная теорема В.Григолиониса о сходимости сумм ступенчатых процессов к пуассоновскому, согласно которой суммарный поток сходится к пуассоновскому. Все приведенные соображения, а также результаты статистических исследований, проводимые в ходе испытаний информационных систем, свидетельствуют о возможности использования допущения о пуассоновости потоков заявок на обслуживание.

Предположение о бесконечности числа мест для ожидания означает на практике выделение для хранения запросов, входной и выходной информации таких объемов памяти буферов и базы данных, которые при правильной эксплуатации гарантируют отсутствие информационных потерь в системе вследствие их возможного переполнения. Поскольку в последние годы прослеживается весьма устойчивая тенденция к существенному увеличению объемов оперативной и внешней памяти и ее удешевлению в современных средствах электронно-вычислительной техники, проблемы с недостатком памяти возникают все реже, и в ближайшем будущем, по-видимому, перестанут вызывать практические затруднения. С учетом изложенного введенное предположение о бесконечности числа мест для ожидания в системе представляется вполне обоснованным. Описание модели приведено на рис.3.

5. Модель процессов отражения в базе данных новых объектов учета предметной области

Под полнотой отражения в БД реально существующих объектов учета предметной области понимается свойство ИС отражать в процессе функционирования состояние всех объектов учета, предусматриваемых в запросе пользователя ИС на получение выходного документа. В процессе эксплуатации неполнота может возникнуть как результат временной задержки в отражении в БД новых (вновь появившихся объектов учета с момента их появления в реальности и до момента физической записи в БД).

Для проведения оценки используется следующая модель отражения в БД ИС объектов учета предметной области.

Поскольку БД является формальным отражением наличия и состояния реально существующих объектов учета предметной области, сопоставления входных и выходных форм документов позволяет выявить те объекты учета, которые являются ключевыми в выходных документах и информация о состоянии которых подлежит функциональному использованию в соответствии с целевым назначением ИС. Все множество таких объектов учета конечно, а их номенклатура либо задается классификаторами (продукции, услуг, и др.), либо определяется заказчиками или пользователями ИС в техническом задании и постановках функциональных задач.

Реальное наполнение БД записями о реально существующих объектах учета на момент испытаний может:

а) охватить все возможные объекты учета, существующие в реальности, и, как следствие, констатируется факт полного отражения объектов учета предметной области в БД ИС;

б) охватить лишь часть реально существующих объектов учета, а первоначальные записи об остальных объектах потенциально могут появляться в процессе дальнейшего функционирования ИС или в отдельные периоды функционирования ИС. В этом случае при появлении новых объектов учета до осуществления формальных записей о них в БД ИС будет иметь место неполнота отражения реально существующих объектов учета предметной области в БД, и, если таких объектов в оцениваемый период функционирования ИС достаточно много, а доведение информации о них от источников до БД занимает длительное время, то неполнота БД может привести к неучету ряда реальных факторов и, вследствие этого, к снижению качества функционирования ИС.

Степень полноты отражения в БД ИС объектов учета предметной области оценивается вероятностными показателями с использованием модели массового обслуживания (M/G/? ). При этом реальный закон появления новых объектов учета аппроксимируется пуассоновским законом, что позволяет получать пессимистические оценки полноты отражения информации в БД ИС. Оценка осуществляется в приложении к конкретному периоду функционирования ИС и конкретным типам форм входных документов.

Описание модели приведено на рис.4.

6. Пример

Создается автоматизированная система (АС) экономического мониторинга среды. Информация о состоянии и опасном изменении среды передается в информационный центр, где она дополнительно контролируется перед вводом в единую базу данных (БД). Первичный набор информации, ее контроль и ввод в базу данных осуществляется ответственными должностными лицами. Выборочные требования к функционированию АС (в части надежности и своевременности представления и полноты информации), отраженные в техническом задании на разработку системы, выглядят следующим образом:

в наиболее напряженный период функционирования АС (период экологического бедствия):

  • вероятность надежного представления информации пользователям при выполнении функциональных задач (ФЗ) для запросов на выдачу всех видов справок, документов ввода и корректировки данных в информационном центре должна быть не менее Pзад. = 0.995;
  • вероятность своевременного представления информации по командам и запросам от вышестоящих органов, ввода поступающей от источников исходной информации в БД должна быть не менее 0.9 за время не более 2 минут;
  • вероятность своевременного представления справок по результатам решения расчетных задач должна быть не ниже 0.9 за время не более 10 минут;
  • вероятность обеспечения полноты отражения реальных характеристик новых объектов учета в БД в процессе функционирования системы должна быть не менее Pзад. = 0.9;

Для проверки предъявленных требований используется комплекс моделей, приведенный на рис.2-4.

По результатам испытаний и инспекционного контроля установлено, что система обладает следующими характеристиками:

а) в части оценки надежности:

    • среднее время наработки на отказ или сбой Т0 зад >10000 часов;
    • среднее время восстановления КСА после отказа или сбоя Тв < 30 минут;
    • среднее время выполнения ФЗ пользователем - 2 часа;

б) в части оценки своевременности в период наивысшей нагрузки:

    • все множество заявок на обработку в систему образуют 3 потока (1-й - команды и запросы от вышестоящих органов, 2-й - сообщения с исходной информацией и выдача справок по результатам решения расчетных задач, 3-й - технологические операции, в том числе по контролю целостности и конфиденциальности информации) при этом заявки 1-го типа имеют относительный приоритет над заявками 2-го и 3-го типов, а заявки 2-го типа - над заявками 3-го типа;
    • суммарная частота поступления команд и запросов составляет 20 в час, время обработки каждого составляет 6 с;
    • суммарная частота поступления входных сообщений с исходной информацией может достигать 60 сообщений в час при среднем времени обработки каждого 20 с;
    • суммарная частота решения расчетных задач - 6 задач в час при среднем времени решения 3 минуты;
    • суммарная частота технологических операций достигает 120 операций в час при среднем времени 1 с;

в) в части оценки полноты отражения в БД новых объектов учета предметной области:

    • появление новых факторов, влияющих на подготовку к устранению причин и последствий экологического осуществляется с частотой 1 раз в час;
    • среднее время подготовки, передачи и ввода в БД информации об этих критичных объектах учета достигает 10 минут.

Результаты моделирования (риc.5) показывают, что для проверяемой системы выполняются все предъявляемые требования.

далее