Стрюков Сергей АлександровичФакультет компьютерных информационных технологий и автоматики (КИТА)
|
1 Общая характеристика распределенных (корпоративных) информационных систем
1.1 Новые технологии и появление корпоративных информационных систем
1.2 Конвергенция бизнеса и информационных технологий
1.3 Шесть принципов McKinsey успешного построения КИС
2 Существующие математические модели для анализа и оптимизации распределенных компьютерных систем
2.1 Описание комплекса моделей
2.3 Модель процессов массового обслуживания запросов на получение информации в системе
2.4 Модель процессов отражения в базе данных новых объектов учета предметной области
2.5 Модель процесса визуального контроля информации, вводимой в базу данных (БД)
2.7. Модель процессов сбора информации от источников
3 Методы и средства для проектирования распределенных информационных систем
4 Анализ представленной информации
4.1 Анализ рассмотренного комплекса математических моделей
4.2 Анализ рассмотренных методов и средств проектирования распределенных ИС
5 Выбор направления исследований
Деятельность предприятий самым тесным образом связана с управлением производственными процессами и своевременным принятием решений, позволяющих устанавливать оптимальное равновесие между разнообразными потребностями и целями компаний. Решения же можно принимать успешно и эффективно только в том случае, если руководитель знает и понимает, что он делает и как часто он будет это делать.
Цели нужны в каждой сфере бизнеса, эффективность функционирования и результаты работы которой напрямую и коренным образом влияют на его выживание и процветание. Очевидно, что достижение целей крайне затруднительно как при отсутствии достоверных сведений и фактов, так и при хаотичном потоке информации, который не может быть упорядочен без качественных механизмов сбора, обработки и анализа данных. Более того, специфика деятельности, повторяемость процессов и опыт работы конкретного предприятия требуют формирования и коллективного использования корпоративных знаний. На решение этих задач прежде всего и направлены передовые информационные технологии (IT).
Взаимовлияние, взаимопроникновение бизнеса и информационных технологий, иными словами, их конвергенция начала формироваться практически с самого начала появления основы IT-индустрии - компьютеров и программного обеспечения. Одной из первых попыток наладить информационные потоки, по крайней мере, для высшего руководства компаний, стали управленческие информационные системы (УИС). Появившись в конце 1980-х годов, такие системы предоставляли руководству предприятий возможность получать информацию о производстве и сбыте достаточно быстро, без длительного ожидания специальных отчетов.
С появлением персональных компьютеров, инструментов быстрой разработки приложений и развитых графических интерфейсов управленческие информационные системы в конце 1990-х годов развились в корпоративные информационные системы (КИС), которые также называют системами контроля эффективности. Новые КИС предусматривают предоставление информации более широкому по сравнению с УИС кругу сотрудников компании. По мере того, как поставщики КИС переходили на стандартные платформы и инструменты, менялась их роль в бизнесе. Главная ценность того, что они сегодня предлагают, - это уже не сами приложения, а помощь компаниям в осознании решаемых ими задач.
Быстрое развитие информационных технологий служит мощным технологическим фактором, обуславливающим нарастание темпов модернизации и развития всех отраслей бизнеса. Иллюстрацией сказанному может служить сравнительный график использования различных технологий в США, представленный американским журналом Economist (см. рисунок 1.1).
По горизонтали на графике отложено время, прошедшее с момента появления соответствующей технологии, а по вертикали - процент населения, использующий ее. Хорошо видно, что если автомобилю для достижения уровня проникновения (процент охвата населения, при котором та или иная технология (техническое достижение) становится необходимой для нормального функционирования общества) в 40% понадобилось почти 80 лет, для телефона - чуть меньше 70, а для электричества - 50, то персональные компьютеры и интернет достигли этого же уровня всего за 20 лет. По прогнозам большинства аналитиков, в течение ближайших десяти лет этими технологиями будет охвачено 80% населения.
Подключение к Интернету и использование персональных компьютеров являются взаимосвязанными и взаимостимулирующими процессами. Так, быстрое развитие Интернета началось с того момента, когда количество пользователей персональных компьютеров достигло своеобразной критической массы в 30%, и оно же, в свою очередь, стимулировало дальнейшее, еще более ускоренное распространение компьютеров.
На сегодняшний день Интернет является одним из мощнейших катализаторов проникновения информационных технологий в самые широкие слои бизнеса - он становится тем инструментом, который позволяет максимально быстро доставить информацию максимально широкому кругу потребителей.
Рисунок 1.1 - График развития и восприятия технологий
На основе прогнозов аналитиков можно сделать вывод, что IT будут, с одной стороны, все больше и больше влиять на повседневную жизнь, а с другой - что компании, наиболее эффективно использующие IT, будут иметь конкурентное преимущество перед теми, кто их не использует или использует менее эффективно: чем быстрее компания овладевает новыми технологиями, тем выше ее конкурентные преимущества.
Интернет и новые информационные технологии служат стимулятором изменения всего бизнеса. Они не только проникают во все сферы нашей жизни и деятельности - изменения претерпевает и сам бизнес.
До сего времени информационные технологии производили скорее данные, чем информацию, - не говоря уже о том, что они порождали множество разнообразных новых вопросов, а также множество разнообразных новых стратегий. Представители руководства избегали применения этих технологий потому, что они не давали информации, необходимой им для выполнения их собственной работы. Теперь ситуация меняется. Технологический прогресс последних лет предоставил руководителям возможность изменить роль IT в жизни компаний.
Для прежних эпох экономического развития были характерны продолжительные периоды стабильности, разделяемые краткими периодами революционных перемен. Эволюционисты называют такое положение прерывистым равновесием. Сегодня же электронная информация создает среду ведения бизнеса, для которого характерны постоянные перемены. Теперь в эпоху инноваций компаниям необходимо быть особенно аккуратными в выборе инструментов и методов ведения бизнеса, а также создания и совершенствования своей производственной архитектуры.
Анализируя опыт развертывания корпоративных информационных систем, эксперты аналитического агентства McKinsey (EN) в 1997 г. сформулировали принципы, следование которым является обязательным условием успеха:
Обеспечение качества современных информационных систем (ИС) немыслимо без применения моделей, позволяющих оценивать и оптимизировать процессы сбора, хранения и обработки информации. Как правило, сегодня для каждой ИС разрабатываются свои модели, учитывающие целевое назначение и специфику функционирования системы. Существует множество аналитических моделей, позволяющих оценивать отдельные характеристики функционирования систем.
Однако практически все ИС имеют одну общую цель - это удовлетворение потребностей пользователей в обеспечении надежного и своевременного представления полной, достоверной и конфиденциальной информации. Степень выполнения этих потребностей характеризует качество функционирования ИС с точки зрения конкретного пользователя информации. Наряду с этим, большинство ИС базируется на использовании довольно универсальных технологий сбора, хранения и обработки информации. Оба этих обстоятельства являются аргументами в пользу создания таких достаточно унифицированных моделей, которые позволяли бы по функциональным единым показателям достаточно адекватно оценивать качество функционирования ИС, сравнивать различные ИС, выявлять "узкие места" и оптимизировать процессы сбора, хранения и обработки информации.
Для оценки качества и оптимизации процессов функционирования ИС был предложен комплекс математических моделей процессов сбора, хранения и обработки информации. Составными показателями качества, характеризующими потребительские свойства используемой информации в стационарном режиме функционирования ИС, являются (некоторые из них более детально рассмотрены ниже):
Основным условием математической корректности моделей является существование и независимость функций распределения (ФР), описывающих характеристики функционирования ИС. Построение моделей было основано на применении предельной теоремы для регенерирующих процессов, а также на использовании известных результатов теории массового обслуживания.
Под надежностью представления запрашиваемой (выдаваемой принудительно) выходной информации понимается свойство ПТС при соблюдении эксплуатационных условий применения и технического обслуживания ИС сохранять во времени в установленных пределах значения параметров, характеризующих способность ПТС обеспечивать прием, автоматическую обработку запроса и представление (выдачу) выходной информации согласно реализованному алгоритму.
Для оценки надежности представления запрашиваемой (выдаваемой принудительно) выходной информации в ИС применяется следующая модель. В любой момент времени ПТС (с точки зрения получения информации пользователем) находятся в одном из двух чередующихся состояниях: работоспособном и неработоспособном. Среднее время пребывания ПТС в работоспособном состоянии равно средней наработке на отказ. Среднее время пребывания ПТС в неработоспособном состоянии равно среднему времени восстановления работоспособного состояния ИС.
В случайный момент времени пользователь направляет запрос на представление выходного документа (поступает команда на принудительную выдачу выходной информации). Возможны три варианта:
В первом случае происходит надежное представление информации, а во втором и третьем случаях происходит непредставление запрошенной информации.
Полученные в ходе проведения испытаний оценки средней наработки на отказ, среднего времени восстановления и среднего времени представления документа (времени реакции системы на запрос), являются исходными данными для проведения расчетов надежности представления запрашиваемой в течение сеанса (выдаваемой принудительно) выходной информации в ИС. Вся запрашиваемая (выдаваемая принудительно) информация разбивается на типы. Тип информации определяется конкретной формой выходного документа, в которой он может быть представлен.
Вероятность надежного представления информации при выполнении ФЗ:
Здесь:
N(t) - ФР времени наработки ПТС на отказ, n - МО;
W(t) - ФР времени восстановления ПТС, w - МО;
V(t) - ФР времени выполнения рассматриваемой ФЗ, v - МО;
В частном случае, когда ФР N(t), W(t), V(t) - экспоненциальные:
Получение выходной информации в системе осуществляется по запросам, требующим для своей обработки определенное время. Обработка запроса заключается в выполнении функциональных задач (ФЗ). В результате конкуренции различных запросов за информационные и программные ресурсы ИС (от пользователей, во исполнение технологических операций или автоматического приема информации, поступающей по каналам связи и др.) могут возникать очереди. Запросы из очереди обслуживаются согласно принятой технологии обработки. Когда подходит очередь обработки запроса, подключается требуемая к выполнению функциональная задача. Моментом окончания обработки запроса является представление запрашиваемого (выдаваемого принудительно) выходного документа. При этом под временем обработки запроса может пониматься не только время, необходимое для получения одного выходного документа, но и время, необходимое для получения по запросу совокупности нескольких выходных документов.
Для оценки своевременности представления запрашиваемой (выдаваемой принудительно) выходной информации в ИС широко используются модели массового обслуживания. Процессы обработки запросов в ИС формируются как процессы массового обслуживания в приоритетной системе с бесконечным числом мест для ожидания и произвольной функцией распределения времени обработки запросов (M/G/1/?).
При этом предположение о пуассоновости потоков заявок на обработку в систему может быть обосновано тем, что среди потоков типа Пальма пуассоновский поток ставит систему обслуживания в наиболее жесткие условия функционирования и для показателей времени ожидания запросов в очередях дает верхние оценки. Более того, потоки запросов одного типа представляют собой, как правило, сумму большого числа потоков от различных источников. Интенсивность каждого из слагаемых потоков мала по сравнению с интенсивностью суммарного потока - в такой ситуации действует предельная теорема В. Григолиониса о сходимости сумм ступенчатых процессов к пуассоновскому, согласно которой суммарный поток сходится к пуассоновскому. Все приведенные соображения, а также результаты статистических исследований, проводимые в ходе испытаний информационных систем, свидетельствуют о возможности использования допущения о пуассоновости потоков заявок на обслуживание.
Предположение о бесконечности числа мест для ожидания означает на практике выделение для хранения запросов, входной и выходной информации таких объемов памяти буферов и базы данных, которые при правильной эксплуатации гарантируют отсутствие информационных потерь в системе вследствие их возможного переполнения. Поскольку в последние годы прослеживается весьма устойчивая тенденция к существенному увеличению объемов оперативной и внешней памяти и ее удешевлению в современных средствах электронно-вычислительной техники, проблемы с недостатком памяти возникают все реже, и в ближайшем будущем, по-видимому, перестанут вызывать практические затруднения. С учетом изложенного введенное предположение о бесконечности числа мест для ожидания в системе представляется вполне обоснованным.
Для моделей массового обслуживания с различными приоритетами и дисциплинами обработки пуассоновских потоков запросов вероятность предоставления требуемой информации за заданное время определяется с помощью аппроксимации неполной гамма-функцией:
Здесь:
гамма-функция;
,
соответственно 1-й и 2-й моменты времени пребывания запросов r-го приоритета на обслуживании в системе с учетом ожидания.
Под полнотой отражения в БД реально существующих объектов учета предметной области понимается свойство ИС отражать в процессе функционирования состояние всех объектов учета, предусматриваемых в запросе пользователя ИС на получение выходного документа. В процессе эксплуатации неполнота может возникнуть как результат временной задержки в отражении в БД новых, вновь появившихся объектов учета с момента их появления в реальности и до момента физической записи в БД.
Для проведения оценки используется следующая модель отражения в БД ИС объектов учета предметной области.
Поскольку БД является формальным отражением наличия и состояния, реально существующих объектов учета предметной области, сопоставления входных и выходных форм документов позволяет выявить те объекты учета, которые являются ключевыми в выходных документах и информация о состоянии которых подлежит функциональному использованию в соответствии с целевым назначением ИС. Все множество таких объектов учета конечно, а их номенклатура либо задается классификаторами (продукции, услуг, и др.), либо определяется заказчиками или пользователями ИС в техническом задании и постановках функциональных задач.
Реальное наполнение БД записями о реально существующих объектах учета на момент испытаний может:
Степень полноты отражения в БД ИС объектов учета предметной области оценивается вероятностными показателями с использованием модели массового обслуживания (M/G/?). При этом реальный закон появления новых объектов учета аппроксимируется пуассоновским законом, что позволяет получать пессимистические оценки полноты отражения информации в БД ИС. Оценка осуществляется в приложении к конкретному периоду функционирования ИС и конкретным типам форм входных документов.
Если через случайные интервалы времени, распределенные по экспоненциальному закону с параметром с вероятностью появляется сразу m новых объектов учета, то вероятность того, что в БД полностью отражены реальные объекты учета конкретного типа:
Здесь:
производящая функция;
B(t) - ФР времени подготовки, передачи и ввода в БД информации о новых объектах учета. В частном случае, когда одновременно может появиться лишь один новый объект учета, т.е. производящая функция Ф(Z) = Z, а также в случае, когда:
при любом Ф(z), справедливо:
Здесь:
Типовая технология подготовки и контроля входной информации в ИС отражена на рисунке 2.1.
В процессе визуального контроля выделяется период сохранения концентрации внимания должностного лица (на протяжении которого полагаются выявленными все ошибки в проверенных данных) и период утомления, когда первая же наличествующая во входном документе ошибка оказывается пропущенной; последующие ошибки при утомлении также могут оказаться пропущенными. Предполагается, что все выявленные ошибки исправляются верным образом. Кроме того, могут быть заданы ограничения на допустимое время контроля документа, что свойственно для систем реального времени. В общем случае периоды сохранения концентрации внимания и утомления определяются квалификацией (физическое состояние должностного лица полагается нормальным). Должностное лицо, осуществляющее набор информации(т.е. отвечающее за ее синтаксический аспект), может выступать в качестве контролера и лица, готовящего или принимающего решение (т.е. отвечающего за семантический аспект информации).
Тип формализованных документов определяется их формой.
Рисунок 2.1 - Типовая технология подготовки и контроля входной информации в ИС
В качестве исходных параметров оцениваемой технологии выступают:
Вероятность отсутствия скрытых случайных ошибок в проверяемой информации:
Здесь:
ФР интервала времени осуществления контроля информации между имеющими место соседними ошибками,
- МО;
ФР минимума из двух характеристик: 1.Времени непрерывной работы контролера
(включает период времени сохранения концентрации внимания и, по истечении
последнего, период работы при утомлении); 2.Ограниченийна допустимое время
контроля; q - МО.
ФР непрерывного времени сохранения концентрации внимания контролером, а
- МО.
В частном случае, когда ФР , , - экспоненциальные:
В процессе работы пользователи и обслуживающий персонал ИС в силу ограниченности физических возможностей человека способны допускать ошибки, влияющие на доступность и целостность информационных и программных средств (ИПР). Эти ошибки могут быть явными и скрытыми.
Явные ошибки проявляются сразу после их допущения (например, это может проявляться в отказе программно-технических средств вследствие ошибки, в блокировке доступа к ИПР или в других событиях, нарушающих надежность и своевременность представления информации), и тут же подлежат устранению. Степень защищенности ИПР от явных ошибок должностных лиц может быть методически оценена с использованием модели процессов представления информации в условиях ненадежности программно-технических средств и модели процессов массового обслуживания запросов на получение информации в системе. Скрытые ошибки не выявляются сразу, они приводят к скрытому в течение некоторого времени нештатному режиму функционирования ИС и могут нарушать доступность и целостность ИПР. Предлагаемая ниже модель позволяет оценивать отсутствие именно скрытых ошибок в зависимости от ряда характеристик моделируемого процесса.
В любой момент времени ИПР (с точки зрения пользователя) находятся в одном из двух чередующихся состояний: "отсутствия скрытых искажений " или "наличия скрытых искажений", допущенных пользователями или обслуживающим персоналом. Соответственно при соблюдении прочих условий штатного режима функционирования ИС первое состояние является условием безошибочного выполнения функциональных задач (ФЗ), а второе состояние приводит к возможному невыполнению или неверному результату выполнения ФЗ.
Возможны три варианта соотношения между моментами возникновения и обнаружения скрытой ошибки и времени обработки:
Полагается, что сразу по выявлении скрытой ошибки все подозреваемые на наличие ошибок ИПР подвергаются технологическому контролю на целостность, после чего устраняются все выявленные ошибки.
В качестве исходных параметров проверяемой технологии обеспечения защищенности ИПР от случайных ошибок пользователей и обслуживающего персонала выступают:
Вероятность того, что до или за время выполнения ФЗ не возникнет скрытых ошибок со стороны пользователей или обслуживающего персонала ИС:
Здесь:
ФР периода времени до первого момента появления скрытой ошибки пользователей
или обслуживающего персонала, приводящей к нарушению функционирования ИС,
s - МО;
ФР периода времени с момента появления первой скрытой ошибки до момента
обнаружения нарушенного состояния целостности информационных и программных
ресурсов и завершения восстановления работоспособности ИС, в т.ч. с учетом
способов и периодичности контроля состояния ИПР, u - МО;
- ФР времени выполнения рассматриваемой ФЗ, v - МО;
(* - знак свертки),
- МО.
В частном случае, когда ФР , , - экспоненциальные:
На источниках информации происходят изменения состояния объектов учета, которые должны отражаться в БД путем соответствующего изменения в ней характеристик состояния указанных объектов. В соответствии с принятой в ИС дисциплиной сбора входной информации обновляемые данные от источников заносятся в базу данных.
Возможны следующие дисциплины сбора информации:
В промежутке времени между изменением состояния объекта учета и занесением этих изменений в БД соответствующая выходная информация ИС считается недостаточно актуальной, если ее отличие от реальной превышает допустимые пределы, определяемые функциональным назначением этой выходной информации (т.е., если в реальности произошли значимые изменения, и они не отражены в БД). Неактуальная БД является угрозой целостности информации в ИС. Оценка степени актуальности выходной информации, сформированной на основе использования БД ИС должна осуществляться в приложении к конкретному периоду функционирования ИС и конкретным типам форм входных документов, на основании которых формируется БД.
Вероятность сохранения актуальности информации на момент ее использования:
для дисциплины выдачи информации от источника сразу по происшествии значимого изменения текущего состояния объектов учета:
Здесь:
ФР времени значимого изменения реальной информации относительно информации,
хранимой в БД, с - МО;
ФР времени подготовки, передачи и ввода информации для обновления БД, b - МО;
В частном случае, когда , , - экспоненциальные:
В случае, когда дисциплина обновления БД - регламентная, т.е.:
Тенденции развития современных информационных технологий приводят к постоянному возрастанию сложности информационных систем (ИС), создаваемых в различных областях экономики. Современные крупные проекты ИС характеризуются, как правило, следующими особенностями:
Для успешной реализации проекта объект проектирования (ИС) должен быть прежде всего адекватно описан, должны быть построены полные и непротиворечивые функциональные и информационные модели ИС. Накопленный к настоящему времени опыт проектирования ИС показывает, что это логически сложная, трудоемкая и длительная по времени работа, требующая высокой квалификации участвующих в ней специалистов. Однако до недавнего времени проектирование ИС выполнялось в основном на интуитивном уровне с применением неформализованных методов, основанных на искусстве, практическом опыте, экспертных оценках и дорогостоящих экспериментальных проверках качества функционирования ИС. Кроме того, в процессе создания и функционирования ИС информационные потребности пользователей могут изменяться или уточняться, что еще более усложняет разработку и сопровождение таких систем.
В 70-х и 80-х годах при разработке ИС достаточно широко применялась структурная методология, предоставляющая в распоряжение разработчиков строгие формализованные методы описания ИС и принимаемых технических решений. Она основана на наглядной графической технике: для описания различного рода моделей ИС используются схемы и диаграммы. Наглядность и строгость средств структурного анализа позволяла разработчикам и будущим пользователям системы с самого начала неформально участвовать в ее создании, обсуждать и закреплять понимание основных технических решений. Однако, широкое применение этой методологии и следование ее рекомендациям при разработке конкретных ИС встречалось достаточно редко, поскольку при неавтоматизированной (ручной) разработке это практически невозможно. Действительно, вручную очень трудно разработать и графически представить строгие формальные спецификации системы, проверить их на полноту и непротиворечивость, и тем более изменить. Если все же удается создать строгую систему проектных документов, то ее переработка при появлении серьезных изменений практически неосуществима.
Перечисленные факторы способствовали появлению программно-технологических средств специального класса - CASE-средств, реализующих CASE-технологию создания и сопровождения ИС. Термин CASE (Computer Aided Software Engineering) используется в настоящее время в весьма широком смысле. Первоначальное значение термина CASE, ограниченное вопросами автоматизации разработки только лишь программного обеспечения (ПО), в настоящее время приобрело новый смысл, охватывающий процесс разработки сложных ИС в целом. Теперь под термином CASE-средства понимаются программные средства, поддерживающие процессы создания и сопровождения ИС, включая анализ и формулировку требований, проектирование прикладного ПО (приложений) и баз данных, генерацию кода, тестирование, документирование, обеспечение качества, конфигурационное управление и управление проектом, а также другие процессы. CASE-средства вместе с системным ПО и техническими средствами образуют полную среду разработки ИС.
CASE-технология представляет собой методологию проектирования ИС, а также набор инструментальных средств, позволяющих в наглядной форме моделировать предметную область, анализировать эту модель на всех этапах разработки и сопровождения ИС и разрабатывать приложения в соответствии с информационными потребностями пользователей. Большинство существующих CASE-средств основано на методологиях структурного (в основном) или объектно-ориентированного анализа и проектирования, использующих спецификации в виде диаграмм или текстов для описания внешних требований, связей между моделями системы, динамики поведения системы и архитектуры программных средств.
Проанализировав представленный комплекс математических моделей, можно сделать следующие выводы:
Вывод: существующие модели не приспособлены для анализа распределенных ИС. Рассмотренный комплекс моделей оценивает некоторые, но не все параметры локальных ИС, что не дает полной оценки о состоянии системы. Как результат этих отрицательных сторон - для каждой системы строится своя модель, учитывающая особенности конкретной системы.
Проанализировав представленные данные, можно сделать следующие выводы:
Вывод: методы разработки необходимо ориентировать на построение ИС распределенной структуры. Рассмотренные методы решают все поставленные при разработке локальных систем задачи.
Как видно из предыдущего пункта, в области информационных технологий нет подходящих математических моделей для анализа состояния распределенных систем. Все модели созданы для отражения лишь некоторых свойств локальных ИС. Оценка параметра дается для конкретного момента времени. Рассмотренные модели не отображают работу ИС на промежутке времени, а дают оценку состояния ИС в конкретный момент времени, что не позволяет правильно определить "узкие места" системы.
Таким образом, целью данной работы будет следующее: