На главную страницу
Донецкий национальный технический университет
"Методы и средства анализа и моделирования крупномасштабных компьютерных
сетей"
Автореферат выпускной работы магистра
Руководитель: доц., к.т.н. Аноприенко А. Я.
Общая характеристика работы
Объект исследования - крупномасштабные компьютерные сети. Целью научной работы является выработка подходов к анализу эффективности работы компьютерных сетей в результате их исследования и моделирования. В научной работе рассматриваются задачи, методы и средства моделирования разветвленной сетевой инфраструктуры. Методами исследования являются экспериментальные исследования, оценка особенностей работы сетевого оборудования, построение вероятностных моделей загруженности сети, программные продукты. Результатом научной работы является построение модели компьютерной сети ДонНТУ и предварительная оценка эффективности ее работы. Данная тема является актуальной в связи с постоянным ростом компьютерных сетей и увеличением объемов данных, передаваемых по сети. Проделанная работа, ее результаты и используемые при этом подходы являются новаторскими в плане оценки работы компьютерных сетей. Результаты научной работы могут применяться в организациях, занимающихся предоставлением услуг анализа и мониторинга компьютерных сетей, а также использоваться в любых организациях с разветвленной сетевой инфраструктурой для оценки состояния собственной сети. Высокая экономическая эффективность работы по данному направлению обуславливается ее актуальностью вследствие новизны проведенной работы и постоянного усложнения сетевых инфраструктур. В связи с переходом на более высокий уровень развития сетевых технологий данная работа имеет большое значение для оценки эффективности работы крупномасштабных компьютерных сетей.
Содержание работы
1. ЭТАПЫ РАЗВИТИЯ СЕТЕВЫХ ТЕХНОЛОГИЙ В УНИВЕРСИТЕТАХ
С каждым годом возрастает значимость и масштабы университетских сетей во всемирной сети. Известно, что первая сеть ARPNET, предшественник глобальной сети INTERNET, зародилась именно в университетах США. В 1998 году по инициативе UCAID (University Corporation for Advanced Internet Development) в Соединенных Штатах была создана и начала действовать сверхскоростная компьютерная сеть Internet2, объединившая на первом этапе 37 университетов. Эта экспериментальная академическая структура общей стоимостью 500 млн. долл. на начальном этапе была построена на основе оптоволоконной опорной магистрали протяженностью более десяти тысяч километров. Сеть, имевшая вначале пропускную способность 622 Мбит/с, в настоящее время достигла уровня свыше 10 Гбит/с. Аналогичное развитие в последние годы наблюдается и в Европе. Мировая практика показывает, что университетские сети были, есть и в обозримом будущем будут основным полигоном для развития и усовершенствования "мировой паутины".
Еще совсем недавно для украинских университетов это было не столь актуально. Но уже сейчас можно с полной уверенностью говорить о стремительном усложнении наших университетских сетей в связи с переходом на более высокий уровень развития сетевых технологий в Украине. Зачастую, компьютерная сеть технического университета объединяет не менее 500 компьютеров, расположенных в нескольких учебных корпусах, практически каждый из которых является источником интенсивного трафика. При таких масштабах сети эффективное управление ее ресурсами уже представляется невозможным без моделирования.
Однако только сейчас назрела необходимость использования глобальных моделирующих сред в связи с усложнением сетевых структур университетов. Необходимость в этом возникает как при администрировании и развитии существующей сетевой инфраструктуры, так и при проектировании новых сетей и разработке сетевых приложений.
При этом должны быть обеспечены возможности оценки эффективности работы сети, документирования ее текущего состояния, оптимизации производительности, анализа возможных усовершенствований, а также - выработки рекомендаций для наиболее рационального использования ресурсов сети.
Изначально проблема неоптимальной работы сети разделяется на недостатки архитектуры и нехватку ресурсов. Так, в части недостатков архитектуры, "узким" местом может оказаться сеть, которая в силу своей малой пропускной способности или больших временных задержек неспособна обеспечить нормальное прохождение большого потока данных с множества направлений. Могут возникать проблемы и с отдельными приложениями, предназначенными для организации каких-либо работ в сети, для которых недостатки архитектуры могут пагубно сказаться на оперативности обработки данных и работе исполняемых модулей. Необходимо также отметить, что проблема архитектурных недостатков существенно влияет на работу как клиентских, так и серверных компонентов сети. В данном случае источником проблем могут оказаться и слишком малый объем оперативной памяти при низкой частоте работы процессора, и недостаточная емкость (в совокупности с низкой производительностью) работы накопителей. Сложности могут возникнуть и с загруженностью определенных сегментов сети, что влечет за собой уменьшение скорости, а соответственно и объемов данных, проходящих через конкретный сегмент.
2. ОСОБЕННОСТИ РЕАЛИЗАЦИИ СУЩЕСТВУЮЩИХ МОДЕЛИРУЮЩИХ СИСТЕМ
На сегодняшний день наиболее рациональным вариантом решения данного круга задач является использование специально предназначенных для этого моделирующих систем. Существует несколько вариантов таких систем, которые отличаются разными функциональными возможностями и стоимостью.
Все современные программы данного типа оснащены средствами графического проектирования, позволяющими строить схемы сети с помощью специальных библиотек элементов сетевой инфраструктуры.
В качестве примеров таких программных продуктов могут быть рассмотрены такие достаточно известные и признанные системы моделирования как NetMaker XA от Make Systems, который получил награду World Class ("Продукт мирового класса") и NetCracker Professional, разработанная фирмой NetCracker Technology.
NetMaker XA от Make Systems является наиболее полным и гибким продуктом. Вычислительное ядро моделирования, используемое в NetMaker XA от Make Systems, - одно из наиболее мощных на рынке, и это сыграло немаловажную роль в том, что продукт зарекомендовал себя столь хорошо. Данный программный продукт способен генерировать отчеты, содержащие всю необходимую информацию о состоянии сети. Главные недостатки NetMaker XA - необходимость серьезного обучения пользователя и высокая стоимость. Если к цене базовой конфигурации изделия добавить стоимость дополнительных модулей, получится довольно значительная сумма. Основу продукта составляют модули Visualizer, Planner и Designer. Каждый из них выполняет какую-то одну функцию. Чтобы смоделировать работу сети, необходимы все три. Visualizer, например, служит для получения информации о сети и ее просмотра. С помощью модуля Planner пользователь может самостоятельно строить свои собственные объекты для описания сетевых устройств и каналов связи, не включенных в библиотеку. Designer нужен для построения схем сетей. Данное средство позволяет легко и быстро создавать модели и анализировать альтернативы. Если пользоваться им совместно с Planner, можно получать информацию о том, как будет работать сеть заданной конфигурации.
В результате комплексного анализа технических возможностей моделирующих систем и их стоимости можно сделать вывод, что одной из наиболее доступных на сегодняшний день является система моделирования NetCracker Professional, разработанная фирмой NetCracker Technology. По своим функциональным возможностям она сравнима с описанными выше системами более высокого класса. Но в отличии от них данная система является менее дорогой и относительно простой в использовании.
Система моделирования NetCracker Professional позволяет осуществлять многофункциональное моделирование сетей. С ее помощью могут быть решены такие задачи, как определение производительности сети при задании топологии и рабочей нагрузки, анализ зависимости пропускной способности при изменении рабочей нагрузки на сеть, анализ зависимости пропускной способности сети при изменении ее топологии, подбор параметров протоколов сети для обеспечения максимальной пропускной способности сети при заданных топологии и рабочей нагрузке, определение оптимальной топологии и отношения: пропускная способность/стоимость проектируемой сети.
В NetCracker Professional имеется библиотека устройств, которая предоставляет пользователю широчайший выбор не только типов устройств от простых персональных компьютеров до многофункциональных маршрутизаторов и средств спутниковой связи, но и множество конкретных моделей этих устройств от различных фирм-производителей. Библиотека элементов предоставляет возможность моделировать стандартные сетевые устройства, создавать модели устройств, удовлетворяющих требованиям пользователя, регулировать уровень параметризации элементов библиотеки, делать модели сопоставимыми с реальными объектами, учитывать количество классов моделируемых объектов.
Графический интерфейс пользователя представляет собой модуль для взаимодействия с подсистемами задания рабочей нагрузки и топологии сети. Он обеспечивает максимальное удобство для пользователя посредством использования механизма drag-and-drop, наглядности иконок, обозначающих элементы сети, возможности сворачивать отдельные фрагменты сети. Имеется также возможность анимации процесса моделирования сети. Можно приостанавливать или прерывать работу модели, прокрутить назад анимационную картинку и запустить повторно. Среда прогона используется для сбора данных о функционировании модели, что при необходимости отображается на экране в виде диаграммы загруженности либо в процентном соотношении. Подсистема анализа результатов моделирования обрабатывает данные, собранные при прогоне модели, вычисляет характеристики производительности и представляет результаты в удобной для пользователя форме. В значительной степени возможность этой подсистемы зависит от тех данных, которые собирает среда прогона. Определяющими для этой части системы является количество и тип характеристик, собираемых в результате работы модели.
Однако рассмотренные выше системы имеют и некоторые общие недостатки. В частности, ни одна из программ не способна сообщить, что сеть чересчур сложна, или предложить, каким образом надо ее усовершенствовать для повышения производительности. Они лишь указывают, будет ли работоспособным предлагаемый проект и в каком месте можно столкнуться с проблемами. Администратору приходится самому выбирать лучший способ решения проблем. Мало того, ни один из продуктов нельзя рассматривать как полностью готовое к употреблению средство, способное в точности смоделировать работу существующей или даже вновь спроектированной сети. Необходимо на протяжении еще довольно долгого времени непрерывно подстраивать модель.
3. ДОКУМЕНТИРОВАНИЕ СЕТИ
Моделирование сети позволяет решать целый комплекс задач. С одной стороны - это анализ уже существующей компьютерной сети с возможностью оценки эффективности ее работы, выявлению "узких" мест. После этого, в зависимости от целей моделирования, происходит выработка рекомендаций по улучшению сетевой инфраструктуры, подготовка сети к возможному расширению или модернизации. В случае создания новой сети главным образом оценивается ожидаемый объем сетевого трафика с учетом времени работы каждого сотрудника и тех приложений, с которыми каждый из них будет работать. На основании полученных данных разрабатывается и моделируется детальный проект сети. В данной статье рассматривается особенности моделирования и оценки работы существующих компьютерных сетей с целью повышения их эффективности и обеспечения динамичного развития, что на сегодня является, в частности, одной из актуальнейших задач в рамках стремительного развития сетевых технологий.
Одним из первых этапов процесса моделирования существующей сети является документирование ее архитектуры. В общем случае, под документированием нужно понимать сбор информации о моделируемой сети. Этот начальный этап является очень важным звеном во всем процессе моделирования сетевой инфраструктуры, так как в результате несоответствия данных, полученных при документировании сети, с действительными данными может получиться неправильная или искаженная модель сети.
С чего же начать документирование сети? Прежде всего, необходимо выяснить масштабы сети, то есть уровень ее разветвления. Под уровнем разветвления сети понимают количество условных подсетей, на которые гипотетически может быть разделена исследуемая сеть, сложившаяся вследствие объективных причин. Примером могут служить насколько корпусов университета или офисов корпорации.
При документировании обобщенной схемы сети необходимо определить тип физического соединения между подсетями (проводное или беспроводное), а также выяснить, какое из активного (концентратор, коммутатор, маршрутизатор и т. д.) и серверного оборудования используются в каждой подсети или вне ее при передаче информации между подсетями. Необходимо также знать спецификацию сети (Ethernet, Token ring, FDDI, ATM и др.). Далее можно переходить к детальному документированию каждой подсети.
На первом этапе составляется обобщенная структура подсети, которая включает в себя сбор информации о расположения рабочих станций, активного и серверного оборудования, о стандартах и спецификации всех физических соединений (Coaxial, Twisted pair и др.) между вышеперечисленными устройствами.
На втором этапе осуществляется детальный процесс документирования всех устройств, составляющих подсеть. Каждое из устройств обладает рядом характеристик. Их изменение может повлиять на эффективность работы устройства, что может сказаться на работе подсети в целом. Для каждого типа оборудования существуют свои характеристики. Так, например, для рабочих станций и серверного оборудования наиболее существенными являются следующие характеристики:
· тактовая частота работы процессора;
· тип процессора;
· разрядность процессора;
· количество процессоров (для серверного оборудования);
· тип поддерживаемых интерфейсов;
· тактовая частота работы системной шины;
· реальный и максимально возможный объем оперативной памяти;
· объем жесткого диска;
· количество жестких дисков (для серверного оборудования);
· тип операционной системы;
· тип сетевого адаптера;
· тип сетевого протокола (TCP/IP, IPX/SPX, SNA и др.);
· тип интерфейса, с которым сопрягается сетевой адаптер и др.
Для каждого участка сети необходимо указывать максимально возможную пропускную способность активного оборудования и физических соединений между узлами сети, а также приблизительное расстояние между узлами сети. Для активного оборудования, в зависимости от типа и назначения необходимо указывать:
· количество портов;
· тип спецификации и стандарта, для работы с которыми рассчитан каждый порт;
· скорость фильтрации пакетов;
· скорость отправки пакетов;
· время ожидания при работе с пакетами;
· тип поддерживаемых протоколов маршрутизации;
· тип поддерживаемых сетевых протоколов и др.
Одной из важных задач при документировании сети является выяснение максимальной пропускной способности каждой рабочей станции и серверного оборудования. Эта информация в дальнейшем, при совмещении ее с особенностями обмена данными между компьютерами и исследованием трафика, будет необходима для полноценного моделирования сетевой инфраструктуры.
4. ОЦЕНКА СЕТЕВОГО ТРАФИКА
Наиболее важным и сложным звеном в процессе моделирования компьютерной сети является создание максимально приближенной к реальности модели сетевого трафика. В отличие от документирования параметров сети данная задача более сложная, трудоемкая и неоднозначная в своем решении. Она требует систематического подхода, но в то же время не может дать однозначного и окончательного ответа на поставленные вопросы. Вследствие этого рекомендации по изменению структуры сети для увеличения продуктивности ее работы далеко не всегда являются абсолютно верными и единственно возможными. В данном контексте анализ существующей сетевой инфраструктуры и рекомендации по созданию новой компьютерной сети имеют некоторые особенности и отличия. Так, например, при создании новой сети, в зависимости от специфики сетевого трафика, можно варьировать различным сетевым оборудованием для того, чтобы добиться наилучшего соотношения "цена - качество". Очень часто, при создании новой сети, у разработчиков возникает желание спроектировать "идеальную" сеть. Это слово подразумевает под собой полную загруженность сети при отсутствии "узких мест" и при том, что различные потоки сетевого трафика не будут перекрывать друг друга, вследствие чего все активное, серверное и пассивное оборудование будет работать на пределе своих возможностей (с максимальной скоростью). К сожалению, построение такой сети обходится очень дорого и далеко не всегда такая компьютерная сеть оправдывает вложенные средства. Поэтому разработчики стараются найти золотую середину, а значит создать такую сетевую модель, которая будет "идеальной" с позиции "цена - качество" относительно заказчика.
Подготовительный этап перед моделированием сетевого трафика, как и документирование сети, начинается со сбора информации. Для начала необходимо понять специфику работы компании или университета, в котором находится исследуемая сеть. В процессе работы пользователи обращаются к различным ресурсам сети, используя при этом различные средства. Чтобы как можно подробнее отследить сетевой трафик и увидеть полную его структуру, необходимо разделить информационные потоки на несколько категорий.
В результате стремительного роста глобальной сети Internet, ее ресурсы становятся все более доступными для массового использования. При наличии высокоскоростного канала и относительно небольшом количестве пользователей, имеющих доступ к Internet, можно добиться хорошей скорости работы для каждого пользователя. Но в наших сегодняшних условиях это возможно далеко не везде и не всегда. Зачастую, особенно в университетах, количество потенциальных пользователей во много раз превышает то число, которое реально может обслужить Internet-канал. И, если предположить, что одновременно доступ к ресурсам глобальной сети хочет получить хотя бы половина потенциальных пользователей, то можно с уверенностью констатировать безуспешность данных попыток. А ведь нельзя забывать и о том, что компания или университет, имея доступ в Internet, может иметь свою Web-страницу, FTP-сервер или обеспечивать различного рода клиент-серверные услуги.
Доступ к каждому из них со стороны пользователей корпоративной сети необходимо отличать и исследовать загруженность каждого ресурса отдельно, даже если передача данных идет по одним и тем же каналам. А если предположить, что пользователями ресурсов Web-страницы или FTP-сервера могут стать удаленные пользователи из любой точки земного шара, то задача моделирования сетевого трафика усложняется в несколько раз и требует разработки специальной программы по обслуживанию пользователей. Но в данный момент остановимся именно на корпоративном использовании сетевых ресурсов. Следующей разновидностью трафика является E-mail. На сегодняшний день подавляющее большинство людей хотя бы раз пользовались этой услугой. Использование электронной почты в любом ее проявлении является неотъемлемой частью любой компании или университета. На первый взгляд может показаться, что данный ресурс несущественно влияет на загруженность сети, но при большом количестве пользователей и частом использовании данной услуги она определенным образом может изменить значение общего информационного потока.
На сегодняшний день широкое распространение в большинстве компаний и ведомственных структур получило использование различного рода баз данных, в частности, можно привести пример SQL-сервера. В зависимости от местонахождения, типа и способа доступа к базе данных различается объем информационного потока, запрашиваемого пользователями. Гораздо чаще пока используются файловые серверы. Обычно на файловых серверах находится информация, необходимая для работы большинства пользователей, к которой идет постоянное обращение. Хоть файловые серверы выполняют функции, в чем-то аналогичные функциям баз данных, их загруженность зачастую гораздо больше. Чаще всего именно данный тип трафика является одним из самых значительных по объему в общем информационном потоке.
Кроме всех вышеперечисленных типов передачи информационного потока существует еще один - это непосредственная связь между рабочими станциями. Особенность данного типа передачи информации заключается в непредсказуемости его объемов. Если количество обращений к файловому серверу можно более-менее точно прогнозировать, то в случае с передачей информации между пользователями дело обстоит гораздо сложнее. Объем данных, передаваемых с помощью данного способа обмена, может быть как несоизмеримо мал по сравнению с остальным потоком данных, так и превышать суммарный трафик при использовании остальных способов передачи данных по сети.
Для правильной реализации процесса моделирования компьютерной сети, помимо документирования параметров оборудования и физических соединений, необходимо документировать трафик. Эта работа является более трудоемкой и неоднозначной. Для ее проведения необходимо в течение определенного спецификой работы компании или университета времени, зачастую длительного, вести мониторинг сетевого трафика. Во-первых, сложность заключается в необходимости отслеживания и документирования каждого вида трафика отдельно друг от друга, иначе при проектировании может получиться искаженная модель. Вследствие этого возникает вопрос: с помощью каких средств проводить данный мониторинг?
В различных операционных системах и для разных типов трафика процесс мониторинга осуществляется по-разному. Так, например, проще всего осуществить мониторинг использования ресурсов Internet (доступ к Web-страницам, FTP-серверам, электронной почте), но только в том случае, когда доступ к этим ресурсам осуществляется через сервер со специализированной операционной системой (в частности, примером могут служить UNIX-подобные системы). Более сложным процессом является осуществление мониторинга объема данных, передаваемых с файловых серверов и серверов баз данных, так как данный тип обмена информацией менее предсказуем и может варьироваться в зависимости от ситуации.
Самым сложным является моделирование межпользовательского трафика в виду полной его непредсказуемости. В данном случае могут возникнуть проблемы с мониторингом, так как сбор точных данных необходимо производить с большого количества компьютеров, что осложняется наличием операционных систем (типа Windows), неспособных в нужной степени документировать и разделять входящий и исходящий потоки данных. В данном случае необходимо использовать специализированные программные продукты, которые должны автономно загружаться при старте пользовательского компьютера, а при завершении генерировать отчет об объемах, времени и направлении передачи данных.
Еще одним немаловажным фактором является информация о том, с помощью каких ресурсов и протоколов каждая из рабочих станций может обмениваться данными. Практически, любой компьютер, находящийся в сети, может "видеть" любой другой компьютер из этой же сети. Но в реальной практике доступ к другим компьютерам, в виде обмена данными, осуществляется дифференцированно. При моделировании необходимо обязательно учитывать: между какими рабочими станциями возможен обмен данными, а также, какие рабочие станции могут обращаться к серверному оборудованию.
5. ОЦЕНКА ПРОИЗВОДИТЕЛЬНОСТИ КОМПЬЮТЕРНОЙ СЕТИ
При оценке производительности сетевой инфраструктуры, в первую очередь, следует различать реальную загруженность сети, основываясь на данных мониторинга трафика, и пиковую загруженность. Под пиковой загруженностью в данном случае следует понимать ситуацию, когда все рабочие станции, используя любые доступные виды трафика, обменивается данными со всеми компьютерами и серверным оборудованием. Если при разработке проекта модернизации сети на основании данных, полученных в результате моделирования, отталкиваться от пиковой загруженности, то величина необходимых материальных средств для модернизации будет непомерно велика. С полной уверенностью можно утверждать, что данная ситуация практически никогда не случиться, но промоделировав ее можно выявить потенциально узкие места при разработке проекта сетевой инфраструктуры.
Наиболее подходящей в данном случае является модель реальной загруженности сети. В этой модели можно варьировать многими параметрами сетевого обмена данными, что приводит к возникновению нескольких вариантов решения поставленной задачи. При оценке желательно промоделировать работу сети в динамике, то есть оценить ее загруженность в зависимости от текущего времени или дня. Это поможет выработать более эффективные решения по оптимизации загруженности сети.
Основные
результаты работы
Результатом научной работы является построение модели компьютерной сети ДонНТУ и предварительная оценка эффективности ее работы.
Библиографические ссылки
- Аппаратные средства локальных сетей. Энциклопедия
Михаил Гук
Издано: 2000, СПб, Издательство "Питер", 576 стр.
- Практика построения компьютерных сетей. Для профессионалов.
Максим Кульгин
Издано: 2001, СПб., "Питер", 320 стр.
- Компьютерные сети. Принципы, технологии, протоколы
Олифер В.Г. Олифер Н.А.
Издательство: Питер, 70х100/16, 672 стр.